AWS Parallel Computing Service とは - AWS PCS

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS Parallel Computing Service とは

AWS Parallel Computing Service (AWS PCS) は、高性能コンピューティング (HPC) ワークロードの実行とスケーリングを容易にし、Slurm AWS を使用して科学的モデルとエンジニアリングモデルを構築できるマネージドサービスです。を使用して AWS PCS、クラス最高のコンピューティング、ストレージ、ネットワーク、視覚化を統合する AWS コンピューティングクラスターを構築します。シミュレーションを実行するか、科学モデルとエンジニアリングモデルを構築します。組み込みの管理機能とオブザーバビリティ機能を使用して、クラスターオペレーションを合理化し、簡素化します。使い慣れた環境でアプリケーションやジョブを実行できるようにすることで、ユーザーが研究とイノベーションに集中できるようにします。

主要なコンセプト

の AWS PCSクラスターには 1 つ以上のキューがあり、少なくとも 1 つのコンピューティングノードグループに関連付けられています。ジョブはキューに送信され、コンピューティングノードグループによって定義されたEC2インスタンスで実行されます。これらの基盤を使用して、高度なHPCアーキテクチャを実装できます。

クラスター

クラスターは、リソースを管理し、ワークロードを実行するためのリソースです。クラスターは、コンピューティング、ネットワーク、ストレージ、アイデンティティ、ジョブスケジューラ設定のアセンブリを定義する AWS PCSリソースです。クラスターを作成するには、使用するジョブスケジューラ (現在 Slurm)、使用するスケジューラ設定、クラスターを管理するサービスコントローラー、VPCクラスターリソースを起動する場所を指定します。スケジューラはジョブを受け入れてスケジュールし、それらのジョブを処理するコンピューティングノード (EC2 インスタンス) を起動します。

コンピューティングノードグループ

コンピューティングノードグループは、 を使用して AWS PCSジョブを実行したり、クラスターへのインタラクティブなアクセスを提供したりするコンピューティングノードのコレクションです。コンピューティングノードグループを定義するときは、Amazon EC2インスタンスタイプ、最小インスタンス数と最大インスタンス数、ターゲットVPCサブネット、Amazon マシンイメージ (AMI)、購入オプション、カスタム起動設定などの一般的な特性を指定します。 AWS PCS は、これらの設定を使用して、コンピューティングノードグループ内のコンピューティングノードを効率的に起動、管理、および終了します。

キュー

特定のクラスターでジョブを実行する場合は、特定のキュー (パーティション とも呼ばれます) に送信します。ジョブは、 がコンピューティングノードグループで実行するように AWS PCSスケジュールするまでキューに残ります。1 つ以上のコンピューティングノードグループを各キューに関連付けます。ジョブスケジューラが提供するさまざまなスケジューリングポリシーを使用して、基盤となるコンピューティングノードグループリソースでジョブをスケジュールして実行するには、キューが必要です。ユーザーは、コンピューティングノードまたはコンピューティングノードグループに直接ジョブを送信しません。

システム管理者

システム管理者は、クラスターをデプロイ、維持、運用します。、 AWS Management Console、 AWS PCSAPIおよび AWS PCSからアクセスできます AWS SDK。SSH または を通じて特定のクラスターにアクセスできます。このクラスターでは AWS Systems Manager、管理タスクの実行、ジョブの実行、データの管理、その他のシェルベースのアクティビティを実行できます。詳細については、AWS Systems Manager ドキュメント を参照してください。

エンドユーザー

エンドユーザーには、 day-to-dayクラスターをデプロイまたは運用する責任はありません。ターミナルインターフェイス ( などSSH) を使用して、クラスターリソースへのアクセス、ジョブの実行、データの管理、その他のシェルベースのアクティビティを実行します。