AWS Parallel Computing Service とは - AWS PCS

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS Parallel Computing Service とは

AWS Parallel Computing Service (AWS PCS) は、ハイパフォーマンスコンピューティング (HPC) ワークロードの実行とスケーリングを容易にし、Slurm AWS を使用して で科学モデルとエンジニアリングモデルを構築できるマネージドサービスです。を使用して AWS PCS、クラス最高のコンピューティング、ストレージ、ネットワーク、視覚化を統合する AWS コンピューティングクラスターを構築します。シミュレーションを実行するか、科学モデルとエンジニアリングモデルを構築します。組み込みの管理機能とオブザーバビリティ機能を使用して、クラスターオペレーションを合理化および簡素化します。使い慣れた環境でアプリケーションやジョブを実行できるようにすることで、ユーザーが研究とイノベーションに集中できるようにします。

主要なコンセプト

の AWS PCSクラスターには 1 つ以上のキューがあり、少なくとも 1 つのコンピューティングノードグループに関連付けられています。ジョブはキューに送信され、コンピューティングノードグループで定義されたEC2インスタンスで実行されます。これらの基盤を使用して、高度なHPCアーキテクチャを実装できます。

クラスター

クラスターは、リソースを管理し、ワークロードを実行するためのリソースです。クラスターは、コンピューティング、ネットワーク、ストレージ、アイデンティティ、ジョブスケジューラ設定のアセンブリを定義する AWS PCSリソースです。クラスターを作成するには、使用するジョブスケジューラ (Slurm の現在)、使用するスケジューラ設定、クラスターを管理するサービスコントローラー、VPCクラスターリソースを起動する場所を指定します。スケジューラはジョブを受け入れてスケジュールし、それらのジョブを処理するコンピューティングノード (EC2 インスタンス) も起動します。

コンピューティングノードグループ

コンピューティングノードグループは、 が AWS PCSジョブを実行したり、クラスターへのインタラクティブなアクセスを提供したりするコンピューティングノードのコレクションです。コンピューティングノードグループを定義するときは、Amazon EC2インスタンスタイプ、最小インスタンス数と最大インスタンス数、ターゲットVPCサブネット、Amazon マシンイメージ (AMI)、購入オプション、カスタム起動設定などの一般的な特性を指定します。 AWS PCS は、これらの設定を使用して、コンピューティングノードグループ内のコンピューティングノードを効率的に起動、管理、および終了します。

キュー

特定のクラスターでジョブを実行する場合は、特定のキュー (パーティション とも呼ばれます) に送信します。ジョブは、 がコンピューティングノードグループで実行するように AWS PCSスケジュールするまでキューに残ります。1 つ以上のコンピューティングノードグループを各キューに関連付けます。キューは、ジョブスケジューラが提供するさまざまなスケジューリングポリシーを使用して、基盤となるコンピューティングノードグループリソースでジョブをスケジュールして実行するために必要です。ユーザーは、コンピューティングノードまたはコンピューティングノードグループに直接ジョブを送信しません。

システム管理者

システム管理者は、クラスターをデプロイ、維持、運用します。、 AWS Management Console、 AWS PCSAPIおよび AWS PCSを介して にアクセスできます AWS SDK。SSH または を介して特定のクラスターにアクセスできます。このクラスターでは AWS Systems Manager、管理タスクの実行、ジョブの実行、データの管理、その他のシェルベースのアクティビティを実行できます。詳細については、AWS Systems Manager ドキュメント を参照してください。

エンドユーザー

エンドユーザーには、クラスターをデプロイまたは運用する day-to-day 責任はありません。ターミナルインターフェイス ( などSSH) を使用して、クラスターリソースへのアクセス、ジョブの実行、データの管理、その他のシェルベースのアクティビティを実行します。