翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
SageMaker HyperPod プラットフォームソフトウェアを更新する
SageMaker HyperPod クラスターを作成すると、SageMaker HyperPod は Amazon EKS クラスターの Kubernetes バージョンに対応する Amazon マシンイメージ (AMI) を選択します。
update-cluster-software を実行して、SageMaker HyperPod サービスが提供するソフトウェアとセキュリティパッチを使用して既存のクラスターを更新します。--cluster-name
では、更新するクラスターの名前または ARN を指定します。
重要
-
この API が呼び出されると、SageMaker HyperPod はノードで実行されているジョブ (ポッド) をドレインまたは再配布しません。この API を呼び出す前に、ノードで実行されているジョブがあるかどうかを確認してください。
-
パッチ適用プロセスでは、ルートボリュームが更新された AMI に置き換えられます。つまり、インスタンスのルートボリュームに保存されていた以前のデータは失われます。必ず、インスタンスルートボリュームから Amazon S3 または Amazon FSx for Lustre にデータをバックアップしてください。
-
パッチ適用の進行中、すべてのクラスターノードでダウンタイムが発生します (ノードは
<NotReady>
の出力にkubectl get node
として表示されます)。パッチ適用の前にすべてのワークロードを終了し、パッチ完了後に再開することをお勧めします。セキュリティパッチが失敗した場合、「クラスターを記述する」の指示に従って
DescribeCluster
API を実行することにより失敗メッセージを取得できます。
aws sagemaker update-cluster-software --cluster-name
your-hyperpod-cluster
UpdateClusterSoftware
API を呼び出すと、SageMaker HyperPod は Amazon EKS クラスターの Kubernetes バージョンに基づいて最新の SageMaker HyperPod DLAMI を選択することにより、ノードの Kubernetes バージョンを更新します。次に、クラスターの作成または更新時に指定した Amazon S3 バケットでライフサイクルスクリプトを実行します。
kubectl describe
node
コマンドを実行して、ノードの kubelet バージョンを確認できます。
SageMaker HyperPod クラスターノードの Kubernetes バージョンは、Amazon EKS クラスターバージョンを更新しても自動更新されません。Amazon EKS クラスターの Kubernetes バージョンを更新したら、UpdateClusterSoftware
API を使用して SageMaker HyperPod クラスターノードを同じ Kubernetes バージョンに更新する必要があります。
Amazon EKS ノードを更新した後に SageMaker HyperPod クラスターを更新し、Amazon EKS クラスターバージョンと SageMaker HyperPod クラスターノードバージョンの間に複数のバージョン差が生じないようにすることをお勧めします。
SageMaker HyperPod サービスチームは、セキュリティを強化し、ユーザーエクスペリエンスを向上させるため、新しい SageMaker HyperPod DLAMI を定期的にロールアウトします。常に最新の SageMaker HyperPod DLAMI に更新することをお勧めします。セキュリティパッチ適用に関する今後の SageMaker HyperPod DLAMI の更新については、「Amazon SageMaker HyperPod リリースノート」の情報を今後も確認してください。
注記
この API はプログラムでのみ実行できます。パッチ適用機能は、SageMaker HyperPod コンソール UI には実装されません。