自動ノード復旧 - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

自動ノード復旧

クラスターの作成時または更新時に、クラスター管理者ユーザーは (推奨) からNoneクラスターレベルでノード Automatic (インスタンス) 復旧オプションを選択できます。に設定するとAutomatic、障害のあるノードは自動的に SageMaker HyperPod 再起動または置き換えられます。

重要

Automatic オプションを設定することをお勧めします。

自動ノード復旧は、ヘルスモニタリングエージェント、基本的なヘルスチェック、ディープヘルスチェックで問題が見つかったときに実行されます。に設定するとNone、障害が検出されるとヘルスモニタリングエージェントはインスタンスにラベルを付けますが、影響を受けるノードで修復または復旧アクションを自動的に開始しません。このオプションは推奨されません。