翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
自動ノード復旧
クラスターの作成時または更新時に、クラスター管理者ユーザーは (推奨) からNone
クラスターレベルでノード Automatic
(インスタンス) 復旧オプションを選択できます。に設定するとAutomatic
、障害のあるノードは自動的に SageMaker HyperPod 再起動または置き換えられます。
重要
Automatic
オプションを設定することをお勧めします。
自動ノード復旧は、ヘルスモニタリングエージェント、基本的なヘルスチェック、ディープヘルスチェックで問題が見つかったときに実行されます。に設定するとNone
、障害が検出されるとヘルスモニタリングエージェントはインスタンスにラベルを付けますが、影響を受けるノードで修復または復旧アクションを自動的に開始しません。このオプションは推奨されません。