翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
マルチコンテナエンドポイントをトラブルシューティングする
以下のセクションは、マルチコンテナエンドポイントで発生したエラーのトラブルシューティングに役立ちます。
Ping ヘルスチェックエラー
複数のコンテナがある場合、エンドポイント作成時にはエンドポイントメモリと CPU の負荷が高くなります。具体的には、MemoryUtilization
と CPUUtilization
のメトリクスがコンテナを 1 つ持つエンドポイントよりも高くなります。使用負荷はコンテナの数に比例するためです。このため、十分なメモリと CPU を持つインスタンスタイプを選択して、インスタンスにすべてのモデルをロードするのに十分なメモリが存在するようにすることをお勧めします (推論パイプラインのデプロイにもこの同じガイダンスが適用されます)。そうしない場合、XXX did not pass the
ping health check
などのエラーが発生してエンドポイントの作成が失敗する可能性があります。
accept-bind-to-port=true Docker ラベルがない
マルチコンテナエンドポイントのコンテナは、(8080 ポートではなく) SAGEMAKER_BIND_TO_PORT
環境変数で指定されたポートでリッスンします。コンテナがマルチコンテナエンドポイントで実行されると、SageMaker AI は自動的にこの環境変数をコンテナに提供します。この環境変数が存在しない場合、コンテナではデフォルトでポート 8080 が使用されます。コンテナがこの要件に準拠していることを示すには、次のコマンドを使用して Dockerfile にラベルを追加します。
LABEL com.amazonaws.sagemaker.capabilities.accept-bind-to-port=true
追加しない場合は、Your Ecr Image XXX does
not contain required
com.amazonaws.sagemaker.capabilities.accept-bind-to-port=true Docker
label(s).
などのエラーメッセージが表示されます。
コンテナが 2 番目のポートをリッスンする必要がある場合は、SAGEMAKER_SAFE_PORT_RANGE
環境変数で指定された範囲内のポートを選択してください。「XXXX
-YYYY
」の形式の包含範囲として値を指定します。ここで、XXXX と YYYY は複数桁の整数です。マルチコンテナエンドポイントでコンテナを実行すると、SageMaker AI はこの値を自動的に提供します。