翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
自動スケーリングを使用するエンドポイントを更新する
エンドポイントを更新すると、Application Auto Scaling は、そのエンドポイント上のモデルが自動スケーリングのターゲットであるかどうかをチェックします。更新によって、自動スケーリングのターゲットであるモデルのインスタンスタイプが変更される場合、更新は失敗します。
では AWS Management Console、モデルを更新する前にモデルを自動スケーリングから登録解除する必要があるという警告が表示されます。を呼び出してエンドポイントを更新しようとするとUpdateEndpointAPI、呼び出しは失敗します。エンドポイントを更新する前に、エンドポイント用に設定されたスケーリングポリシーを削除し、DeregisterScalableTargetApplication Auto Scaling APIアクションを呼び出してバリアントをスケーラブルターゲットとして登録解除します。エンドポイントを更新したら、更新されたバリアントをスケーラブルターゲットとして登録し、スケーリングポリシーをアタッチできます。
1 つ例外があります。自動スケーリング用に設定されたバリアントのモデルを変更すると、Amazon SageMaker 自動スケーリングによって更新が許可されます。これは、モデルを変更しても、通常、スケーリング動作を変更するのに十分なパフォーマンスには影響しないためです。自動スケーリング用に設定されたバリアントのモデルを更新する場合は、モデルの変更がパフォーマンスとスケーリング動作に大きく影響しないことを確認してください。
自動スケーリングが適用された SageMaker エンドポイントを更新するときは、次の手順を実行します。
自動スケーリングが適用されたエンドポイントを更新するには
-
を呼び出して、エンドポイントをスケーラブルターゲットとして登録解除しますDeregisterScalableTarget。
-
更新オペレーションの進行中 (または前のステップで自動スケーリングをオフにした場合) は自動スケーリングがブロックされるため、更新中にエンドポイントのインスタンス数を増やすという追加の予防策を取ることをお勧めします。これを行うには、 を呼び出して、エンドポイントでホストされている本番稼働用バリアントのインスタンス数を更新しますUpdateEndpointWeightsAndCapacities。
-
レスポンスの
EndpointStatus
フィールドの値が になるまで DescribeEndpoint、 を繰り返し呼び出しますInService
。 -
DescribeEndpointConfig を呼び出して、現在のエンドポイント設定の値を取得します。
-
を呼び出して、新しいエンドポイント設定を作成します CreateEndpointConfig。既存のインスタンスの数または重みを維持する本番稼働用バリアントでは、前のステップ DescribeEndpointConfigで の呼び出しからのレスポンスと同じバリアント名を使用します。他のすべての値については、前のステップ DescribeEndpointConfigで を呼び出すときに取得した値をレスポンスとして使用します。
-
UpdateEndpoint を呼び出してエンドポイントを更新します。前のステップで作成したエンドポイント設定を
EndpointConfig
フィールドとして指定します。インスタンス数や重みなどのバリアントプロパティを保持する場合、RetainAllVariantProperties
パラメータの値をTrue
に設定します。これにより、同じ名前の本番稼働用バリアントが、新しいEndpointConfig
のInitialInstanceCount
フィールドの値に関係なく、DescribeEndpoint
の呼び出しの応答から取られた最新のDesiredInstanceCount
で更新されるように指定されます。 -
(オプション) RegisterScalableTargetと を呼び出して自動スケーリングを再アクティブ化しますPutScalingPolicy。
注記
ステップ 1 と 7 は、次の変更でエンドポイントを更新する場合のみ必要です。
-
自動スケーリングが設定されている本番稼働用バリアントのインスタンスタイプを変更する
-
自動スケーリングが設定されている本番稼働用バリアントの削除。