スケーリングポリシーを編集する - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

スケーリングポリシーを編集する

スケーリングポリシーを作成したら、名前以外のすべての設定を編集できます。

スケーリングポリシーを編集する (コンソール)

でターゲットを追跡するスケーリングポリシーを編集するには AWS Management Console、以前と同じ手順を使用しますコンソールを使用してモデルの自動スケーリングを設定する

スケーリングポリシー (AWS CLI またはApplication Auto Scaling API) を編集する

AWS CLI またはアプリケーションの Auto Scaling API を使用して、新しいスケーリングポリシーを作成するのと同じ方法でスケーリングポリシーを編集できます。詳細については、「スケーリングポリシーを適用する」を参照してください。

スケーリングポリシーを一時的に無効にする

auto Scaling を設定したあと、スケーリングポリシー (動的スケーリング) による干渉を受けずに問題を調査する必要がある場合、次のオプションを使用できます。

  • register-scalable-targetCLI コマンドまたは RegisterScalableTargetAPI アクションを呼び出し、との両方にブール値を指定して、スケーリングアクティビティを一時的に中断してから再開します。DynamicScalingInSuspended DynamicScalingOutSuspended

    次の例はmy-variant、エンドポイントで実行されているというバリアントのスケーリングポリシーを一時停止する方法を示しています。my-endpoint

    aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --suspended-state '{"DynamicScalingInSuspended":true,"DynamicScalingOutSuspended":true}'
  • ポリシーのスケールイン部分を無効にして、特定のターゲットを追跡するスケーリングポリシーがバリアントをスケーリングしないようにします。この方法では、スケーリングポリシーによってインスタンスが削除されるのを防ぎながら、必要に応じてインスタンスを作成できるようになります。

    put-scaling-policyCLI コマンドまたは PutScalingPolicyAPI アクションを使用してポリシーを編集し、にブール値を指定して、スケールインアクティビティを一時的に無効にしてから有効にします。DisableScaleIn

    以下は、スケールアウトはするがスケールインはしないスケーリングポリシーのターゲット追跡設定の例です。

    { "TargetValue": 70.0, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" }, "DisableScaleIn": true }