スケーリングポリシーを一時的に無効にする - Amazon SageMaker

スケーリングポリシーを一時的に無効にする

自動スケーリングを設定した後、スケーリングポリシー (動的スケーリング) による干渉を受けずに問題を調査する必要がある場合は、次のオプションがあります。

  • CLI コマンド register-scalable-target または API アクション RegisterScalableTarget を呼び出して DynamicScalingInSuspendedDynamicScalingOutSuspended の両方にブール値を指定することで、スケーリングアクティビティを一時的に停止してから再開します。

    次の例は、my-endpoint エンドポイントで実行されている my-variant という名前のバリアントのスケーリングポリシーを一時停止する方法を示しています。

    aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --suspended-state '{"DynamicScalingInSuspended":true,"DynamicScalingOutSuspended":true}'
  • ポリシーのスケールイン部分を無効にして、特定のターゲット追跡スケーリングポリシーでバリアントのスケールインが行われないようにします。この方法を使うと、スケーリングポリシーによってインスタンスが削除されることがなくなる一方で、インスタンスの作成は必要に応じて行われます。

    CLI コマンド put-scaling-policy または API アクション PutScalingPolicy を使って DisableScaleIn のブール値を指定してポリシーを編集することで、スケールインアクティビティを一時的に無効にしてから有効にします。

    以下は、スケールアウトするがスケールインしないスケーリングポリシーのターゲット追跡設定の例です。

    { "TargetValue": 70.0, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" }, "DisableScaleIn": true }