本番環境でモデルを更新する - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

本番環境でモデルを更新する

デプロイガードレールは、本番環境で機械学習モデルを更新するための Amazon SageMaker Inference の一連のモデルデプロイオプションです。このフルマネージドデプロイオプションを使うと、本番環境の現在のモデルから新しいモデルへの切り替えをコントロールできます。Canary や Linear など、ブルー/グリーンデプロイのトラフィックシフトモードにより、更新の過程で現在のモデルから新しいモデルへのトラフィックシフトプロセスを細かくコントロールできます。また、自動ロールバックなどの組み込みセーフガードもあり、本番環境に大きな影響を与える前に、問題を早期に検出し、自動的に是正措置を講じることができます。

デプロイガードレールには次の利点があります。

  • 本番環境を更新する際のデプロイの安全性。本番環境に対して後退的更新を行うと、計画外のダウンタイムが発生し、モデルのレイテンシーの増加や高いエラー率など、ビジネスに影響を与える可能性があります。デプロイガードレールは、ベストプラクティスと組み込みオペレーションの安全なガードレールを提供することで、これらのリスクを軽減するのに役立ちます。

  • 完全マネージド型デプロイ。 SageMaker は、これらのデプロイの設定とオーケストレーションを処理し、エンドポイント更新メカニズムと統合します。お客様がオーケストレーション、モニタリング、ロールバックのメカニズムを構築、維持する必要はありません。 SageMaker を活用してこれらのデプロイをセットアップおよびオーケストレーションし、アプリケーションに ML を活用することに専念できます。

  • 可視性。API DescribeEndpointまたは Amazon CloudWatch Events (サポートされているエンドポイント の場合) を使用して、デプロイの進行状況を追跡できます。のイベントの詳細については SageMaker、「」の「エンドポイントデプロイの状態変更」セクションを参照してくださいAmazon SageMaker によるアマゾンの自動化 EventBridge。エンドポイントがExclusionsページのいずれかの機能を使用している場合、 CloudWatch イベントを使用できないことに注意してください。

注記

デプロイガードレールは 非同期推論 エンドポイントタイプと リアルタイム推論 エンドポイントタイプにのみ適用されます。

開始方法

実稼働環境でのモデルの更新には、Blue/Green デプロイとローリングデプロイの 2 種類のデプロイがサポートされています。

  • ブルー/グリーンデプロイ: 更新により、古いフリート (青のフリート) から新しいフリート (緑のフリート) にトラフィックをシフトさせることができます。Blue/Green デプロイは複数のトラフィックシフトモードを提供します。トラフィックシフトモードは、 がエンドポイントトラフィックを更新を含む新しいフリートに SageMaker ルーティングする方法を指定する設定です。次のトラフィックシフトモードでは、エンドポイントの更新プロセスをさまざまなレベルでコントロールできます。

    • All At Once トラフィックシフト は、すべてのエンドポイントトラフィックを青のフリートから緑のフリートにシフトします。トラフィックが緑のフリートにシフトすると、事前に指定した Amazon CloudWatch アラームが緑のフリートを一定の時間 (ベーキング期間 ) モニタリングし始めます。ベーキング期間中にアラームが作動しない場合、 は青のフリートを SageMaker 終了します。

    • Canary トラフィックシフト では、トラフィックのごく一部 (canary) を緑のフリートにシフトして、ベーキング期間中それをモニタリングできます。Canary が緑のフリートで成功すると、 は青のフリートを終了する前に残りのトラフィックを青のフリートから緑のフリートに SageMaker シフトします。

    • Linear トラフィックシフト は、トラフィックシフトステップの数と各ステップでシフトするトラフィックの割合をさらにカスタマイズできます。Canary シフトではトラフィックを 2 つのステップでシフトできますが、Linear シフトはこれを n 個の線形間隔のステップに拡張します。

  • ローリングデプロイ: 指定したバッチサイズのステップで、容量を SageMaker 段階的にプロビジョニングし、トラフィックを新しいフリートにシフトするようにエンドポイントを更新できます。新しいフリートのインスタンスは新しいデプロイ設定で更新され、ベーキング期間中に CloudWatch アラームが作動しない場合は、古いフリートのインスタンスを SageMaker クリーンアップします。このオプションにより、各ステップで移行するインスタンス数または容量の割合をきめ細かく制御できます。

および CreateEndpoint SageMaker API UpdateEndpointおよび AWS Command Line Interface コマンドを使用してデプロイを作成および管理できます。デプロイの設定方法の詳細については、個々のデプロイページを参照してください。エンドポイントが「Exclusions」ページにリストされているいずれかの機能を使っている場合、デプロイガードレールは使用できないことに注意してください。

デプロイガードレールの使用方法を示すガイド付きの例に従うには、Canary および Linear トラフィックシフトモードのJupyter ノートブックの例を参照してください。