翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
本番環境でモデルを更新するためのデプロイガードレール
デプロイガードレールは、本番環境で機械学習モデルを更新するための Amazon SageMaker Inference のモデルデプロイオプションのセットです。このフルマネージドデプロイオプションを使うと、本番環境の現在のモデルから新しいモデルへの切り替えをコントロールできます。Canary や Linear など、ブルー/グリーンデプロイのトラフィックシフトモードにより、更新の過程で現在のモデルから新しいモデルへのトラフィックシフトプロセスを細かくコントロールできます。また、自動ロールバックなどの組み込みセーフガードもあり、本番環境に大きな影響を与える前に、問題を早期に検出し、自動的に是正措置を講じることができます。
デプロイガードレールには次の利点があります。
本番環境を更新する際のデプロイの安全性。本番環境に対して後退的更新を行うと、計画外のダウンタイムが発生し、モデルのレイテンシーの増加や高いエラー率など、ビジネスに影響を与える可能性があります。デプロイガードレールは、ベストプラクティスと組み込みオペレーションの安全なガードレールを提供することで、これらのリスクを軽減するのに役立ちます。
フルマネージドの deployment. SageMaker は、これらのデプロイのセットアップとオーケストレーションを管理し、エンドポイント更新メカニズムと統合します。お客様がオーケストレーション、モニタリング、ロールバックのメカニズムを構築、維持する必要はありません。 SageMaker を活用してこれらのデプロイをセットアップおよびオーケストレーションし、アプリケーションに ML を活用することに重点を置くことができます。
可視性。デプロイの進行状況は、 DescribeEndpointAPIまたは Amazon CloudWatch Events (サポートされているエンドポイントの場合) を通じて追跡できます。のイベントの詳細については SageMaker、「」の「エンドポイントデプロイの状態変更」セクションを参照してくださいAmazon が Amazon SageMaker に送信するイベント EventBridge。エンドポイントがExclusionsページのいずれかの機能を使用している場合は、 CloudWatch イベントを使用できないことに注意してください。
開始方法
実稼働環境でのモデルの更新には、Blue/Green デプロイとローリングデプロイの 2 種類のデプロイがサポートされています。
-
ブルー/グリーンデプロイ: 更新により、古いフリート (青のフリート) から新しいフリート (緑のフリート) にトラフィックをシフトさせることができます。Blue/Green デプロイは複数のトラフィックシフトモードを提供します。トラフィックシフトモードは、エンドポイントトラフィックを更新を含む新しいフリートに SageMaker ルーティングする方法を指定する設定です。次のトラフィックシフトモードでは、エンドポイントの更新プロセスをさまざまなレベルでコントロールできます。
-
トラフィックシフトを一度にすべて使用する は、すべてのエンドポイントトラフィックを青のフリートから緑のフリートにシフトします。トラフィックがグリーンフリートに移行すると、事前に指定した Amazon CloudWatch アラームは、設定された時間 (ベーキング期間 ) グリーンフリートのモニタリングを開始します。ベーキング期間中にアラームが作動しない場合、 はブルーフリートを SageMaker 終了します。
-
Canary トラフィックシフトを使用する では、トラフィックのごく一部 (canary) を緑のフリートにシフトして、ベーキング期間中それをモニタリングできます。Canary がグリーンフリートで成功した場合、 はブルーフリートを終了する前に、残りのトラフィックをブルーフリートからグリーンフリート SageMaker に移行します。
-
線形トラフィックシフトを使用する は、トラフィックシフトステップの数と各ステップでシフトするトラフィックの割合をさらにカスタマイズできます。Canary シフトではトラフィックを 2 つのステップでシフトできますが、Linear シフトはこれを n 個の線形間隔のステップに拡張します。
-
-
ローリングデプロイを使用する: エンドポイントを更新して容量を SageMaker 段階的にプロビジョニングし、指定したバッチサイズのステップでトラフィックを新しいフリートに移行できます。新しいフリートのインスタンスは新しいデプロイ設定で更新され、ベーキング期間中に CloudWatch アラームが作動しない場合、 は古いフリートのインスタンスを SageMaker クリーンアップします。このオプションにより、各ステップで移行するインスタンス数または容量の割合をきめ細かく制御できます。
デプロイを作成および管理するには、 UpdateEndpoint コマンドと AWS Command Line Interface コマンドCreateEndpoint SageMaker APIと コマンドを使用します。デプロイの設定方法の詳細については、個々のデプロイページを参照してください。エンドポイントが「Exclusions」ページにリストされているいずれかの機能を使っている場合、デプロイガードレールは使用できないことに注意してください。
デプロイガードレールの使用方法を示すガイド付きの例に従うには、Canary および Linear トラフィックシフトモードのJupyter ノートブック