スループットモード - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

スループットモード

Amazon SageMaker 特徴量ストアでは、オンデマンド (On-demand) スループットモードとプロビジョンド (Provisioned) スループットモードの 2 つの料金モデルから選択できます。On-demand は、予測不可能なトラフィックに最適で、Provisioned は一貫性があり予測可能なトラフィックに最適です。

特定の特徴量グループに対して On-demand スループットモードと Provisioned スループットモードを切り替えるオプションが提供されており、アプリケーションのトラフィックパターンが変化したり予測が困難になったりする期間に対応できます。特徴量グループのスループットモードを On-demand に更新できるのは、24 時間に 1 回のみです。スループットモードは、UpdateFeatureGroup API を使用したプログラムでも、コンソール UI でも更新できます。コンソールの使用方法の詳細については、「コンソールでの Amazon SageMaker 特徴量ストアの使用」を参照してください。

Provisioned スループットモードは、オフライン専用の特徴量グループや Standard ストレージタイプの特徴量グループで使用できます。その他のストレージ設定の場合、On-demand スループットモードが使用されます。オンラインストレージ設定とオフラインストレージ設定の詳細については、「オンラインストア」と「オフラインストア」をそれぞれ参照してください。

料金の詳細については、Amazon SageMakerの料金」を参照してください。

オンデマンドスループットモード

On-demand (デフォルト) スループットモードは、ワークロードが不明かつアプリケーショントラフィックが予測不可能で、容量要件を予測できない特徴量グループを使用する場合に最適です。

On-demand モードでは、アプリケーションが特徴量グループで実行する読み取りと書き込みに対して料金が発生します。特徴量ストアはワークロードの増加または減少に応じて直ちに対応するため、アプリケーションが実行する読み取りスループットや書き込みスループットを指定する必要はありません。使用した分だけ料金が発生します。使用については、ReadRequestsUnitsWriteRequestsUnits で測定されます。

On-demand スループットモードは、CreateFeatureGroup API、UpdateFeatureGroup API、またはコンソール UI を使用して有効にできます。コンソール UI の使用の詳細については、「コンソールでの Amazon SageMaker 特徴量ストアの使用」を参照してください。

重要

特徴量グループのスループットモードを On-demand に更新できるのは、24 時間に 1 回のみです。

プロビジョンドスループットモード

Provisioned スループットモードは、予測可能なワークロードで特徴量グループを使用している場合に最も適しており、コストを制御するための容量要件を予測できます。これにより、スループット要件を事前に予測できる特定のワークロードのコスト効率を向上できます。

特徴量グループを Provisioned モードに設定する際は、アプリケーションが特徴量グループから利用できる最大容量のキャパシティユニットを指定します。アプリケーションがこの Provisioned スループットキャパシティを超えると、リクエストスロットリングの対象になります。

読み取りキャパシティユニットと書き込みキャパシティユニットに関する情報は、以下のとおりです。

  • GetRecord API を使用して最大 4 KB の単一のレコードを取得すると、少なくとも 1 RCU (読み取りキャパシティユニット) を利用することになります。より大きなペイロードを取得するには、さらに増大する可能性があります。必要な読み取りキャパシティユニットの合計数は、特徴量ストアサービスが追加したごとの小型のメタデータなどの項目のサイズによって異なります。

  • PutRecord API を使用して 1 KB のペイロードを持つ単一の書き込みリクエストを実行すると、少なくとも 1 WCU (書き込みキャパシティユニット) を利用します。ペイロードの小数は最も近い KB に切り上げられます。イベント時刻、レコードの削除ステータス、Time to Live (TTL) ステータスによっては、利用料が増大する場合もあります。TTL の詳細については、「レコードの有効期限 (TTL)」を参照してください。

重要

キャパシティユニットを設定する際は、以下の点を考慮する必要があります。

  • Provisioned 容量をフル利用していない場合でも、特徴量グループのためにプロビジョンした読み取り容量と書き込み容量に対して料金が発生します。

  • 読み取り容量または書き込み容量の設定が低すぎると、リクエストスロットリングが発生する可能性があります。

  • 場合によっては、さまざまな機能を有効にするために特徴量ストアサービスが追加したレコードレベルのメタデータが原因で、レコードが追加のキャパシティユニットを利用することがあります。

  • GetRecord API または BatchGetRecord API を使用して特徴量のサブセットのみを取得する場合、レコード全体に対応する RCU を利用することになります。

  • 書き込み容量については、バックフィルまたは一括取り込みを実行する際のスロットリングを避けるため、最近のピーク容量の 2 倍をプロビジョンする必要があります。これは、履歴レコードの書き込みによって追加の書き込み容量を利用することになるためです。

  • 特徴量ストアは現時点で、Provisioned モードの自動スケーリングはサポートしていません。

On-demand スループットモードは、CreateFeatureGroup API、UpdateFeatureGroup API、またはコンソール UI を使用して有効にできます。コンソール UI の使用の詳細については、「コンソールでの Amazon SageMaker 特徴量ストアの使用」を参照してください。

Provisioned モードが有効になっている場合に、特徴量グループの RCU スループットと WCU スループットを増減する方法を以下で説明します。

プロビジョンドスループットの引き上げ

UpdateFeatureGroup API またはコンソール UI を使用して、RCU または WCU を必要に応じて何度でも増やすことができます。

プロビジョンドスループットの引き下げ

UpdateFeatureGroup API またはコンソール UI を使用して、特徴量グループの RCU や WCU (または両方) を減らすことができます。

特徴量グループで 1 日に実行できる Provisioned 容量の減少回数には、デフォルトの割り当てがあります。日付は、協定世界時 (UTC) に従って定義されます。特定の日に、その日に他の減少をまだ実行していない限り、1 時間以内に最大 4 回の減少を実行することから始めることができます。その後、その前の 1 時間で減少しない限り、1 時間あたりさらに 1 回の減少を実行できます。これにより、1 日で減らすことができる最大の回数は 27 回になります (1 日の中で最初の 1 時間は 4 回、その後は 1 時間ごとに 1 回)。

スループットモードのメトリクス

On-demand モードの特徴量グループは、ConsumedReadRequestsUnits メトリクスと ConsumedWriteRequestsUnits メトリクスを出力します。Provisioned モードの特徴量グループは、ConsumedReadCapacityUnits メトリクスと ConsumedWriteCapacityUnits メトリクスを出力します。特徴量ストアのメトリクスの詳細については、「Amazon SageMaker Feature Store メトリクス」を参照してください。

スループットモードの制限

各 AWS アカウント には、可用性を確保し、請求リスクを管理するために適用されるデフォルトのサービスクォータまたは制限があります。デフォルトのクォータと制限の詳細については、「クォータ、命名ルール、データ型」を参照してください。

場合によっては、このような制限がドキュメントに記載されている制限よりも低い場合があります。このような制限を引き上げる必要がある場合は、引き上げのリクエストを送信できます。作業の中断を避けるために、現在の制限に達する前にリクエストを行うことをお勧めします。サービスクォータとクォータの引き上げをリクエストする方法の詳細については、「AWS サービスクォータ」を参照してください。