輸送量模式 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

輸送量模式

Amazon SageMaker Feature Store 提供兩種定價模式供您選擇:隨需 (On-demand) 和佈建 (Provisioned) 輸送量模式。 On-demand最適合較不可預測的流量,同時Provisioned最適合一致且可預測的流量。

您可以選擇在指定功能群組的 On-demandProvisioned輸送量模式之間切換,以適應應用程式流量模式正在變更或無法預測的期間。您每 24 小時只能將功能群組輸送量模式更新為On-demand一次。您可以使用 UpdateFeatureGroup API 或透過主控台 UI,以程式設計方式更新輸送量模式。如需使用 主控台的詳細資訊,請參閱 在 主控台中使用 Amazon SageMaker Feature Store

您可以搭配離線功能群組使用Provisioned輸送量模式,或搭配Standard儲存類型使用功能群組。對於其他儲存組態,會使用On-demand輸送量模式。如需線上和離線儲存組態的相關資訊,請離線儲存分別參閱 線上儲存和 。

如需定價的詳細資訊,請參閱 Amazon SageMaker AI 定價

隨需輸送量模式

當您使用具有未知工作負載、無法預測的應用程式流量的功能群組時,On-demand(預設) 輸送量模式最有效,而且您無法預測容量需求。

On-demand 模式會針對應用程式在功能群組上執行的讀取和寫入向您收費。您不需要指定預期應用程式執行的讀取和寫入輸送量,因為 Feature Store 會在工作負載上升或下降時立即容納工作負載。您只需為使用的項目付費,其以 ReadRequestsUnits和 衡量WriteRequestsUnits

您可以使用 CreateFeatureGroupUpdateFeatureGroup APIs或透過主控台 UI 啟用On-demand輸送量模式。如需使用主控台 UI 的詳細資訊,請參閱 在 主控台中使用 Amazon SageMaker Feature Store

重要

您每 24 小時只能將功能群組輸送量模式更新為On-demand一次。

佈建的輸送量模式

當您使用具有可預測工作負載的功能群組時,Provisioned輸送量模式最有效,而且您可以預測容量需求來控制成本。這可以讓特定工作負載更具成本效益,您可以在其中預先預測輸送量需求。

當您將功能群組設定為 Provisioned 模式時,您可以指定容量單位,這是應用程式可以從功能群組取用的最大容量。如果您的應用程式超過此Provisioned輸送量容量,則需進行請求限流。

下列包含讀取和寫入容量單位的相關資訊。

  • 使用 GetRecord API 擷取最多 4 KB 的單一記錄,將至少使用 1 個 RCU (讀取容量單位)。擷取較大的承載可能需要更多。所需的讀取容量單位總數取決於項目大小,包括特徵存放區服務新增的每筆記錄中繼資料較小。

  • 使用 PutRecord API 承載 1 KB 的單一寫入請求,將至少耗用 1 個 WCU (寫入容量單位),分數承載會四捨五入至最接近的 KB。視事件時間、記錄的刪除狀態和存留時間 (TTL) 狀態而定,它可能會消耗更多。如需 TTL 的詳細資訊,請參閱存留時間 (TTL) 記錄持續時間

重要

設定容量單位時,請考慮下列事項:

  • 即使您未充分利用容量,仍需支付您為功能群組佈建的讀取和寫入Provisioned容量的費用。

  • 如果您將讀取或寫入容量設定為過低,您的請求可能會遇到限流。

  • 在某些情況下,記錄可能會因為特徵存放區服務新增的記錄層級中繼資料而消耗額外的容量單位,以啟用各種功能。

  • 使用 GetRecordBatchGetRecord APIs 僅擷取一部分功能仍會使用與整個記錄對應的 RCU。

  • 對於寫入容量,您應該佈建最近峰值容量的 2 倍,以避免在執行回填或大量擷取時調節,這可能會導致大量的歷史記錄寫入。這是因為寫入歷史記錄會消耗額外的寫入容量。

  • Feature Store 目前不支援Provisioned模式的自動擴展。

您可以使用 CreateFeatureGroupUpdateFeatureGroup APIs或透過主控台 UI 啟用On-demand輸送量模式。如需使用主控台 UI 的詳細資訊,請參閱 在 主控台中使用 Amazon SageMaker Feature Store

以下說明如何在啟用 Provisioned 模式時,增加或減少功能群組的 RCU 和 WCU 輸送量。

增加佈建輸送量

您可以使用 UpdateFeatureGroup API 或主控台 UI,視需要增加 RCU 或 WCU。

減少佈建的輸送量

您可以使用 UpdateFeatureGroup API 或主控台 UI 來減少特徵群組的 RCU 和 WCU (或兩者)。

您每天可在功能群組上執行的Provisioned容量減少數量有預設配額。一天是根據國際標準時間 (UTC) 來定義。在給定的一天,只要您在當天還沒有執行任何其他減少,您可以在一小時內執行最多四次減少。然後,只要前一小時沒有減少,您就可以每小時執行一次額外的減少。一天的調降次數最多可達 27 次 (第一個小時的 4 次調降,加上一天中後續每 1 小時 1 次的調降)。

輸送量模式指標

On-demand 模式中的功能群組會發出 ConsumedReadRequestsUnitsConsumedWriteRequestsUnits指標。Provisioned 模式中的功能群組會發出 ConsumedReadCapacityUnitsConsumedWriteCapacityUnits指標。如需 Feature Store 指標的詳細資訊,請參閱 Amazon SageMaker Feature Store 指標

輸送量模式限制

每個 AWS 帳戶 都有預設的服務配額或限制,用於協助確保可用性和管理帳單風險。如需預設配額和限制的相關資訊,請參閱 配額、命名規則與資料類型

在某些情況下,這些限制可能會低於文件中所述的限制。如果您需要更高的限制,您可以提交提高的請求。在達到目前的限制之前,最好先這麼做,以避免您的工作中斷。如需服務配額以及如何請求提高配額的詳細資訊,請參閱 AWS 服務配額