線上儲存 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

線上儲存

線上儲存是一種低延遲、高可用性的資料儲存,可提供即時查詢功能。它通常用於機器學習 (ML) 模型服務。您可以在建立特徵群組時選擇標準線上儲存 (Standard) 或記憶體內層線上儲存 (InMemory)。透過這種方式,您可以在考慮效能和成本的同時,選取最符合特定應用程式的讀取和寫入模式的儲存類型。如需有關定價的詳細資訊,請參閱 Amazon SageMaker 定價

線上儲存包含下列 StorageType 選項。如需線上商店內容的詳細資訊,請參閱OnlineStoreConfig

標準層儲存類型

Standard 層是適用於線上儲存特徵群組的受管低延遲資料儲存。它為您的應用程式提供機器學習 (ML) 模型服務的快速資料擷取。Standard 是預設的儲存類型。

記憶體內層儲存類型

InMemory 層是適用於線上儲存特徵群組的受管資料儲存,支援非常低延遲的擷取。它為用於高輸送量應用程式的機器學習 (ML) 模型服務提供大規模即時資料擷取。該InMemory層由 Amazon ElastiCache (RedisOSS)供電。有關更多信息,請參閱什麼是 Amazon ElastiCache (RedisOSS)? 。

線上儲存 InMemory 層支援集合類型,也就是清單、集合和向量。如需InMemory集合類型的詳細資訊,請參閱集合類型

特徵商店為線上儲存提供低延遲的讀取和寫入功能。應用程式延遲主要由兩個主要元件組成:基礎架構或網路延遲和功能存放區API延遲。減少網路延遲有助於獲得對特徵商店的最低延遲讀寫。您可以透過部署來減少功能商店的網路延遲 AWS PrivateLink 至功能存放區執行階段端點。同 AWS PrivateLink,您可以使用界面VPC端點,以可擴展的方式從 Amazon 虛擬私有雲 (VPC) 私有存取所有功能存放區執行階段API作業。同時 AWS PrivateLink privateDNSEnabled選項設定為 true 的部署:

  • 它將所有功能商店讀/寫流量保持在您的VPC.

  • 它會在使用特徵商店時,將流量與產生流量的用戶端保持在相同的 AZ 中。這樣可以避免AZs減少網絡延遲之間的「跳躍」。

按照訪問中的步驟進行操作 AWS 使用介面VPC端點進行設定的服務 AWS PrivateLink 至功能商店。功能存放庫執行階段的服務名稱 AWS PrivateLink 是com.amazonaws.region.sagemaker.featurestore-runtime

InMemory層級線上商店會根據儲存空間使用量和要求自動擴展。如果使用量快速變化,自動調整可能需要幾分鐘的時間來適應新的使用模式。在自動擴展期間:

  • 特徵群組的寫入操作可能會收到限流錯誤。您應該在幾分鐘後重試您的要求。

  • 特徵群組的讀取操作可能會收到限流錯誤。在這種情況下,適用標準重試策略。

  • 讀取操作可能會出現延遲提升。

預設 InMemory 層特徵群組大小上限為 50 GiB。

請注意,該 InMemory 層目前僅支援線上特徵群組,不支援線上 + 離線特徵群組,因此 InMemory 層的線上和離線儲存之間不會進行複寫。此外,該InMemory層目前不支援客戶管理的KMS金鑰。