資料格式相容性指南 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

資料格式相容性指南

本指南說明與 SageMaker Clarify 處理任務相容的資料格式類型。支援的資料格式類型包括副檔名、資料結構,以及表格式、影像和時間序列資料集的特定需求或限制。本指南也會說明如何檢查您的資料集是否符合這些需求。

在高層級上,SageMaker Clarify 處理任務會遵循輸入程序輸出模型來運算偏差指標和功能屬性。請參考以下範例了解詳細資訊。

SageMaker Clarify 處理任務的輸入包含下列項目:

  • 要分析的資料集。

  • 分析組態。如需如何設定分析的詳細資訊,請參閱 分析組態檔案

在處理階段,SageMaker Clarify 會運算偏差指標和功能屬性。SageMaker Clarify 處理任務會在後端完成下列步驟:

  • SageMaker Clarify 處理任務會剖析您的分析組態並載入您的資料集

  • 若要運算訓練後偏差指標和功能屬性,此任務需要您的模型預測模型。SageMaker Clarify 處理任務會序列化您的資料,並將其作為請求傳送至部署在 SageMaker AI 即時推論端點上的模型。之後,SageMaker Clarify 處理任務會從回應中擷取預測。

  • SageMaker Clarify 處理任務會執行偏差和解釋性分析,然後輸出結果。

如需詳細資訊,請參閱SageMaker Clarify 處理工作的運作方式

您用來指定資料格式的參數取決於資料在處理流程中使用的位置,如下所示:

  • 對於輸入資料集,請使用 dataset_type 參數來指定格式或 MIME 類型。

  • 對於端點的請求,請使用 content_type 參數來指定格式。

  • 對於來自端點的回應,請使用 accept_type 參數來指定格式。

端點的輸入資料集、請求和來自端點的回應不需要相同的格式。例如,在符合下列條件的情況下,您可以使用具有 CSV 請求有效負載和 JSON 行回應有效負載的 Parquet 資料集。

  • 您的分析設定正確。

  • 您的模型支援請求和回應格式。

注意

如果未提供 content_typeaccept_type,則 SageMaker Clarify 容器會推論 content_typeaccept_type