本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
資料格式相容性指南
本指南說明與 SageMaker Clarify 處理任務相容的資料格式類型。支援的資料格式類型包括副檔名、資料結構,以及表格式、影像和時間序列資料集的特定需求或限制。本指南也會說明如何檢查您的資料集是否符合這些需求。
在高層級上,SageMaker Clarify 處理任務會遵循輸入程序輸出模型來運算偏差指標和功能屬性。請參考以下範例了解詳細資訊。
SageMaker Clarify 處理任務的輸入包含下列項目:
-
要分析的資料集。
-
分析組態。如需如何設定分析的詳細資訊,請參閱 分析組態檔案。
在處理階段,SageMaker Clarify 會運算偏差指標和功能屬性。SageMaker Clarify 處理任務會在後端完成下列步驟:
-
SageMaker Clarify 處理任務會剖析您的分析組態並載入您的資料集。
-
若要運算訓練後偏差指標和功能屬性,此任務需要您的模型預測模型。SageMaker Clarify 處理任務會序列化您的資料,並將其作為請求傳送至部署在 SageMaker AI 即時推論端點上的模型。之後,SageMaker Clarify 處理任務會從回應中擷取預測。
-
SageMaker Clarify 處理任務會執行偏差和解釋性分析,然後輸出結果。
如需詳細資訊,請參閱SageMaker Clarify 處理工作的運作方式。
您用來指定資料格式的參數取決於資料在處理流程中使用的位置,如下所示:
-
對於輸入資料集,請使用
dataset_type
參數來指定格式或 MIME 類型。 -
對於端點的請求,請使用
content_type
參數來指定格式。 -
對於來自端點的回應,請使用
accept_type
參數來指定格式。
端點的輸入資料集、請求和來自端點的回應不需要相同的格式。例如,在符合下列條件的情況下,您可以使用具有 CSV 請求有效負載和 JSON 行回應有效負載的 Parquet 資料集。
-
您的分析設定正確。
-
您的模型支援請求和回應格式。
注意
如果未提供 content_type
或 accept_type
,則 SageMaker Clarify 容器會推論 content_type
和 accept_type
。