表格式資料的端點請求 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

表格式資料的端點請求

為了取得訓練後偏差分析和特徵重要性分析的模型預測, SageMaker Clarify 處理任務會將表格式資料序列化為位元組,並將其作為請求承載傳送至推論端點。此表格式資料可能來自輸入資料集,或產生表格式資料。如果是合成資料,則是由解釋程式產生的,以供SHAP分析或PDP分析。

請求有效負載的資料格式應該由分析組態 content_type 參數指定。如果未提供 參數, SageMaker Clarify 處理任務將使用 dataset_type 參數的值作為內容類型。如需 content_type或 的詳細資訊dataset_type,請參閱 分析組態檔案

下列各節以 CSV和 JSON行格式顯示範例端點請求。

SageMaker Clarify 處理任務可以將資料序列化為CSV格式 (MIME 類型:text/csv)。下列資料表顯示序列化請求有效負載範例。

端點請求有效負載 (字串表示) 說明

'1,2,3,4'

單一記錄 (四個數值特徵)。

'1,2,3,4\ n 5,6,7,8'

兩個記錄,由分行符號 '\n' 分隔。

'"這是一個很好的產品",5'

單一記錄 (文字特徵和數值特徵)。

'"這是一個很好的產品",5\n"糟糕的購物體驗",1’

兩個記錄。

SageMaker Clarify 處理任務可以將資料序列化為 SageMaker JSON行密集格式 (MIME 類型:)application/jsonlines。如需JSON行的詳細資訊,請參閱 JSONLINES 請求格式

若要將表格資料轉換為JSON資料,請提供範本字串給分析組態content_template參數。如需有關 content_template 的詳細資訊,請參閱 分析組態檔案。下表顯示序列化JSON線路請求承載的範例。

端點請求有效負載 (字串表示) 說明

'{"資料":{"功能":[1,2,3,4]}}'

單一記錄。在這種情況下,範本看起來像 '{"data":{"features":$features}}' ,並由功能清單 [1,2,3,4] 取代 $features

'{"資料":{"功能":[1,2,3,4]}}\n{"資料":{"功能":[5,6,7,8]}}'

兩個記錄。

'{"功能":["這是一個好產品",5]}'

單一記錄。在這種情況下,範本看起來像 '{"features":$features}' 而 $features 取代為功能清單 ["This is a good product",5]

'{"功能":["這是一個好產品",5]}\n{"功能":["不好的購物體驗",1]}'

兩筆記錄。

SageMaker Clarify 處理任務可以將資料序列化為任意JSON結構 (MIME 類型:application/json)。若要這麼做,您必須為分析組態 content_template 參數提供範本字串。 SageMaker Clarify 處理任務會使用此功能來建構外部JSON結構。您還必須提供 的範本字串record_template,用於建構每個記錄的JSON結構。如需 content_templaterecord_template 的更多相關資訊,請參閱分析組態檔案

注意

因為 content_templaterecord_template是字串參數,任何屬於JSON序列化結構的雙引號字元 (") 都應在組態中註明為逸出字元。例如,如果您想要在 Python 中逸出雙引號,您可以輸入以下內容 content_template

"{\"data\":{\"features\":$record}}}"

下表顯示序列化JSON請求承載的範例,以及建構它們所需的對應content_templaterecord_template參數。

端點請求有效負載 (字串表示) 說明 content_template record_template

'{"資料":{"功能":[1,2,3,4]}}'

一次單筆記錄。

'{"資料":{"功能":$記錄}}}'

“$features”

'{"執行個體":[[0, 1], [3, 4]], "功能名稱": ["A", "B"]}'

具有功能名稱的多重記錄。

{"執行個體":$records, "功能名稱":$feature_names}'

“$features"

'[{"A": 0, "B": 1}, {"A": 3, "B": 4}]'

多記錄和鍵值對。

“$records"

“$features_kvp"

{"A": 0, "B": 1}'

一次單一記錄和鍵值對。

"$record"

"$features_kvp"

{"A": 0, "巢狀": {"B": 1}}'

或者,對任意結構使用完全詳細資訊 record_template。

"$record"

'{"A": "${A}", "巢狀": {"B": "${B}"}}'