將資料集中的訓練資料匯出到 Amazon S3 - Amazon Personalize

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

將資料集中的訓練資料匯出到 Amazon S3

將資料匯入 Amazon 個人化資料集之後,您可以將資料匯出到 Amazon S3 儲存貯體。您可以匯出資料以驗證和檢查 Amazon Personalize 用來產生建議、即時檢視先前記錄的項目互動事件,或對資料執行離線分析的資料。

您可以選擇只匯出大量匯入的資料 (使用 Amazon Personalize 資料集匯入任務匯入)、僅匯入個別匯入的資料 (使用主控台或、或作PutItems業匯入的記錄) PutEventsPutUsers,或兩者皆匯入。

注意

您無法匯出「動作」互動資料集或「動作」資料集中的資料。

對於與所有欄位完全相符的記錄,Amazon Personalize 只會匯出一筆記錄。如果兩筆記錄具有相同的 ID,但一或多個欄位不同,Amazon Personalize 會根據您選擇匯出的資料包含或移除記錄:

  • 如果您同時匯出大量資料和增量資料,Amazon Personalize 只會匯出具有相同 ID 的最新項目 (在「項目」資料集匯出中),而且只會匯出具有相同 ID 的使用者 (在「使用者」資料集匯出中)。對於項目互動資料集,Amazon Personalize 會匯出所有項目互動資料。

  • 如果您只匯出增量資料,Amazon Personalize 會匯出您個別匯入的所有項目、使用者或項目互動資料,包括具有相同項目的項目或使用者IDs。僅排除與所有欄位完全相符的記錄。

  • 如果您僅匯出大量資料,Amazon Personalize 會包含您大量匯入的所有項目、使用者或項目互動資料,包括具有相同項目的項目或使用者IDs。僅排除與所有欄位完全相符的記錄。

若要匯出資料集,您需要建立資料集匯出工作。資料集匯出任務是一種記錄匯出工具,可將資料集中的記錄輸出到 Amazon S3 儲存貯體中的一或多個CSV檔案。輸出CSV檔案包含一個標題列,其資料欄名稱與資料集結構描述中的欄位相符。