處理資料並將其匯入 Amazon Personalize - Amazon Personalize

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

處理資料並將其匯入 Amazon Personalize

當您完成資料分析和轉換後,您就可以開始處理資料並將其匯入 Amazon Personalize。

  • 處理資料 — 處理資料會將您的轉換套用至整個資料集,並將其輸出至您指定的目的地。在這種情況下,您可以指定一個 Amazon S3 儲存貯體。

  • 將資料匯入 Amazon Personalize — 若要將已處理的資料匯入 Amazon Personalize,您可以執行 SageMaker 工作室傳統中提供的 Jupyter 筆記本。這個筆記本會建立您的 Amazon Personalize 資料集,然後將資料匯入其中。

處理資料

在將資料匯入 Amazon Personalize 之前,您必須將轉換套用至整個資料集,並將其輸出到 Amazon S3 儲存貯體。若要這麼做,您可以建立目標節點,並將目的地設定為 Amazon S3 儲存貯體,然後啟動轉換的處理任務。

如需指定目的地和啟動程序任務的指 step-by-step 示,請參閱使用 Amazon SageMaker Data Wrangler 按幾下即可啟動處理任務。當您新增目的地時,請選擇 Amazon S3。當您將處理過的資料匯入 Amazon Personalize 時,將會使用此位置。

完成資料處理後,您就可以準備將資料從 Amazon S3 儲存貯體匯入亞 Amazon Personalize。

將數據導入 Amazon Personalize 化

在您處理資料之後,您就可以將資料匯入 Amazon Personalize。若要將已處理的資料匯入 Amazon Personalize,您可以執行 SageMaker 工作室經典版中提供的 Jupyter 筆記本。這個筆記本會建立您的 Amazon Personalize 資料集,然後將資料匯入其中。

將已處理的資料匯入 Amazon Personalize
  1. 對於要導出的轉換,選擇導出到並選擇 Amazon Personalize 化(通過 Jupyter 筆記本)。

  2. 修改筆記本以指定您用作處理任務資料目標的 Amazon S3 儲存貯體。選擇性地指定資料集群組的網域。根據預設,記事本會建立自訂資料集群組。

  3. 複查建立綱要的記事本儲存格。在執行儲存格之前,請先確認結構描述欄位具有預期的類型和屬性。

    • 確認支援 null 資料的欄位已null列在類型清單中。下列範例顯示如何新增null欄位。

      { "name": "GENDER", "type": [ "null", "string" ], "categorical": true }
    • 確認分類欄位的分類屬性設定為 true。下列範例顯示如何標記欄位分類。

      { "name": "SUBSCRIPTION_MODEL", "type": "string", "categorical": true }
    • 確認文字欄位的文字屬性設定為 true。下列範例顯示如何將欄位標記為文字。

      { "name": "DESCRIPTION", "type": [ "null", "string" ], "textual": true }
  4. 執行筆記本以建立結構描述和建立資料集,並將資料匯入 Amazon Personalize 資料集。您可以像在工作 SageMaker 室經典之外使用筆記本一樣運行筆記本。如需執行 Jupyter 記事本的相關資訊,請參閱執行程式碼。如需 SageMaker Studio Classic 中筆記本的相關資訊,請參閱 Amazon SageMaker 開發人員指南中的使用 Amazon SageMaker 筆記本

    完成筆記本之後,如果您匯入了互動資料,就可以建立推薦人或自訂資源。或者,您可以使用項目數據集或用戶數據集重複此過程。