本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
將訓練資料匯入 Amazon Personalize 資料集
完成建立結構描述和資料集之後,您就可以將訓練資料匯入資料集。匯入資料時,您可以選擇大量匯入記錄、個別匯入記錄,或同時匯入兩者。
-
大量匯入涉及一次匯入大量歷史記錄。您可以自行準備大量資料,並將其直接從 Amazon S3 中的CSV檔案匯入 Amazon Personalize。 Amazon S3 如需如何準備資料的資訊,請參閱 準備 Amazon Personalize 的訓練資料。如果您需要協助準備資料,您可以使用 SageMaker AI Data Wrangler 來準備和匯入大量項目互動、使用者和項目資料。如需詳細資訊,請參閱使用 Amazon SageMaker AI Data Wrangler 準備和匯入大量資料。
-
如果您沒有大量資料,則可以使用個別匯入操作來收集資料和串流事件,直到您符合 Amazon Personalize 訓練需求,以及網域使用案例或配方的資料需求為止。如需記錄事件的資訊,請參閱 記錄即時事件以影響建議。如需匯入個別記錄的資訊,請參閱 將個別記錄匯入 Amazon Personalize 資料集。
將資料匯入 Amazon Personalize 資料集後,您可以分析、匯出至 Amazon S3 儲存貯體、更新或刪除資料集。
如果您匯入的項目、使用者或動作,其 ID 與資料集中已存在的記錄相同,Amazon Personalize 會將其取代為新記錄。如果您使用完全相同的時間戳記和相同的屬性記錄兩個項目互動或動作互動事件,Amazon Personalize 只會保留其中一個事件。
隨著目錄的增長,請使用額外的大量資料或個別資料來更新您的歷史資料,匯入操作。如需即時建議,請將您的項目互動資料集與使用者的行為保持最新狀態。您可以透過記錄與事件追蹤器和 PutEvents操作的即時互動事件來執行此操作。如需詳細資訊,請參閱 記錄即時事件以影響建議
匯入資料後,您已準備好建立網域建議程式 (適用於網域資料集群組) 或自訂資源 (適用於自訂資料集群組),以訓練資料上的模型。您可以使用這些資源來產生建議。如需詳細資訊,請參閱 Amazon Personalize 中的網域建議程式 或 用於訓練和部署 Amazon Personalize 模型的自訂資源。