準備使用者中繼資料以進行訓練 - Amazon Personalize

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

準備使用者中繼資料以進行訓練

您可以匯入 Amazon Personalize 的使用者資料包括數值資料,例如使用者年齡,以及分類中繼資料,例如性別或忠誠度成員資格。您可以將有關使用者的中繼資料匯入 Amazon Personalize 使用者資料集

根據您的網域使用案例或自訂配方,使用者中繼資料可協助 Amazon Personalize 向使用者建議更相關的項目,或建議更有意義的使用者客群。訓練之後,它可以協助您的模型為沒有任何互動資料的使用者建議項目。如需哪些使用案例或配方使用使用者中繼資料的詳細資訊,請參閱 中網域使用案例或配方的資料需求將您的使用案例與 Amazon Personalize 資源配對

訓練時,Amazon Personalize 不會使用非分類字串使用者資料,例如使用者名稱、有關使用者的關鍵字或標籤。不過,匯入此資料仍然可以增強建議。如需詳細資訊,請參閱非分類字串資料

對於所有網域使用案例和自訂配方,您的大量使用者資料必須位於 CSV 檔案中。檔案中的每一列都應該代表唯一的使用者。完成資料準備後,您就可以建立結構描述 JSON 檔案。此檔案會告知 Amazon Personalize 您資料的結構。如需詳細資訊,請參閱為 Amazon Personalize 結構描述建立結構描述 JSON 檔案

下列各節提供如何準備 Amazon Personalize 使用者資料的詳細資訊。如需所有資料類型的大量資料格式指導方針,請參閱大量資料格式指導方針

使用者資料需求

以下是 Amazon Personalize 的使用者資料需求。您可以根據您的使用案例和資料,自由新增其他自訂資料欄。

  • 您的資料必須有一個 USER_ID 資料欄,該資料會存放每個使用者的唯一識別符。每個使用者都必須有使用者 ID。它必須是長度string上限為 256 個字元的 。

  • 您的資料必須至少有一個分類字串或數值中繼資料資料欄。使用者中繼資料資料欄可以包含某些使用者的空白/無效值。我們建議這些資料欄至少完成 70%。

  • 中繼資料資料欄的數量上限為 25。

如果您不確定自己有足夠的資料,或對資料品質有疑問,您可以將資料匯入 Amazon Personalize 資料集,並使用 Amazon Personalize 進行分析。如需詳細資訊,請參閱分析 Amazon Personalize 資料集中的資料品質和數量

分類中繼資料

在某些配方和所有網域使用案例中,Amazon Personalize 會在識別基礎模式時,使用分類中繼資料,例如使用者的性別、興趣或成員資格狀態,以向使用者顯示最相關的項目。您可以根據使用案例定義自己的值範圍。分類中繼資料可以是任何語言。

對於具有多個類別的使用者,請以垂直長條 '|' 分隔每個值。例如,對於 INTERESTS 欄位,您的使用者資料可能是 Movies|TV Shows|Music

使用所有配方和網域,您可以匯入分類中繼資料,並根據使用者的屬性來篩選建議。如需篩選建議的相關資訊,請參閱篩選建議和使用者區段

分類值最多可以有 1000 個字元。如果您的使用者具有超過 1000 個字元的類別值,您的資料集匯入任務將會失敗。

非分類字串資料

除了使用者 IDs 之外,Amazon Personalize 不會在訓練時使用非分類字串資料,例如使用者名稱、有關使用者的關鍵字或標籤。不過,Amazon Personalize 可以在篩選建議時使用它。您可以建立篩選條件,以根據取得建議之使用者 (CurrentUser) 的非類別字串資料,從建議中包含或移除項目。如需篩選條件的詳細資訊,請參閱篩選建議和使用者區段。非類別值最多可有 1000 個字元。

使用者中繼資料範例

CSV 檔案中的前幾行使用者中繼資料可能如下所示。

USER_ID,AGE,GENDER,INTEREST 5,34,Male,hiking 6,56,Female,music 8,65,Male,movies|TV shows|music ... ...

資料USER_ID欄為必要項目,並存放每個個別使用者的唯一識別符。資料AGE欄是數值中繼資料。GENDERINTEREST資料欄會為每個使用者存放分類中繼資料。

完成資料準備後,您就可以建立結構描述 JSON 檔案。此檔案會告知 Amazon Personalize 您資料的結構。如需詳細資訊,請參閱為 Amazon Personalize 結構描述建立結構描述 JSON 檔案。這是上述範例資料結構描述 JSON 檔案的外觀。

{ "type": "record", "name": "Users", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "AGE", "type": "int" }, { "name": "GENDER", "type": "string", "categorical": true }, { "name": "INTEREST", "type": "string", "categorical": true } ], "version": "1.0" }