本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
項目互動資料集結構描述要求 (自訂)
項目互動資料集會存放您目錄中使用者和項目之間互動的歷史和即時資料。如需有關 Amazon Personalize 可以使用之互動類型的資訊,請參閱 項目互動資料。
您為每個互動提供的資料必須符合您的結構描述。根據您的結構描述,互動中繼資料可以包含空值/空值。您至少必須為每次互動提供下列項目:
-
使用者 ID
-
項目 ID
-
時間戳記 (以 Unix epoch 時間格式顯示)
您可以根據您的使用案例和資料,自由新增其他欄位。只要欄位未列為必要或預留,且資料類型列於 中結構描述資料類型,欄位名稱和資料類型將由您決定。
您可以新增至項目互動資料集的選用中繼資料欄位總數上限,結合項目互動資料中不同事件類型的總數,為 10。此計數中包含的中繼資料欄位為 EVENT_TYPE、EVENT_VALUE 欄位,以及您新增至結構描述的任何自訂中繼資料欄位。排除預留欄位的中繼資料欄位數量上限為 5。類別值最多可以有 1000 個字元。如果您與超過 1000 個類別值的互動,資料集匯入任務將會失敗。
如需項目互動資料集的最低需求和最大資料限制的詳細資訊,請參閱 Service Quotas。
互動結構描述範例 (自訂)
下列範例顯示項目互動資料集的結構描述。USER_ID
、ITEM_ID
和 TIMESTAMP
欄位是必要的。EVENT_TYPE
、 EVENT_VALUE
和 IMPRESSION
欄位是 Amazon Personalize 識別的選用預留關鍵字。EVENT_TYPE 必須輸入字串,且不能分類。 LOCATION
和 DEVICE
是選用的內容中繼資料欄位。如需結構描述需求的詳細資訊,請參閱自訂資料集和結構描述需求。
{
"type": "record",
"name": "Interactions",
"namespace": "com.amazonaws.personalize.schema",
"fields": [
{
"name": "USER_ID",
"type": "string"
},
{
"name": "ITEM_ID",
"type": "string"
},
{
"name": "EVENT_TYPE",
"type": "string"
},
{
"name": "EVENT_VALUE",
"type": [
"float",
"null"
]
},
{
"name": "LOCATION",
"type": "string",
"categorical": true
},
{
"name": "DEVICE",
"type": [
"string",
"null"
],
"categorical": true
},
{
"name": "TIMESTAMP",
"type": "long"
},
{
"name": "IMPRESSION",
"type": "string"
}
],
"version": "1.0"
}
在此結構描述中,CSV 檔案中的前幾行歷史資料可能如下所示。請注意,EVENT_VALUE 的某些值為 null。
USER_ID,ITEM_ID,EVENT_TYPE,EVENT_VALUE,LOCATION,DEVICE,TIMESTAMP,IMPRESSION
35,73,click,,Ohio,Tablet,1586731606,73|70|17|95|96|92|55|45|16|97|56|54|33|94|36|10|5|43|19|13|51|90|65|59|38
54,35,watch,0.75,Indiana,Cellphone,1586735164,35|82|78|57|20|63|1|90|76|75|49|71|26|24|25|6|37|85|40|98|32|13|11|54|48
9,33,click,,Oregon,Cellphone,1586735158,68|33|62|6|15|57|45|24|78|89|90|40|26|91|66|31|47|17|99|29|27|41|77|75|14
23,10,watch,0.25,California,Tablet,1586735697,92|89|36|10|39|77|4|27|79|18|83|16|28|68|78|40|50|3|99|7|87|49|12|57|53
27,11,watch,0.55,Indiana,Tablet,1586735763,11|7|39|95|71|1|6|40|41|28|99|53|68|76|0|65|69|36|22|42|34|67|24|20|66
...
...