本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
項目資料集需求 (VIDEO_ON_ 網域DEMAND)
「項目」資料集會儲存目錄中項目的相關中繼資料。這可能包括每個項目的價格,類型和可用性等信息。如需可匯入到 Amazon Personalize 項目資料類型的相關資訊,請參閱項目元數據。如需 Amazon Personalize 結構描述一般需求的相關資訊,例如格式化要求和可用欄位資料類型,請參閱為 Amazon Personalize 結構描述建立結構描述JSON檔案。這些需求適用於所有結構描述,無論網域為何。
某些使用案例需要 Items 資料集 (請參閱視頻隨需使用案例)。如果選用,我們仍建議您建立一個以取得最相關的建議。如果您建立了 Items 資料集,您的結構描述必須包含下列欄位:
-
ITEM_ID
-
GENRES(分類
string
) -
CREATION_ TIMESTAMP (採用 Unix 紀元時間格式)
您的結構描述也可以包含下列保留關鍵字。每個關鍵字都會列出其所需的資料類型,以及是否支援 null 資料。添加空類型是可選的。
PRICE(浮動)
DURATION(浮動)
GENRE_L2 (分類
string
,)null
GENRE_L3 (分類
string
,)null
AVERAGE_RATING (
float
,null
)PRODUCT_ DESCRIPTION (文字
string
,null
)CONTENT_OWNER(分類
string
,null
):擁有該視頻的公司。例如,值可能是HBO派拉蒙和NBC。CONTENT_CLASSIFICATION(分類
string
,null
):內容的評級。例如,值可能是 G、PG、PG-13、R、NC-17 和未分級。
為了獲得最佳建議,我們建議您在結構描述中保留這些欄位中的資料。您匯入的資料必須與您的資料架構相符。中繼資料行的最大數目為 100。您可以根據使用案例和資料自由新增其他欄位。只要欄位未列為必填或保留,且中列出了資料類型結構描述資料類型,欄位名稱和資料類型就由您決定。
對於具有多個多層級類別的料號,請使用保留的關鍵字 GENRE GENRE _L2 和 _L3。如需詳細資訊,請參閱使用分類資料。若要取得有關文字和分類中繼資料的資訊,請參閱。為訓練準備項目中繼資料如需ECOMMERCE網域之項目資料集之預設結構描述的範例,請參閱預設項目結構描述 (VIDEO_ON_ 網域DEMAND)。
使用分類資料
若要使用分類資料,請新增類型欄位,string
並true
在結構描述中將欄位的分類屬性設定為。然後在大量CSV檔案和個別項目匯入中加入分類資料。分類值最多可包含 1000 個字元。如果您的項目分類值超過 1000 個字元,則資料集匯入工作將會失敗。
對於具有多個類別的項目,請使用垂直列「|」分隔每個值。例如,對於某個GENRES字段,您的項目的數據可能是Action|Crime|Biopic
。如果您有多層級的分類資料,而某些項目在階層中的每個層級都有多個類別,請為每個層級新增欄位,並在每個欄位名稱後面附加一個層級指示器:GENRES、GENRE _L2、_L3。GENRE這可讓您根據子類別篩選建議,即使某個項目屬於多個多層級類別也是如此。例如,每個類別層級的影片可能包含下列資料:
-
GENRES: 動作 | 冒險
-
GENRE_L2:犯罪 | 西方
-
GENRE_L3:傳記片
在這個例子中,視頻是在動作 > 犯罪 > 傳記片層次結構和冒險 > 西方 > 傳記片層次結構。我們建議僅使用最多 L3,但如有必要,您可以使用更多級別。如需建立和使用篩選器的資訊,請參閱篩選建議和使用者區段。
預設項目結構描述 (VIDEO_ON_ 網域DEMAND)
以下是 VIDEO _ON_ 網DEMAND域之項目資料集的預設結構描述。
{
"type": "record",
"name": "Items",
"namespace": "com.amazonaws.personalize.schema",
"fields": [
{
"name": "ITEM_ID",
"type": "string"
},
{
"name": "GENRES",
"type": [
"string"
],
"categorical": true
},
{
"name": "CREATION_TIMESTAMP",
"type": "long"
}
],
"version": "1.0"
}