結構描述 - Amazon Personalize

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

結構描述

結構述會告訴 Amazon Personalize 您的資料結構,並允許 Amazon Personalize 解析資料。結構描述有一個名稱鍵,其值必須與資料集類型相符。建立結構描述之後,就無法變更結構描述。

對於網域資料集群組,每個資料集類型都有一個預設結構描述,其中包含必要欄位和保留 每次建立資料集時,您都可以使用現有的網域結構描述,或修改現有的預設結構描述來建立新的結構描述。使用預設結構描述做為您網域匯入哪些資料的指南。定義結構定義並建立資料集之後,就無法變更結構定義。

結構描述格式化

當您為網域資料集群組或自訂資料集群組中的資料集建立結構描述時,必須遵循下列準則:

  • 您必須以 Avro 格式定義結構定義。如需有關我們支援的 Avro 資料類型的資訊,請參閱架構資料類型

  • 結構定義欄位可以以任何順序顯示,但必須與CSV檔案中對應欄標題的順序相符。

  • 結構描述必須是沒有巢狀結構的平面JSON檔案。例如,一個欄位不能是多個子欄位的父項。

  • Amazon Personalize 結構描述不支援複雜類型,例如陣列和地圖。

  • 架構欄位必須有唯一的英數字元名稱。例如,您無法同時新增GENRES_FIELD_1欄位和GENRESFIELD1欄位。

  • 您必須將必要欄位定義為其必要資料類型。保留的分類字串欄位必須將categorical屬性設定為true,而保留字串欄位則無法分類。關鍵字不能在您的資料中。

  • 如果您新增自己的中繼資料類型欄位,string並希望 Amazon Personalize 在訓練時使用它,則必須包含categorical屬性或屬性 (只有項目結構描述支援具有文字屬性的欄位)。textual

  • 產生主題、在建議中傳回中繼資料以及篩選建議時,Amazon Personalize 可以使用非分類字串欄,例如項目名稱欄。如需詳細資訊,請參閱非分類字串資料

  • 訓練或篩選建議時,Amazon Personalize 不會使用boolean類型資料。若要讓 Amazon Personalize 在訓練或篩選時使用布林值資料,請使用字串類型的欄位,並在資料"False"中使用這些值"True"。或者你可以使用類型 int和值01

  • 文字欄位必須是類型,string且必須將textual屬性設定為true。如需非結構化文字資料的詳細資訊,請參閱〈〉非結構化文本元數據

根據網域和資料集類型,網域資料集群組資料集有其他需求。自訂資料集群組資料集會根據類型而有其他需求。

架構資料類型

Amazon Personalize 結構描述支援下列欄位的 Avro 類型:

  • float

  • double

  • int

  • long

  • string

  • boolean

  • null

某些必要欄位和保留欄位支援空值資料。將null類型新增至欄位可讓您使用不完美的資料 (例如,含有空白值的中繼資料) 來產生建議。如需有關哪些欄位支援 Null 資料的資訊,請參閱網域資料集和結構描自定義數據集和模式。下面的例子演示了如何添加一個空類型的GENDER字段。

{ "name": "GENDER", "type": [ "null", "string" ], "categorical": true }