翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Items データセットスキーマの要件 (カスタム)
Items データセットには、カタログのアイテムに関するメタデータが保存されます。これには、各アイテムについての料金、ジャンル、利用可否などの情報が含まれる場合があります。Amazon Personalize がインポートできるデータの種類については、「アイテムメタデータ」を参照してください。
各アイテム用に入力するデータは、Items データセットのスキーマと一致している必要があります。少なくとも、各アイテムについてアイテム ID を指定する必要があります (最大長 256 文字)。スキーマによっては、アイテムメタデータに空/null 値を含めることができます。スキーマには少なくとも 1 つのメタデータフィールドが必要ですが、null
タイプを追加すると、項目に対してこの値が null になる可能性があります。ユースケースとデータに応じて、さらにフィールドを追加することができます。フィールドが必須または予約済みとして記載されておらず、データ型が スキーマのデータ型 に記載されている限り、フィールド名とデータ型は自由に設定できます。
カテゴリデータを使用するには、タイプ string
のフィールドを追加し、スキーマでフィールドのカテゴリ属性を true
に設定します。次に、カテゴリデータを一括CSVファイルと個々の項目のインポートに含めます。カテゴリ値には、最大 1,000 文字を使用できます。1,000 文字を超えるカテゴリ値を持つアイテムがある場合、データセットのインポートジョブは失敗します。
複数のカテゴリを持つアイテムについては、バーティカルバー「|」を使用して各値を区切ります。例えば、GENRESフィールドの場合、項目のデータは になりますAction|Crime|Biopic
。複数のレベルのカテゴリデータがあり、一部の項目で階層内の各レベルに複数のカテゴリがある場合は、各レベルのフィールドを追加し、各フィールド名の後にレベルインジケータを追加します: GENRES、GENRE_L2、GENRE_L3。これにより、アイテムが複数のマルチレベルカテゴリに属している場合でも、サブカテゴリに基づいてレコメンデーションをフィルタリングできます (フィルタの作成と使用については、「レコメンデーションとユーザーセグメントのフィルタリング」を参照してください)。例えば、動画にはカテゴリレベルごとに次のデータが含まれている場合があります。
-
GENRES: Action|Adventure
-
GENRE_L2: 犯罪|西部
-
GENRE_L3: バイオピック
この例では、動画はアクション > 犯罪 > バイオピックの階層、およびアドベンチャー > ウエスタン > バイオピックの階層です。L3 まで使用することをお勧めしますが、必要に応じてもっと多くのレベルを使用できます。
モデルトレーニング中に、Amazon Personalize は最大 750,000 アイテムを考慮します。750,000 を超えるアイテムをインポートする場合、Amazon Personalize は、新しいアイテム (インタラクションなしで最近追加したアイテム) と最近のインタラクションデータを含む既存のアイテムを含めることに重点を置いて、トレーニングに含めるアイテムを決定します。
Items データセットの最小要件と最大データ制限の詳細については、「Service Quotas」を参照してください。
Items データセットのスキーマの例 (カスタム)
次の例は、アイテムスキーマを構築する方法を示します。ITEM_ID
フィールドは必須です。GENRE
フィールドはカテゴリメタデータであり、DESCRIPTION
フィールドはテキストメタデータです。少なくとも 1 つのメタデータフィールドが必要です。最大 100 個のメタデータフィールドを追加できます。CREATION_TIMESTAMP
フィールドは予約済みのキーワードです。スキーマ要件については、「カスタムデータセットとスキーマの要件」を参照してください。
{ "type": "record", "name": "Items", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ITEM_ID", "type": "string" }, { "name": "GENRES", "type": [ "null", "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" }, { "name": "DESCRIPTION", "type": [ "null", "string" ], "textual": true } ], "version": "1.0" }
このスキーマでは、CSVファイル内の履歴データの最初の数行は次のようになります。
ITEM_ID,GENRES,CREATION_TIMESTAMP,DESCRIPTION 1,Adventure|Animation|Children|Comedy|Fantasy,1570003267,"This is an animated movie that features action, comedy, and fantasy. Audience is children. This movie was released in 2004." 2,Adventure|Children|Fantasy,1571730101,"This is an adventure movie with elements of fantasy. Audience is children. This movie was release in 2010." 3,Comedy|Romance,1560515629,"This is a romantic comedy. The movie was released in 1999. Audience is young women." 4,Comedy|Drama|Romance,1581670067,"This movie includes elements of both comedy and drama as well as romance. This movie was released in 2020." ... ...