Items データセットの要件 (VIDEO_ON_DEMAND domain) - Amazon Personalize

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Items データセットの要件 (VIDEO_ON_DEMAND domain)

Items データセットには、カタログのアイテムに関するメタデータが保存されます。これには、各アイテムについての料金、ジャンル、利用可否などの情報が含まれる場合があります。Amazon Personalize が使用できるアイテムデータの種類については、「アイテムメタデータ」を参照してください。フォーマット要件や使用可能なフィールドデータ型など、Amazon Personalize スキーマの一般的な要件については、「Amazon Personalize スキーマのスキーマJSONファイルの作成」を参照してください。これらの要件は、ドメインに関係なくすべてのスキーマに適用されます。

一部のユースケースでは製品データセットが必要です (「VIDEO_ON_DEMAND ユースケース」を参照)。オプションである場合でも、最も関連性の高いレコメンデーションを取得するために当該レコメンデーションを作成することをお勧めします。Items データセットを作成する場合、スキーマには次のフィールドが含まれている必要があります。

  • ITEM_ID

  • GENRES (カテゴリ別 string

  • CREATION_TIMESTAMP (Unix エポック時間形式)

スキーマには、次の予約済みキーワードを含めることもできます。各キーワードには、必要なデータ型と NULL データをサポートするかどうかが記載されています。NULL タイプの追加は任意です。

  • PRICE (浮動小数点)

  • DURATION (浮動小数点)

  • GENRE_L2 (カテゴリ別 stringnull

  • GENRE_L3 (カテゴリ別 stringnull

  • AVERAGE_RATING (float, null)

  • PRODUCT_DESCRIPTION (テキスト stringnull

  • CONTENT_OWNER (カテゴリ別 stringnull): 動画を所有する会社。例えば、値は HBO、Paramount、 などですNBC。

  • CONTENT_CLASSIFICATION (カテゴリ別 stringnull): コンテンツの評価。例えば、値は G、PG、PG-13、R、NC-17、および未評価の場合があります。

最良のレコメンデーションを取得するには、これらのフィールドをデータと同じ数だけスキーマに保持することをお勧めします。インポートするデータは、スキーマと一致している必要があります。メタデータ列の最大数は 100 です。ユースケースとデータに応じて、さらにフィールドを追加することができます。フィールドが必須または予約済みとして記載されておらず、データ型が スキーマのデータ型 に記載されている限り、フィールド名とデータ型は自由に設定できます。

複数のマルチレベルカテゴリを持つ項目には、予約キーワード GENRE_L2 と GENRE_L3 を使用します。詳細については、「カテゴリ別データを使用する」を参照してください。テキストおよびカテゴリのメタデータについては、「トレーニング用のアイテムメタデータの準備」を参照してください。ECOMMERCE ドメインの Items データセットのデフォルトスキーマの例については、「」を参照してくださいデフォルトアイテムスキーマ (VIDEO_ON_DEMAND ドメイン)

カテゴリ別データを使用する

カテゴリデータを使用するには、タイプ string のフィールドを追加し、スキーマでフィールドのカテゴリ属性を true に設定します。次に、カテゴリデータを一括CSVファイルと個々の項目のインポートに含めます。カテゴリ値には、最大 1,000 文字を使用できます。1,000 文字を超えるカテゴリ値を持つアイテムがある場合、データセットのインポートジョブは失敗します。

複数のカテゴリを持つアイテムについては、バーティカルバー「|」を使用して各値を区切ります。例えば、GENRESフィールドの場合、項目のデータは になりますAction|Crime|Biopic。複数のレベルのカテゴリデータがあり、階層内の各レベルに複数のカテゴリを持つ項目がある場合は、各レベルにフィールドを追加し、各フィールド名の後にレベルインジケータを追加します: GENRES、GENRE_L2、GENRE_L3。これにより、アイテムが複数のマルチレベルカテゴリに属している場合でも、サブカテゴリに基づいてレコメンデーションをフィルタ処理できます。例えば、動画にはカテゴリレベルごとに次のデータが含まれている場合があります。

  • GENRES: Action|Adventure

  • GENRE_L2: 犯罪|西部

  • GENRE_L3: biopic

この例では、動画はアクション > 犯罪 > バイオピックの階層、およびアドベンチャー > ウエスタン > バイオピックの階層です。L3 まで使用することをお勧めしますが、必要に応じてもっと多くのレベルを使用できます。フィルターの作成と使用については、「レコメンデーションとユーザーセグメントのフィルタリング」を参照してください。

デフォルトアイテムスキーマ (VIDEO_ON_DEMAND ドメイン)

以下は、VIDEO_ON_DEMAND ドメインの Items データセットのデフォルトスキーマです。

{ "type": "record", "name": "Items", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ITEM_ID", "type": "string" }, { "name": "GENRES", "type": [ "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" } ], "version": "1.0" }