カスタムデータセットとスキーマ - Amazon Personalize

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

カスタムデータセットとスキーマ

カスタムデータセットグループを作成する場合、独自のスキーマを最初から作成します。カスタムデータセットグループのデータセットとスキーマでは、必須フィールドは少ないですが、高い柔軟性があります。以下のトピックでは、カスタムデータセットグループのデータセットのスキーマとデータ要件について説明します。各データセットセクションには、データセットタイプに必要なデータが一覧表示され、スキーマJSONの例が表示されます。

Amazon Personalize が使用できるデータの種類については、「Amazon Personalize が使用できるデータの種類」を参照してください。フォーマット要件や使用可能なフィールドデータ型など、Amazon Personalize スキーマの一般的な要件については、「データのスキーマJSONファイルの作成」を参照してください。これらの要件はすべての Amazon Personalize スキーマに適用されます。

カスタムデータセットとスキーマの要件

カスタムデータセットグループのデータセットを作成する場合、各データセットタイプには、次の必須フィールドと、必須データタイプの予約済みキーワードがあります。

データセットタイプ 必須フィールド 予約済みキーワード
アイテムインタラクション (スキーマの例)

USER_ID (string

ITEM_ID (string

TIMESTAMP (long)

EVENT_TYPE (string)

EVENT_VALUE (float, null)

IMPRESSION (string, null)

RECOMMENDATION_ID (stringnull

EVENT_ATTRIBUTION_SOURCE (string, null)

ユーザー (スキーマの例)

USER_ID (string

1 つのメタデータフィールド (カテゴリ別 string または数値)

アイテム (スキーマの例)

ITEM_ID (string

1 つのメタデータフィールド (カテゴリまたはテキスト string フィールドまたは数値フィールド)

CREATION_TIMESTAMP (long)

Actions (スキーマの例)

ACTION_ID (string

1 つのメタデータフィールド (カテゴリ別 string または数値)

CREATION_TIMESTAMP (long)

VALUE (long, null)

TYPE (string, null)

EXPIRATION_TIMESTAMP (long, null)

REPEAT_FREQUENCY (long, null)

Action interactions (スキーマの例)

USER_ID (string

ACTION_ID (string

EVENT_TYPE (string)

TIMESTAMP (long)

IMPRESSION (string, null)

RECOMMENDATION_ID (stringnull

メタデータフィールド

メタデータには、必須ではない、または予約済みのキーワードを使用しない文字列または非文字列のフィールドが含まれます。メタデータスキーマには、次の制限があります。

  • ユーザー、アイテム、アクションのスキーマには、少なくとも 1 つのメタデータフィールドが必要です。

  • Users スキーマには最大 25 のメタデータフィールドを追加でき、Items スキーマには最大 100 のメタデータフィールドを追加でき、Actions スキーマには最大 10 のメタデータフィールドを追加できます。

  • タイプ string の独自のメタデータフィールドを追加する場合は、categorical 属性または textual 属性を含める必要があります (アイテムスキーマのみがテキスト属性のフィールドをサポートします)。それ以外の場合、Amazon Personalize は、モデルのトレーニング時にフィールドを使用しません。

予約済みキーワード

予約済みのキーワードはオプションの非メタデータフィールドです。これらのフィールドは、使用時に必須のデータ型としてフィールドを定義する必要があり、キーワードをデータに含める値として使用することができないため、予約済みとみなされます。予約済みカテゴリ文字列フィールドは categoricaltrue に設定されている必要がありますが、予約済み文字列フィールドはカテゴリに設定できません。予約済みキーワードは次のとおりです。

  • EVENT_TYPE: クリックダウンロードの両方など、1 つ以上のイベントタイプのアイテムインタラクションデータセットの場合は、 EVENT_TYPEフィールドを使用します。EVENT_TYPE フィールドを として定義する必要がありstring、カテゴリとして設定することはできません。

  • EVENT_VALUE: ユーザーが視聴した動画の割合など、イベントの値データを含むアイテムインタラクションデータセットの場合は、タイプ floatとオプションで の EVENT_VALUE フィールドを使用しますnull

  • CREATION_TIMESTAMP: 各アイテムの作成日のタイムスタンプを持つアイテムまたはアクションデータセットの場合は、タイプ のCREATION_TIMESTAMPフィールドを使用しますlong。Amazon Personalize は、CREATION_TIMESTAMP データを使用してアイテムが存在するようになってからの期間を計算し、それに応じてレコメンデーションを調整します。「作成のタイムスタンプデータ」を参照してください。

  • IMPRESSION: 明示的なインプレッションデータを含むアイテムインタラクションデータセットの場合は、 型Stringとオプションで 型の IMPRESSIONフィールドを使用しますnull。インプレッションは、ユーザーが特定のアイテムを操作した (例えば、クリックや視聴した) ときに表示されたアイテムのリストです。詳細については、「インプレッションデータ」を参照してください。

  • RECOMMENDATION_ID: 以前のレコメンデーションを暗黙的なインプレッションデータとして使用するアイテムインタラクションデータセットの場合は、オプションで 型Stringと 型のRECOMMENDATION_IDフィールドを使用しますnull

    レコメンデーションを生成するときに暗黙的なインプレッションを使用するために、Amazon Personalize の RECOMMENDATION_ID フィールドを追加する必要はありません。それなしで PutEvents 操作で recommendationId を渡すことができます。詳細については、「インプレッションデータ」を参照してください。

  • VALUE: Actions データセットで、アクションの一部またはすべてについてデータに値がある場合は、スキーマに VALUE フィールドを追加します。そのタイプについては、long とオプションでタイプ null を使用します。アクションとそれらの値の詳細については、「[Value data] (値のデータ)」を参照してください。

  • ACTION_EXPIRATION_TIMESTAMP: Actions データセットで、アクションの一部またはすべての有効期限のタイムスタンプがある場合は、スキーマに ACTION_EXPIRATION_TIMESTAMP フィールドを追加します。そのタイプについては、long とオプションでタイプ null を使用します。有効期限タイムスタンプの詳細については、「アクション有効期限のタイムスタンプデータ」を参照してください。

  • REPEAT_FREQUENCY: Actions データセットで、アクションの一部またはすべてについて繰り返し頻度データがある場合は、スキーマに REPEAT_FREQUENCY フィールドを追加します。そのタイプについては、long とオプションでタイプ null を使用します。繰り返し頻度データの詳細については、「繰り返し頻度データ」を参照してください。