翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
カスタムデータセットとスキーマ
カスタムデータセットグループを作成する場合、独自のスキーマを最初から作成します。カスタムデータセットグループのデータセットとスキーマでは、必須フィールドは少ないですが、高い柔軟性があります。以下のトピックでは、カスタムデータセットグループのデータセットのスキーマとデータ要件について説明します。各データセットセクションには、データセットタイプに必要なデータが一覧表示され、スキーマJSONの例が表示されます。
Amazon Personalize が使用できるデータの種類については、「Amazon Personalize が使用できるデータの種類」を参照してください。フォーマット要件や使用可能なフィールドデータ型など、Amazon Personalize スキーマの一般的な要件については、「データのスキーマJSONファイルの作成」を参照してください。これらの要件はすべての Amazon Personalize スキーマに適用されます。
トピック
カスタムデータセットとスキーマの要件
カスタムデータセットグループのデータセットを作成する場合、各データセットタイプには、次の必須フィールドと、必須データタイプの予約済みキーワードがあります。
データセットタイプ | 必須フィールド | 予約済みキーワード |
---|---|---|
アイテムインタラクション (スキーマの例) |
USER_ID ( ITEM_ID ( TIMESTAMP ( |
EVENT_TYPE ( EVENT_VALUE ( IMPRESSION ( RECOMMENDATION_ID ( EVENT_ATTRIBUTION_SOURCE ( |
ユーザー (スキーマの例) |
USER_ID ( 1 つのメタデータフィールド (カテゴリ別 |
|
アイテム (スキーマの例) |
ITEM_ID ( 1 つのメタデータフィールド (カテゴリまたはテキスト |
CREATION_TIMESTAMP ( |
Actions (スキーマの例) |
ACTION_ID ( 1 つのメタデータフィールド (カテゴリ別 |
CREATION_TIMESTAMP ( VALUE ( TYPE ( EXPIRATION_TIMESTAMP ( REPEAT_FREQUENCY ( |
Action interactions (スキーマの例) |
USER_ID ( ACTION_ID ( EVENT_TYPE ( TIMESTAMP ( |
IMPRESSION ( RECOMMENDATION_ID ( |
メタデータフィールド
メタデータには、必須ではない、または予約済みのキーワードを使用しない文字列または非文字列のフィールドが含まれます。メタデータスキーマには、次の制限があります。
-
ユーザー、アイテム、アクションのスキーマには、少なくとも 1 つのメタデータフィールドが必要です。
-
Users スキーマには最大 25 のメタデータフィールドを追加でき、Items スキーマには最大 100 のメタデータフィールドを追加でき、Actions スキーマには最大 10 のメタデータフィールドを追加できます。
-
タイプ
string
の独自のメタデータフィールドを追加する場合は、categorical
属性またはtextual
属性を含める必要があります (アイテムスキーマのみがテキスト属性のフィールドをサポートします)。それ以外の場合、Amazon Personalize は、モデルのトレーニング時にフィールドを使用しません。
予約済みキーワード
予約済みのキーワードはオプションの非メタデータフィールドです。これらのフィールドは、使用時に必須のデータ型としてフィールドを定義する必要があり、キーワードをデータに含める値として使用することができないため、予約済みとみなされます。予約済みカテゴリ文字列フィールドは categorical
が true
に設定されている必要がありますが、予約済み文字列フィールドはカテゴリに設定できません。予約済みキーワードは次のとおりです。
-
EVENT_TYPE: クリックとダウンロードの両方など、1 つ以上のイベントタイプのアイテムインタラクションデータセットの場合は、
EVENT_TYPE
フィールドを使用します。EVENT_TYPE フィールドを として定義する必要がありstring
、カテゴリとして設定することはできません。 -
EVENT_VALUE: ユーザーが視聴した動画の割合など、イベントの値データを含むアイテムインタラクションデータセットの場合は、タイプ
float
とオプションで のEVENT_VALUE
フィールドを使用しますnull
。 -
CREATION_TIMESTAMP: 各アイテムの作成日のタイムスタンプを持つアイテムまたはアクションデータセットの場合は、タイプ の
CREATION_TIMESTAMP
フィールドを使用しますlong
。Amazon Personalize は、CREATION_TIMESTAMP
データを使用してアイテムが存在するようになってからの期間を計算し、それに応じてレコメンデーションを調整します。「作成のタイムスタンプデータ」を参照してください。 -
IMPRESSION: 明示的なインプレッションデータを含むアイテムインタラクションデータセットの場合は、 型
String
とオプションで 型のIMPRESSION
フィールドを使用しますnull
。インプレッションは、ユーザーが特定のアイテムを操作した (例えば、クリックや視聴した) ときに表示されたアイテムのリストです。詳細については、「インプレッションデータ」を参照してください。 -
RECOMMENDATION_ID: 以前のレコメンデーションを暗黙的なインプレッションデータとして使用するアイテムインタラクションデータセットの場合は、オプションで 型
String
と 型のRECOMMENDATION_ID
フィールドを使用しますnull
。レコメンデーションを生成するときに暗黙的なインプレッションを使用するために、Amazon Personalize の
RECOMMENDATION_ID
フィールドを追加する必要はありません。それなしで PutEvents 操作でrecommendationId
を渡すことができます。詳細については、「インプレッションデータ」を参照してください。 -
VALUE: Actions データセットで、アクションの一部またはすべてについてデータに値がある場合は、スキーマに
VALUE
フィールドを追加します。そのタイプについては、long
とオプションでタイプnull
を使用します。アクションとそれらの値の詳細については、「[Value data] (値のデータ)」を参照してください。 -
ACTION_EXPIRATION_TIMESTAMP: Actions データセットで、アクションの一部またはすべての有効期限のタイムスタンプがある場合は、スキーマに
ACTION_EXPIRATION_TIMESTAMP
フィールドを追加します。そのタイプについては、long
とオプションでタイプnull
を使用します。有効期限タイムスタンプの詳細については、「アクション有効期限のタイムスタンプデータ」を参照してください。 -
REPEAT_FREQUENCY: Actions データセットで、アクションの一部またはすべてについて繰り返し頻度データがある場合は、スキーマに
REPEAT_FREQUENCY
フィールドを追加します。そのタイプについては、long
とオプションでタイプnull
を使用します。繰り返し頻度データの詳細については、「繰り返し頻度データ」を参照してください。