トレーニング用のアクションメタデータの準備 - Amazon Personalize

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

トレーニング用のアクションメタデータの準備

アクションは、ユーザーに推奨できるエンゲージメントアクティビティまたは収益創出アクティビティです。アクションには、モバイルアプリのインストール、会員プロフィールの記入、ロイヤルティプログラムへの加入、プロモーションメールへの登録などがあります。アクションに関するデータを Amazon Personalize の Actions データセットにインポートします。アクションのデータの例としては、アクションの一意の ID、アクションの推定値、アクションの有効期限タイムスタンプなどがあります。

Next-Best-Action を使用する場合は、アクションメタデータをインポートする必要があります。このレシピを使用すると、Amazon Personalize は Actions データセットにインポートしたアクションから次に最適なアクションを予測します。アクションメタデータを使用するレシピやユースケースは他にありません。ドメインデータセットグループで Actions データセットを作成することはできません。

トレーニング時に、Amazon Personalize はアクションタイトルやタグなど、カテゴリ以外の文字列アクションデータを使用しません。ただし、このデータをインポートしてもレコメンデーションは強化されます。詳細については、「非カテゴリ別文字列データ」を参照してください。

一括アクションデータは CSV ファイルにある必要があります。ファイル内の各行は、一意のアクションを表す必要があります。データの準備が完了したら、スキーマJSONファイルを作成する準備が整います。このファイルは、データの構造を Amazon Personalize に伝えます。詳細については、「Amazon Personalize スキーマのスキーマJSONファイルの作成」を参照してください。

以下のセクションでは、Amazon Personalize のアクションメタデータを準備する方法について詳しく説明します。すべてのタイプのデータに関するバルクデータ形式のガイドラインについては、「バルクデータ形式のガイドライン」を参照してください。

アクションデータの要件

Amazon Personalize のアクションデータ要件は次のとおりです。

  • 各アクションの一意の識別子を保存する ACTION_ID 列が必要です。すべてのアクションには項目 ID が必要です。string 最大長が 256 文字の である必要があります。

  • データには、少なくとも 1 つのカテゴリ文字列または数値メタデータ列が必要です。アクションメタデータ列には、空/null 値を含めることができます。これらの列は 70% 以上完了することをお勧めします。

  • モデルトレーニング中に、Amazon Personalize は最大 1000 アクションを考慮します。1000 を超えるアクションをインポートした場合、Amazon Personalize は、新しいアクション (最近追加し、インタラクションのないアクション) と最近のインタラクションデータがある既存のアクションを優先して、トレーニングに含めるアクションを決定します。

  • 最大列数は 10 です。

アクション有効期限のタイムスタンプデータ

アクションの有効期限タイムスタンプは、アクションが無効になる日付を指定します。アクション有効期限のタイムスタンプデータは Unix エポックタイム形式 (秒単位) で指定します。アクションの有効期限が切れている場合、Amazon Personalize はそのアクションをレコメンデーションに含めません。

アクションがレコメンデーションに表示されるのを特定の期間に制限する場合は、アクションの有効期限タイムスタンプを指定してください。例えば、特定の月にメンバーシップドライブを実行するアプリケーションがあるとします。その月の月末に登録アクションの有効期限タイムスタンプを設定するとよいでしょう。この日付になると、Amazon Personalize はこのアクションの推奨を自動的に停止します。

新しいアクションの有効期限タイムスタンプを過去の時刻に設定したり、アクションのタイムスタンプを過去の時刻に更新したりすると、そのアクションがレコメンデーションから削除されるまでに最大 2 時間かかることがあります。

繰り返し頻度データ

繰り返し頻度データは、Action インタラクションデータセット内のユーザーの履歴に基づいて、ユーザーが特定のアクションとやり取りした後、Amazon Personalize がその特定のアクションを推奨するまで待機する日数を指定します。アクションの繰り返し頻度を日単位で指定できます。最大値は 30 日です。

例えば、各ユーザーがアカウントとプロファイルを作成する e コマースアプリケーションがあるとします。complete profile アクションがあり、ユーザーがそのアクションを操作してから 1 週間待ってから再び推奨する場合は、アクションの REPEAT_FREQENCY として 7 日を指定します。7 日後、Amazon Personalize はそのアクションの推奨を検討し始めます。

アクションの繰り返し頻度を指定しなかった場合、Amazon Personalize はレコメンデーションに表示される回数に制限を設けません。

[Value data] (値のデータ)

バリューデータとは、各アクションのビジネス価値または重要性です。アクションの value は 1~10 の範囲であり、10 はデータセット内で最も価値のあるアクションです。

例えば、ベーシックサブスクリプションへの登録用とプレミアムサービスへの登録用の 2 つのアクションがあるとします。ベーシックサービスについては 5 の値を指定し、プレミアムサービスについては 10 の値を指定することができます。

Amazon Personalize は、ユーザーに推奨する最適なアクションを決定する際に、値データを 1 つの入力として使用します。例えば、ユーザーがあるアクションを実行する可能性と別のアクションを実行する可能性が同じ場合、Amazon Personalize は、値が最も高いアクションをレコメンデーションで上位にランク付けします。

作成のタイムスタンプデータ

Amazon Personalize は、作成タイムスタンプデータ (Unix エポック時間形式 (秒)) を使用して、アクションが存在するようになってからの期間を計算し、それに応じてレコメンデーションを調整します。

作成タイムスタンプデータがない場合、Amazon Personalize はすべてのアクションインタラクションデータからこの情報を推測します。アクションの最も古いインタラクションデータのタイムスタンプをアクションの作成タイムスタンプとして使用します。アイテムにインタラクションデータがない場合、その作成タイムスタンプはトレーニングセット内の最新のインタラクションのタイムスタンプとして設定され、Amazon Personalize はそれを新しいアクションとみなします。

カテゴリ別メタデータ

Amazon Personalize は、ユーザーにとって最適なアクションを明らかにする基本的なパターンを識別する際に、季節性やアクションの排他性などのカテゴリ別メタデータを使用します。ユースケースに基づいて独自の値の範囲を定義します。カテゴリメタデータはどの言語でもかまいません。

カテゴリ別データをインポートし、それを使用してアクションの属性に基づいてレコメンデーションをフィルタリングできます。フィルタリングのレコメンデーションについては、「レコメンデーションとユーザーセグメントのフィルタリング」を参照してください。

カテゴリ値には、最大 1,000 文字まで入力できます。1,000 文字を超えるカテゴリ値を持つアクションがある場合、データセットのインポートジョブは失敗します。

非カテゴリ別文字列データ

アクション を除きIDs、Amazon Personalize はトレーニング時に、アクションの名前、アクションに関するキーワード、タグなど、カテゴリ以外の文字列データを使用しません。ただし、Amazon Personalize はレコメンデーションをフィルタリングするときに使用できます。フィルターを作成して、非カテゴリ文字列データに基づいてレコメンデーションにアクションを含めたり、レコメンデーションから削除したりできます。フィルターの詳細については、「レコメンデーションとユーザーセグメントのフィルタリング」を参照してください。非カテゴリ値は最大 1000 文字です。

Actions メタデータの例

CSV ファイルの最初の数行のアクションメタデータは、次のようになります。

ACTION_ID,VALUE,MEMBERSHIP_LEVEL,CREATION_TIMESTAMP,REPEAT_FREQUENCY 1,10,Deluxe|Premium,1510003267,7 2,5,Basic,1580003267,7 3,5,Preview,1590003267,3 4,10,Deluxe|Platinum,1560003267,4 ... ...

ACTION_ID 列は必須です。MEMBERSHIP_LEVEL 列はカテゴリ文字列フィールドです。VALUECREATION_TIMESTAMP、および REPEAT_FREQUENCY フィールドは、必要なタイプの予約キーワードです。

データの準備が完了したら、スキーマJSONファイルを作成する準備が整います。このファイルは、データの構造を Amazon Personalize に伝えます。詳細については、「Amazon Personalize スキーマのスキーマJSONファイルの作成」を参照してください。上記のサンプルデータでは、スキーマJSONファイルはこのように表示されます。

{ "type": "record", "name": "Actions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ACTION_ID", "type": "string" }, { "name": "VALUE", "type": [ "null", "long" ] }, { "name": "MEMBERSHIP_LEVEL", "type": [ "null", "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" }, { "name": "REPEAT_FREQUENCY", "type": [ "long", "null" ] } ], "version": "1.0" }