データを処理して Amazon Personalize にインポートする - Amazon Personalize

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

データを処理して Amazon Personalize にインポートする

データの分析と変換が完了したら、データを処理して Amazon Personalize にインポートする準備が整います。

  • データの処理 — データを処理すると、変換がデータセット全体に適用され、指定した宛先に出力されます。この場合は、Amazon S3 バケットを指定します。

  • Amazon Personalize へのデータのインポート – 処理されたデータを Amazon Personalize にインポートするには、 SageMaker Studio Classic で提供されている Jupyter Notebook を実行します。このノートブックは Amazon Personalize データセットを作成し、そのデータセットにデータをインポートします。

データの処理

Amazon Personalize にデータをインポートする前に、データセット全体に変換を適用して、Amazon S3 バケットに出力する必要があります。これを行うには、送信先を Amazon S3 バケットに設定して宛先ノードを作成し、変換の処理ジョブを起動します。

送信先を指定し、プロセスジョブを起動する step-by-step 手順については、「Amazon SageMaker Data Wrangler を使用して数回クリックするだけで処理ジョブを起動する」を参照してください。デスティネーションを追加するときは、[Amazon S3] を選択します。この場所は、処理されたデータを Amazon Personalize にインポートするときに使用します。

データの処理が終了すると、Amazon S3 バケットから Amazon Personalize にデータをインポートする準備が整います。

Amazon Personalize にデータをインポートする

データを処理したら、Amazon Personalize にインポートする準備が整います。処理されたデータを Amazon Personalize にインポートするには、 SageMaker Studio Classic で提供されている Jupyter Notebook を実行します。このノートブックは Amazon Personalize データセットを作成し、そのデータセットにデータをインポートします。

処理されたデータを Amazon Personalize にインポートするには
  1. エクスポートしたいトランスフォーメーションについては、[エクスポート先] を選択し、[Amazon Personalize (Jupyter Notebook 経由)] を選択します。

  2. ノートブックを変更して、処理ジョブのデータ送信先として使用した Amazon S3 バケットを指定します。オプションで、データセットグループのドメインを指定します。デフォルトでは、ノートブックはカスタムデータセットグループを作成します。

  3. スキーマを作成しているノートブックのセルを確認してください。セルを実行する前に、スキーマのフィールドが期待どおりのタイプと属性であることを確認してください。

    • NULL データをサポートするフィールドがタイプのリストに null がリストされていることを確認してください。次の例は、フィールドに null を追加する方法を示しています。

      { "name": "GENDER", "type": [ "null", "string" ], "categorical": true }
    • カテゴリフィールドのカテゴリ属性が true に設定されていることを確認します。次の例は、フィールドをカテゴリとしてマークする方法を示しています。

      { "name": "SUBSCRIPTION_MODEL", "type": "string", "categorical": true }
    • テキストフィールドのテキスト属性が true に設定されていることを確認します。次の例は、フィールドをテキストとしてマークする方法を示しています。

      { "name": "DESCRIPTION", "type": [ "null", "string" ], "textual": true }
  4. ノートブックを実行してスキーマを作成し、データセットを作成し、データを Amazon Personalize データセットにインポートします。ノートブックは、 SageMaker Studio Classic の外部にあるノートブックと同じように実行します。Jupyter Notebook の実行について詳しくは、「コードの実行」を参照してください。 SageMaker Studio Classic のノートブックの詳細については、「Amazon デベロッパーガイド」の「Amazon SageMaker Notebooks の使用」を参照してください。 SageMaker

    ノートブックが完成したら、インタラクションデータをインポートすれば、レコメンダーやカスタムリソースを作成できます。または、アイテムデータセットまたはユーザーデータセットでこのプロセスを繰り返すこともできます。