翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
データ変換
Data Wrangler でデータを変換するには、データフローに変換ステップを追加します。Data Wrangler には、Amazon Personalize マップ列変換など、データの準備に使用できる 300 を超える変換が含まれています。また、一般的な Data Wrangler 変換を使用して、外れ値、型の問題、欠損値などの問題を修正できます。
データの変換が完了したら、Data Wrangler で分析できます。または、Data Wrangler でデータを準備し終えたら、そのデータを処理して Amazon Personalize にインポートできます。データの分析については、「ビジュアライゼーションとデータインサイトの生成」を参照してください。データの処理とインポートについては、「データを処理して Amazon Personalize にインポートする」を参照してください。
Amazon Personalize マッピング列
Amazon Personalize の要件を満たすようにデータを変換するには、Amazon Personalize のマップ列変換を追加し、その列を Amazon Personalize の必須フィールドとオプションフィールドにマッピングします。
Amazon Personalize のマップ列変換を使用するには
-
最新の変換に [+] を選択し、[変換を追加] を選択します。変換をまだ追加していない場合は、データ型変換に [+] を選択してください。Data Wrangler は、この変換をフローに自動的に追加します。
-
[Add step] (ステップを追加) を選択します。
-
[Amazon Personalize の変換] を選択してください。Amazon Personalize のマップ列変換はデフォルトで選択されています。
-
変換フィールドを使用して、データを必要な Amazon Personalize 属性にマッピングします。
-
データに一致するデータセットタイプ (インタラクション、アイテム、ユーザー) を選択します。
-
ドメイン (ECOMMERCE、VIDEO_ON_DEMAND、またはカスタム) を選択します。選択するドメインは、データセットグループを作成したときに指定したドメインと一致する必要があります。
-
Amazon Personalize の必須フィールドとオプションフィールドに一致する列を選択してください。例えば、item_ID 列では、各商品の固有識別情報を格納するデータ内の列を選択します。
各列フィールドはデータタイプによってフィルタ処理されます。Amazon Personalize のデータ型要件を満たすデータ内の列のみを使用できます。データが必要なタイプでない場合は、Parse Value as Type Data Wrangler 変換を使用して変換できます。
-
一般的な Data Wrangler 変換
以下の一般的な Data Wrangler 変換は、Amazon Personalize 用のデータを準備するのに役立ちます。
-
データ型変換: Amazon Personalizeのマップ列変換に使用可能なオプションとしてフィールドが表示されていない場合は、そのデータ型を変換する必要がある場合があります。Data Wrangler 変換の Parse Value as Type は、データの変換に役立ちます。また、フローの作成時に Data Wrangler がデフォルトで追加するデータ型変換を使用することもできます。この変換を使用するには、[タイプ] ドロップダウンリストからデータタイプを選択し、[プレビュー]を選択してから[更新]を選択します。
フィールドに必要なデータ型については、「Amazon Personalize スキーマのスキーマJSONファイルの作成」でドメインとデータセットタイプのセクションを参照してください。
-
欠損値と外れ値の処理:欠損値や外れ値のインサイトを生成した場合は、Data Wrangler 変換「外れ値の処理と欠損値の処理を使用してこれらの問題を解決できます。
-
カスタム変換: Data Wrangler では、Python (ユーザー定義関数)、pandas PySpark、または PySpark () を使用して独自の変換を作成できますSQL。カスタム変換を使用して、重複する列の削除や列によるグループ化などのタスクを実行できます。詳細については、「Amazon SageMaker デベロッパーガイド」の「カスタム変換」を参照してください。