Amazon SageMaker Data Wrangler を使用したバルクデータの準備とインポート - Amazon Personalize

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon SageMaker Data Wrangler を使用したバルクデータの準備とインポート

重要

Data Wrangler を使用すると、 SageMaker コストが発生します。料金と料金の完全なリストについては、Amazon SageMaker 料金表の Data Wrangler タブを参照してください。追加料金が発生しないように、使用が終了したら Data Wrangler インスタンスをシャットダウンしてください。詳細については、「Data Wrangler をシャットダウンする」を参照してください。

データセットグループを作成したら、Amazon SageMaker Data Wrangler (Data Wrangler) を使用して、40 以上のソースから Amazon Personalize データセットにデータをインポートできます。Data Wrangler は、データをインポート、準備、変換、分析するための end-to-end ソリューションを提供する Amazon SageMaker Studio Classic の機能です。Data Wrangler を使用してデータを準備し、アクションデータセットまたはアクションインタラクションデータセットにインポートすることはできません。

Data Wrangler を使用してデータを準備してインポートする場合は、データフローを使用します。データフローは、データのインポートから始まる一連の機械学習データ準備ステップを定義します。フローにステップを追加するたびに、Data Wrangler はデータの変換やビジュアライゼーションの生成などのアクションをデータに対して実行します。

Amazon Personalize のデータを準備するためにフローに追加できるいくつかのステップを以下に示します。

  • インサイト: Amazon Personalize 固有のインサイトステップをフローに追加できます。これらのインサイトは、データについて、またデータを改善するために実行できるアクションについて知るのに役立ちます。

  • ビジュアライゼーション: ビジュアライゼーションステップを追加して、ヒストグラムや散布図などのグラフを生成できます。グラフは、外れ値や欠損値など、データ内の問題を発見するのに役立ちます。

  • 変換: Amazon Personalize 固有の変換ステップと一般的な変換ステップを使用して、データが Amazon Personalize の要件を満たしていることを確認できます。Amazon Personalize 変換は、Amazon Personalize データセットタイプに応じてデータ列を必要な列にマッピングするのに役立ちます。

Amazon Personalize にデータをインポートする前に Data Wrangler を終了する必要がある場合は、Amazon Personalize コンソールから Data Wrangler を起動するときに同じデータセットタイプを選択することで、中断したところに戻ることができます。または、 SageMaker Studio Classic から Data Wrangler に直接アクセスできます。

以下のように、Data Wrangler から Amazon Personalize にデータをインポートすることをお勧めします。変換、視覚化、分析のステップはオプションで繰り返し可能で、どの順序でも実行できます。

  1. アクセス許可の設定 - Amazon Personalize と SageMaker サービスロールのアクセス許可を設定します。そして、ユーザーの許可を設定します。

  2. Amazon Personalize コンソールから SageMaker Studio Classic で Data Wrangler を起動する - Amazon Personalize コンソールを使用して SageMaker ドメインを設定し、 SageMaker Studio Classic で Data Wrangler を起動します。

  3. Data Wrangler へのデータのインポート - 40 以上のソースから Data Wrangler にデータをインポートします。ソースには以下が含まれます。 AWS Amazon Redshift、Amazon 、EMRAmazon Athena などの サービス、および Snowflake や などのサードパーティー DataBricks。

  4. データの変換 - Data Wrangler を使用して、Amazon Personalize の要件を満たすようにデータを変換します。

  5. データの視覚化と分析 - Data Wrangler を使用してデータを視覚化し、Amazon Personalize 固有のインサイトを通じて分析します。

  6. Amazon Personalize へのデータの処理とインポート - SageMaker Studio Classic Jupyter Notebook を使用して、処理されたデータを Amazon Personalize にインポートします。

追加情報

以下のリソースは、Amazon SageMaker Data Wrangler と Amazon Personalize の使用に関する追加情報を提供します。