翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker AI Data Wrangler を使用したバルクデータの準備とインポート
重要
Data Wrangler を使用すると、SageMaker AI のコストが発生します。料金と料金の完全なリストについては、Amazon SageMaker AI 料金
データセットグループを作成したら、Amazon SageMaker AI Data Wrangler (Data Wrangler) を使用して、40 以上のソースから Amazon Personalize データセットにデータをインポートできます。Data Wrangler は Amazon SageMaker AI Studio Classic の機能であり、end-to-endのソリューションを提供します。Data Wrangler を使用してデータを準備し、アクションデータセットまたはアクションインタラクションデータセットにインポートすることはできません。
Data Wrangler を使用してデータを準備してインポートする場合は、データフローを使用します。データフローは、データのインポートから始まる一連の機械学習データ準備ステップを定義します。フローにステップを追加するたびに、Data Wrangler はデータの変換やビジュアライゼーションの生成などのアクションをデータに対して実行します。
Amazon Personalize のデータを準備するためにフローに追加できるいくつかのステップを以下に示します。
-
インサイト: Amazon Personalize 固有のインサイトステップをフローに追加できます。これらのインサイトは、データについて、またデータを改善するために実行できるアクションについて知るのに役立ちます。
-
ビジュアライゼーション: ビジュアライゼーションステップを追加して、ヒストグラムや散布図などのグラフを生成できます。グラフは、外れ値や欠損値など、データ内の問題を発見するのに役立ちます。
-
変換: Amazon Personalize 固有の変換ステップと一般的な変換ステップを使用して、データが Amazon Personalize の要件を満たしていることを確認できます。Amazon Personalize 変換は、Amazon Personalize データセットタイプに応じてデータ列を必要な列にマッピングするのに役立ちます。
Amazon Personalize にデータをインポートする前に Data Wrangler を終了する必要がある場合は、Amazon Personalize コンソールから Data Wrangler を起動するときに同じデータセットタイプを選択することで、中断したところに戻ることができます。または、SageMaker AI Studio Classic から直接 Data Wrangler にアクセスできます。
以下のように、Data Wrangler から Amazon Personalize にデータをインポートすることをお勧めします。変換、視覚化、分析のステップはオプションで繰り返し可能で、どの順序でも実行できます。
-
アクセス許可の設定 - Amazon Personalize と SageMaker AI サービスロールのアクセス許可を設定します。そして、ユーザーの許可を設定します。
-
Amazon Personalize コンソールから SageMaker AI Studio Classic で Data Wrangler を起動する - Amazon Personalize コンソールを使用して SageMaker AI ドメインを設定し、SageMaker AI Studio Classic で Data Wrangler を起動します。
-
Data Wrangler へのデータのインポート - 40 以上のソースから Data Wrangler にデータをインポートします。ソースには、Amazon Redshift、Amazon EMR、Amazon Athena などの AWS サービスや、Snowflake や DataBricks などのサードパーティーが含まれます。
-
データの変換 - Data Wrangler を使用して、Amazon Personalize の要件を満たすようにデータを変換します。
-
データの視覚化と分析 - Data Wrangler を使用してデータを視覚化し、Amazon Personalize 固有のインサイトを通じて分析します。
-
データを処理して Amazon Personalize にインポートする - SageMaker AI Studio Classic Jupyter Notebook を使用して、処理したデータを Amazon Personalize にインポートします。
追加情報
以下のリソースでは、Amazon SageMaker AI Data Wrangler と Amazon Personalize の使用に関する追加情報を提供します。
-
サンプルデータセットの処理と変換のチュートリアルについては、Amazon SageMaker AI デベロッパーガイド」の「デモ: Data Wrangler Titanic データセットのチュートリアル」を参照してください。このチュートリアルでは、Data Wrangler のフィールドと機能を紹介します。
-
Amazon SageMaker AI ドメインへのオンボーディングの詳細については、Amazon SageMakerデベロッパーガイド」の「Amazon SageMaker AI ドメインへのクイックオンボード」を参照してください。 Amazon SageMaker
-
Amazon Personalize データの要件については、「Amazon Personalize のトレーニングデータの準備」を参照してください。