データフローでモデルを自動的にトレーニングする

Amazon SageMaker Autopilot を使用すると、データフローで変換したデータに対してモデルを自動的にトレーニング、調整、デプロイすることができます。Amazon SageMaker Autopilot では、複数のアルゴリズムを検証して、データに最も適したアルゴリズムを使用できます。Amazon SageMaker Autopilot の詳細については、「SageMaker Autopilot」を参照してください。

モデルをトレーニングして調整すると、Data Wrangler は Amazon SageMaker Autopilot がアクセスできる Amazon S3 の場所にデータをエクスポートします。

Data Wrangler フローでノードを選択し、データプレビューで [エクスポートとトレーニング] を選択すると、モデルの準備とデプロイができます。モデルをトレーニングする前に、この方法を使用してデータセットを確認できます。

データフローから直接モデルをトレーニングしてデプロイすることもできます。

以下の手順では、データフローからモデルを準備してデプロイします。複数行の変換を含む Data Wrangler フローの場合、モデルをデプロイするときに Data Wrangler フローの変換を使用することはできません。次の手順を使用して、推論を実行する前にデータを処理することができます。

データフローから直接モデルをトレーニングしてデプロイするには、次の操作を行います。

トレーニングデータを含むノードの横にある [+] を選択します。
Choose Train model.
（オプション) AWS KMS キーまたは ID を指定します。データを保護するための暗号キーの作成と制御の詳細については、「AWS Key Management Service」を参照してください。
[エクスポートとトレーニング] を選択します。
Amazon SageMaker Autopilot が Data Wrangler がエクスポートしたデータに基づいてモデルをトレーニングした後、[実験名] に名前を指定します。
[入力データ] で [プレビュー] を選択し、Data Wrangler がデータを Amazon SageMaker Autopilot に正しくエクスポートしたことを確認します。
[ターゲット] では、ターゲット列を選択します。
(オプション) [出力データ] の [S3 ロケーション] には、デフォルトの場所以外の Amazon S3 ロケーションを指定します。
[次へ: トレーニング方法] を選択します。
[トレーニング方法] を選択します。詳細については、「トレーニングモード」を参照してください。
(オプション) [自動デプロイエンドポイント] でエンドポイントの名前を指定します。
[デプロイオプション] でデプロイ方法を選択します。データに加えた変換を行うか行わないかにかかわらず、デプロイを選択できます。

重要
Data Wrangler フローで行った変換を使用して Amazon SageMaker Autopilot モデルをデプロイすることはできません。変換の詳細については、「推論エンドポイントへのエクスポート」をご参照ください。
[次へ: 確認と作成] を選択します。
[Create experiment (実験の作成)] を選択します。

モデルの学習とデプロイの詳細については、「AutoML API を使用して表形式データのリグレッションジョブまたは分類ジョブを作成する」を参照してください。Autopilot では、最適なモデルのパフォーマンスに関する分析が表示されます。モデルパフォーマンスの詳細については、「Autopilot モデルのパフォーマンスレポートを表示する」を参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

データとデータ品質に関するインサイトを取得する

データを変換する

データフローでモデルを自動的にトレーニングする

重要