SageMaker Autopilot - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

SageMaker Autopilot

重要

2023 年 11 月 30 日現在、Autopilot の UI は、更新された Amazon SageMaker Studio エクスペリエンスの一部として Amazon SageMaker Canvas に移行しています。 SageMaker Canvas は、データ準備、機能エンジニアリング、アルゴリズム選択、トレーニングと調整、推論などのタスクに対して、アナリストと市民データサイエンティストにノーコード機能を提供します。ユーザーは、組み込みの視覚化と what-if 分析を活用して、データやさまざまなシナリオを探索できます。自動予測により、モデルを簡単に実稼働化できます。Canvas は、コンピュータビジョン、需要予測、インテリジェント検索、生成 AI など、さまざまなユースケースをサポートしています。

Studio の以前のエクスペリエンスである Amazon SageMaker Studio Classic Amazon SageMaker Studioのユーザーは、Studio Classic で Autopilot UI を引き続き使用できます。コーディング経験のあるユーザーは、技術実装SDKでサポートされている のすべてのAPIリファレンスを引き続き使用できます。

Studio Classic でこれまで Autopilot を使用していて SageMaker 、Canvas に移行する場合は、 SageMaker Canvas アプリケーションを作成して使用できるように、ユーザープロファイルまたはIAMロールに追加のアクセス許可を付与する必要がある場合があります。詳細については、「(オプション) Studio Classic の Autopilot から SageMaker Canvas に移行する」を参照してください。

このガイドのすべての UI 関連の手順は、Amazon SageMaker Canvas に移行する前の Autopilot のスタンドアロン機能に関連しています。これらの手順に従っているユーザーは、Studio Classic を使用する必要があります。

Amazon SageMaker Autopilot は、機械学習モデルの構築とデプロイのプロセスを自動化することで、機械学習ワークフローのさまざまな段階を簡素化および加速する機能セットです (AutoML )。次のページでは、Amazon SageMaker Autopilot に関する重要な情報について説明します。

Autopilot は、Autopilot またはさまざまな程度のヒューマンガイダンスで使用できる以下の主要なタスクを実行します。

  • データ分析と前処理: Autopilot は、特定の問題タイプを識別し、欠落した値を処理し、データを正規化し、特徴量を選択して、全体的にモデルトレーニング用データを準備します。

  • モデルの選択: Autopilot は、さまざまなアルゴリズムを調べ、交差検証リサンプリングテクニックを使用して、事前定義された目標メトリクスに基づいてアルゴリズムの予測品質を評価するメトリクスを生成します。

  • ハイパーパラメータの最適化: Autopilot は、最適なハイパーパラメータ設定の検索を自動化します。

  • モデルトレーニングと評価: Autopilot は、さまざまなモデル候補のトレーニングと評価のプロセスを自動化します。データをトレーニングおよび検証セットに分割し、トレーニングデータを使用して選択したモデル候補をトレーニングし、検証セットの未見データに基づいてパフォーマンスを評価します。最後に、パフォーマンスに基づいて最適化されたモデル候補をランク付けし、最もパフォーマンスの高いモデルを特定します。

  • モデルデプロイ: Autopilot が最高のパフォーマンスのモデルを特定したら、モデルアーティファクトと を公開するエンドポイントを生成してモデルを自動的にデプロイするオプションを提供しますAPI。外部アプリケーションはエンドポイントにデータを送信し、対応する予測や推論を受信することができます。

Autopilot は、最大数百の の大規模なデータセットでの機械学習モデルの構築をサポートしていますGBs。

次の図は、Autopilot によって管理されるこの AutoML プロセスのタスクの概要を示しています。

Amazon SageMaker Autopilot AutoML プロセスの概要。

機械学習プロセスにどれだけ慣れているかとコーディング経験に応じて、さまざまな方法で Autopilot を使用できます。

  • Studio Classic UI を使用すると、ユーザーはノーコードエクスペリエンスまたはある程度の人間による入力を選択できます。

    注記

    Studio Classic UI では、回帰や分類などの問題タイプの表形式データから作成された実験のみを使用できます。

  • AutoML を使用するとAPI、コーディング経験のあるユーザーは を使用して AutoML ジョブSDKsを作成できます。このアプローチにより、柔軟性とカスタマイズオプションが向上し、すべての問題タイプで使用できます。

現在、Autopilot は以下の問題タイプをサポートしています。

注記

表形式データに関連する回帰または分類の問題の場合、ユーザーは Studio Classic ユーザーインターフェイスまたはAPIリファレンス の 2 つのオプションから選択できます。

テキストとイメージの分類、時系列予測、大規模言語モデルの微調整などのタスクは、AutoML のバージョン 2 REST APIでのみ利用できます。選択した言語が Python の場合は、Amazon SageMaker Python の AWS SDK for Python (Boto3)または AutoMLV2 オブジェクトSDKを直接参照できます。

ユーザーインターフェイスの利便性を好むユーザーは、Amazon SageMaker Canvas を使用して、事前トレーニング済みのモデルや生成 AI 基盤モデルにアクセスしたり、特定のテキスト、画像分類、予測ニーズ、生成 AI に合わせてカスタムモデルを作成したりできます。

さらに、Autopilot は、個々の特徴量の重要性を示すレポートを自動的に生成して、モデルが予測を行う方法をユーザーが理解できるようにします。これにより、リスクチームとコンプライアンスチーム、外部規制機関が使用できる、予測に影響を与える要素に関する透明性とインサイトが得られます。また、Autopilot は、評価メトリクスの要約、混同行列、受信者操作特性曲線や適合率-再現率曲線などのさまざまな視覚化を包含するモデルパフォーマンスレポートも提供します。各レポートの具体的なコンテンツは、Autopilot 実験の問題タイプによって異なります。

Autopilot 実験で最適なモデル候補の説明可能性とパフォーマンスレポートは、テキスト、画像、表形式のデータ分類の問題タイプに使用できます。

回帰や分類などの表形式のデータユースケースの場合、Autopilot は、データの探索と最適なパフォーマンスモデルの検索に使用されるコードを含むノートブックを生成することで、データのラングリング方法とモデル候補の選択、トレーニング、チューニング方法をさらに可視化します。これらのノートブックはインタラクティブで探索的な環境を提供し、さまざまな入力の影響や実験におけるトレードオフについて学習するのに役立ちます。Autopilot が提供するデータ探索と候補定義ノートブックに独自の変更を加えることにより、よりパフォーマンスの高いモデル候補でさらに実験することもできます。

Amazon では SageMaker、使用した分に対してのみ料金が発生します。お客様は、使用状況に基づいて、 SageMaker または他の AWS のサービス内の基盤となるコンピューティングリソースとストレージリソースに対して支払います。の使用コストの詳細については SageMaker、「Amazon SageMaker 料金」を参照してください。