Studio でモデルを微調整する

微調整は、トレーニング済みのモデルを新しいデータセットでゼロからトレーニングすることなくトレーニングします。転移学習とも呼ばれるこのプロセスでは、より小さなデータセットを使用し、より短時間のトレーニングで正確なモデルを生成できます。基盤モデルを JumpStart微調整するには、Studio UI のモデル詳細カードに移動します。Studio JumpStart でを開く方法の詳細については、「」を参照してくださいStudio JumpStart でを開いて使用する。選択したモデル詳細カードに移動したら、右上隅のトレーニングを選択します。すべてのモデルで微調整が利用できるわけではありません。

重要

一部の基盤モデルでは、微調整の前にエンドユーザーライセンス契約 (EULA) を明示的に承諾する必要があります。詳細については、「EULA Amazon SageMaker Studio での承諾」を参照してください。

モデル設定

Amazon SageMaker Studio で事前にトレーニングされた JumpStart 基盤モデルを使用する場合、モデルアーティファクトの場所 (Amazon S3 URI) はデフォルトで入力されます。デフォルトの Amazon S3 を編集するにはURI、「モデルアーティファクトの場所を入力」を選択します。すべてのモデルがモデルアーティファクトの場所の変更をサポートしているわけではありません。

データ設定

データフィールドに、トレーニングデータセットの場所への Amazon S3 URIポイントを指定します。デフォルトの Amazon S3 は、トレーニングデータセットの例URIを指します。デフォルトの Amazon S3 を編集するにはURI、「トレーニングデータセットを入力」を選択し、を変更しますURI。トレーニングデータのフォーマットについては、Amazon SageMaker Studio のモデル詳細カードを確認してください。

ハイパーパラメータ

モデルの微調整に使用するトレーニングジョブのハイパーパラメータはカスタマイズが可能です。微調整可能な各モデルで使用できるハイパーパラメータは、モデルによって異なります。

以下のハイパーパラメータはモデル間で共通です。

Epocs (エポック) - 1 エポックは、データセット全体の 1 サイクルです。複数のインターバルで 1 つのバッチとなり、複数のバッチで 1 つのエポックとなります。モデルの精度が許容レベルに達するまで、またはエラー率が許容レベルを下回るまで、複数のエポックが実行されます。
Learning rate (学習レート) - エポック間で変更する値の量です。モデルが改善されるにしたがって、内部の重みが調整され、エラー率がチェックされ、モデルが進化したかどうかがチェックされます。一般的な学習レートは 0.1 または 0.01 です。0.01 は調整幅が非常に小さく、学習が収束するまでに長い時間がかかることがあります。一方、0.1 は非常に大きな値であり、トレーニングがオーバーシュートする可能性があります。モデルトレーニングの調整に使用する主要なハイパーパラメータの 1 つです。テキストモデルの場合、学習レートがはるかに小さい ( の場合は 5e-5BERT) ほど、より正確なモデルになる可能性があることに注意してください。
バッチサイズ – トレーニングGPUsのためにに送信する間隔ごとに選択されるデータセットからのレコードの数。

Studio UI のモデル詳細カードのツールヒントプロンプトと追加情報を確認して、選択したモデルに固有のハイパーパラメータの詳細を確認してください。

使用可能なハイパーパラメータの詳細については、「」を参照してください一般的にサポートされている微調整ハイパーパラメータ。

デプロイ

トレーニングジョブのトレーニングインスタンスタイプと出力アーティファクトの場所を指定します。Studio UI の微調整では、選択したモデルと互換性のあるインスタンスのみを選択できます。デフォルトの出力アーティファクトの場所は SageMaker デフォルトのバケットです。出力アーティファクトの場所を変更するには、出力アーティファクトの場所を入力 を選択し、Amazon S3 を変更しますURI。

セキュリティ

SageMaker モデルのトレーニングに使用するIAMロール、トレーニングジョブを仮想プライベートクラウド (VPC) に接続するかどうか、データを保護するために暗号化キーなど、トレーニングジョブに使用するセキュリティ設定を指定します。

追加情報

追加情報フィールドでは、トレーニングジョブ名を編集できます。また、キーと値のペアの形式でタグを追加および削除して、微調整トレーニングジョブを整理および分類することもできます。

微調整設定の情報を指定したら、「送信」を選択します。微調整するために選択した事前トレーニング済み基盤モデルで、トレーニング前にエンドユーザーライセンス契約 (EULA) の明示的な同意が必要な場合、 EULAはポップアップウィンドウで提供されます。の条件を受け入れるにはEULA、「受け入れる」を選択します。モデルをダウンロードしたり使用したりする前に、適用されるライセンス条項を確認し、準拠して自身のユースケースで使用できるかどうかを確認してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

Studio

Studio でモデルをデプロイする