翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon Bedrock モデル抽出の前提条件
モデル抽出ジョブを開始する前に、次の前提条件を完了します。
-
教師モデルを決定する
学生モデルよりも大幅に大きく、能力が高く、ユースケースで達成したい精度を持つ教師モデルを選択します。抽出ジョブをより効果的にするには、ユースケースと同様のタスクでトレーニング済みのモデルを選択します。Amazon Bedrock でサポートされている教師モデルの詳細については、「」を参照してくださいAmazon Bedrock モデル抽出でサポートされているモデルとリージョン。
-
学生モデルを決定する
サイズが大幅に小さい学生モデルを選択します。Amazon Bedrock がサポートする学生モデルの詳細については、「」を参照してくださいAmazon Bedrock モデル抽出でサポートされているモデルとリージョン。
-
入力データセットを準備する
カスタムモデルの入力データセットを準備するには、
.jsonl
ファイルを作成します。各行はレコードに対応する JSON オブジェクトです。作成するファイルは、選択したカスタマイズ方法とモデルの形式に沿っており、その中のレコードは、サイズ要件を満たしている必要があります。注記
Anthropic または MetaLlamaモデルを使用している場合は、このステップを続行します。
抽出にAmazon Novaモデルを使用している場合は、次のガイドラインを参照してから、ステップ 4 に進みます。
入力データをプロンプトとして指定します。Amazon Bedrock は、入力データを使用して教師モデルからレスポンスを生成し、生成されたレスポンスを使用して学生モデルを微調整します。Amazon Bedrock が使用する入力の詳細と、ユースケースに最適なオプションを選択する方法については、「」を参照してくださいAmazon Bedrock モデル抽出の仕組み。
入力データセットを準備する手順については、ユースケースに最適なオプションを選択します。
オプション 1: 独自のプロンプトを提供する
プロンプトを収集し、JSON Line (JSONL) 形式で保存します。JSONL の各レコードは、次の構造を使用する必要があります。
-
値 を持つ必要がある
schemaVersion
フィールドを含めますbedrock-conversion-2024
。 -
〔オプション] モデルに割り当てられたロールを示すシステムプロンプトを含めます。
-
messages
フィールドに、モデルに提供される入力プロンプトを含むユーザーロールを含めます。 -
〔オプション]
messages
フィールドに、必要なレスポンスを含むアシスタントロールを含めます。
プレビューリリースではAnthropic、 Meta Llama モデルがサポートする会話プロンプトは 1 回のみとなります。つまり、ユーザープロンプトは 1 回しか使用できません。このAmazon Novaモデルはマルチターン会話をサポートしているため、1 つのレコード内で複数のユーザーとアシスタントの交換を提供できます。
形式例
{ "schemaVersion": "bedrock-conversation-2024", "system": [ { "text": "A chat between a curious User and an artificial intelligence Bot. The Bot gives helpful, detailed, and polite answers to the User's questions." } ], "messages": [ { "role": "user", "content": [ { "text": "why is the sky blue" } ] }, { "role": "assistant" "content": [ { "text": "The sky is blue because molecules in the air scatter blue light from the Sun more than other colors." } ] } ] }
オプション 2: 呼び出しログを使用する
モデル抽出に呼び出しログを使用するには、モデル呼び出しログをオンに設定し、モデル呼び出しオペレーションのいずれかを使用して、ログの送信先として Amazon S3 バケットが設定されていることを確認します。モデル抽出ジョブを開始する前に、ログにアクセスするための Amazon Bedrock アクセス許可を付与する必要があります。呼び出しログの設定の詳細については、Amazon CloudWatch Logs を使用してモデル呼び出しをモニタリングする」を参照してください。
このオプションでは、Amazon Bedrock でプロンプトのみを使用するか、呼び出しログのプロンプトとレスポンスのペアを使用するかを指定できます。Amazon Bedrock でプロンプトのみを使用する場合、Amazon Bedrock は独自のデータ合成手法を追加して、教師モデルから多様で高品質のレスポンスを生成する場合があります。Amazon Bedrock でプロンプトとレスポンスのペアを使用する場合、Amazon Bedrock は教師モデルからのレスポンスを再生成しません。Amazon Bedrock は、呼び出しログからのレスポンスを直接使用して、学生モデルを微調整します。
重要
Amazon Bedrock に最大 15K00 個のプロンプトまたはプロンプトとレスポンスのペアを提供して、学生モデルを微調整できます。学生モデルが特定の要件を満たすように微調整されるようにするには、以下を強くお勧めします。
-
Amazon Bedrock でプロンプトのみを使用する場合は、すべてのモデルで から少なくとも 100 個のプロンプトとレスポンスのペアが生成されていることを確認してください。
-
Amazon Bedrock で呼び出しログからのレスポンスを使用する場合は、選択した教師モデルと完全に一致する呼び出しログのモデルから少なくとも 100 個のプロンプトとレスポンスのペアが生成されていることを確認してください。
必要に応じて、モデル呼び出しオペレーションのいずれかを使用して呼び出しログのプロンプトとレスポンスのペアにリクエストメタデータを追加し、後でそれを使用してログをフィルタリングできます。Amazon Bedrock は、フィルタリングされたログを使用して学生モデルを微調整できます。
複数のリクエストメタデータを使用してログをフィルタリングするには、単一のオペレーションブール演算子 AND、OR、または NOT を使用します。オペレーションを組み合わせることはできません。単一リクエストメタデータフィルタリングには、ブール演算子 NOT を使用します。
-
-
適切なアクセス許可を持つ IAM サービスロールがまだない場合は、「」の手順に従ってロールCreate a service role for model customizationを設定することで、適切なアクセス許可を持つ新しい custom AWS Identity and Access Management (IAM) サービスロールを作成します。を使用してサービスロールを自動的に作成する場合は AWS Management Console 、この前提条件をスキップできます。
-
(オプション) 追加のセキュリティ設定を行います。
-
カスタムモデルに対して行われた入出力データ、カスタムジョブ、推論リクエストを暗号化できます。詳細については、「モデルのカスタマイズジョブとアーティファクトの暗号化」を参照してください。
-
仮想プライベートクラウド (VPC) を作成すると、カスタムジョブを保護することができます。詳細については、「(オプション) VPC を使用してモデルのカスタマイズジョブを保護する」を参照してください。
-