翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
モデル推論を使用してプロンプトを送信し、レスポンスを生成する
推論とは、モデルに提供された入力から出力を生成するプロセスを指します。基盤モデルは確率を使って単語を順番にコンストラクトします。入力が与えられると、モデルはその後に続く可能性のあるトークンのシーケンスを予測し、そのシーケンスを出力として返します。Amazon Bedrock では、選択した基盤モデルで推論を実行できます。推論を実行する場合は、次の情報を指定します。
-
プロンプト — レスポンスを生成するためにモデルに提供される入力。プロンプトの書き方については、「 プロンプトエンジニアリングの概念」を参照してください。プロンプトインジェクション攻撃からの保護については、「」を参照してください迅速なインジェクションセキュリティ。
-
推論パラメータ — モデルのレスポンスを制限したり影響を与えたりするように調整できる値のセット。推論パラメータの詳細については、「推論パラメータによる影響レスポンスの生成」および「基盤モデルの推論パラメータ」を参照してください。
Amazon Bedrock には、以下のモダリティの出力を生成するために使用できる基盤モデルのスイートが用意されています。基盤モデル別のモダリティサポートを確認するには、「」を参照してくださいAmazon Bedrock でサポートされている基盤モデル。
出力モダリティ | 説明 | ユースケースの例 |
---|---|---|
テキスト | テキスト入力を提供し、さまざまなタイプのテキストを生成する | チャット question-and-answering、、ブレインストーミング、要約、コード生成、テーブル作成、データフォーマット、書き換え |
イメージ | テキスト画像または入力画像を提供し、画像を生成または変更する | イメージ生成、イメージ編集、イメージバリエーション |
埋め込み | テキスト、イメージ、またはテキストとイメージの両方を指定し、入力を表す数値のベクトルを生成します。出力ベクトルを他の埋め込みベクトルと比較して、セマンティック類似性 (テキストの場合) または視覚的類似性 (画像の場合) を判断できます。 | テキストとイメージの検索、クエリ、分類、レコメンデーション、パーソナライゼーション、ナレッジベースの作成 |
推論を実行するときは、コンソールでスループットを選択するか、APIリクエストの modelId
フィールドにスループットを指定して、使用するスループットのレベルを指定します。スループットは、処理できる入力トークンと出力トークンの数とレートを定義します。詳細については、「耐障害性と処理能力のスループットを向上させる」を参照してください。
モデル推論は、以下の方法で実行できます。
-
任意の [プレイグラウンド] を使用して、わかりやすいグラフィカルインターフェースで推論を実行できます。
会話型アプリケーションを実装するには、 会話 API ( と ConverseStream) を使用します。https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html
-
InvokeModel または InvokeModelWithResponseStreamリクエストを送信します。
-
必要な設定でプロンプトのデータセットを用意し、
CreateModelInvocationJob
リクエストでバッチ推論を実行します。 -
次の Amazon Bedrock 機能は、モデル推論をより大きなオーケストレーションのステップとして使用します。詳細については、これらのセクションを参照してください。
-
ナレッジベースを設定し、 を送信する RetrieveAndGenerate リクエスト。
-
エージェントをセットアップして を送信する InvokeAgent リクエスト。
-
ベースモデル、カスタムモデル、またはプロビジョニングされたモデルを使用して推論を実行できます。カスタムモデルで推論を実行するには、まずそのモデルのプロビジョンドスループットを購入します (詳細については、「Amazon Bedrock のプロビジョンドスループットでモデル呼び出し容量を増やす」を参照してください)。
これらの方法を使用して、さまざまなプロンプトと推論パラメータを使用して基盤モデルのレスポンスをテストします。これらのメソッドを十分に検討したら、これらの を呼び出してモデル推論を実行するようにアプリケーションを設定できますAPIs。
この方法を通してモデル推論を実行する詳細情報については、トピックを選択してください。エージェントの使用の詳細については、「会話エージェントを使用してアプリケーションのタスクを自動化する」を参照してください。