でガードレールを作成する AWS コンソール - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

でガードレールを作成する AWS コンソール

ガードレールを作成するには、設定をセットアップし、拒否するトピックを定義し、有害で機密性の高いコンテンツを処理するフィルターを提供し、プロンプトとユーザーレスポンスがブロックされたときにメッセージを書き込みます。

ガードレールには、プロンプトとユーザーレスポンスがブロックされたときのフィルターとメッセージングが少なくとも 1 つ含まれている必要があります。デフォルトのメッセージングを使用することを選択できます。後で の手順に従ってガードレールに必要なすべてのコンポーネントを設定することでガードレールの変更、フィルターを追加し、ガードレールを反復処理できます。

選択した方法に対応するタブを選択し、ステップに従います。

Console
でガードレールを作成するには AWS コンソール
  1. にサインインする AWS Management Console IAM Amazon Bedrock のアクセス許可を持つ ロールを使用して、 で Amazon Bedrock コンソールを開きますhttps://console.aws.amazon.com/bedrock/

  2. 左側のナビゲーションペインから、ガードレール を選択します。

  3. ガードレール セクションで、ガードレールの作成 を選択します。

  4. ガードレールの詳細を提供するページで、次の操作を行います。

    1. ガードレールの詳細セクションで、ガードレールの名前とオプションの説明を指定します。

    2. ガードレールが呼び出されたときに表示されるプロンプトのブロックされたメッセージを入力します。「レスポンスでガードレールが呼び出されたときに同じメッセージを使用する」のチェックボックスをオンにして、レスポンスで同じメッセージを使用します。

    3. (オプション) デフォルトでは、ガードレールは で暗号化されます。 AWS マネージドキー。 独自のカスタマーマネージドKMSキーを使用するには、KMSキー選択の横にある右矢印を選択し、暗号化設定のカスタマイズ (アドバンスト) チェックボックスを選択します。既存の を選択できます。 AWS KMS キーを指定するか、 の作成を選択します。 AWS KMS 新しいキーを作成するための キー

    4. ガードレール作成オプションでは、毒性フィルターを使用したクイック作成を選択してデフォルト設定を使用するか、独自のガードレールの作成を選択してガードレール設定をカスタマイズします。また、有害性フィルターの表示と編集を選択して、ガードレールフィルターの冒涜的およびプロンプト攻撃フィルターの設定を表示またはカスタマイズすることもできます。

    5. (オプション) ガードレールにタグを追加するには、タグ の横にある右矢印を選択します。次に、新しいタグを追加を選択し、タグのキーと値のペアを定義します。詳細については、「タグを使用してリソースを管理する」を参照してください。

    6. [Next (次へ)] を選択します。

    注記

    ガードレールを作成するには、少なくとも 1 つのフィルターを設定する必要があります。その後、作成 を選択して、他のフィルターの作成をスキップできます。

  5. (オプション) コンテンツフィルターの設定 ページで、 で定義されているカテゴリに関連するコンテンツをどの程度絞り込むかを設定するには、次の手順コンテンツフィルターを使用して有害な単語や会話をブロックするを実行します。

    1. 有害なカテゴリのフィルターを設定するには、有害なカテゴリのフィルターを有効にする を選択します。有害なカテゴリのプロンプト攻撃のフィルターを選択できます。ユーザーがモデルに提供するプロンプトの各フィルターの厳密さを設定します。

    2. プロンプト攻撃のフィルターを設定するには、プロンプト攻撃のフィルターを有効にする を選択します。フィルターでジェイルブレークやプロンプトインジェクション攻撃を検出してブロックする厳密さを設定します。

    3. 作成を選択してガードレールを作成するか、詳細フィルターを使用してフィルター設定をカスタマイズします。

  6. (オプション) 「拒否されたトピックの追加」ページで、拒否されたトピックを追加するか、「スキップして を確認および作成」を選択します。

    1. ブロックするトピックを定義するには、「拒否されたトピックを追加」を選択します。次に、以下の操作を実行します。

      1. トピックの名前を入力します。

      2. トピックの定義ボックスで、トピックを定義します。拒否されたトピックを定義する方法のガイドラインについては、「」を参照してください拒否されたトピックをブロックして有害なコンテンツを削除する

      3. (オプション) このトピックに関連する代表的な入力プロンプトまたはモデルレスポンスを追加するには、「サンプルフレーズを追加」の横にある右矢印を選択します。ボックスにフレーズを入力します。別のフレーズを追加するには、フレーズを追加 を選択します。

      4. 拒否されたトピックの設定が完了したら、確認 を選択します。

    2. 拒否されたトピック を使用して、次のアクションを実行できます。

      • 別のトピックを追加するには、「拒否されたトピックを追加」を選択します。

      • トピックを編集するには、アクション列のトピックと同じ行の 3 つのドットアイコンを選択します。次に、編集 を選択します。編集が完了したら、確認 を選択します。

      • トピックを削除するには、削除するトピックのチェックボックスをオンにします。削除 を選択し、選択した の削除 を選択します。

      • すべてのトピックを削除するには、削除を選択し、すべての を削除を選択します

      • テーブル内の各ページのサイズまたはテーブル内の列表示を設定するには、設定アイコン () を選択します Gear icon representing settings or configuration options. 。設定を行い、確認 を選択します。

    3. 拒否されたトピックの設定が完了したら、次へ を選択します。

  7. (オプション) 単語フィルターの追加ページで、次の操作を行います。

    1. 「冒涜的な表現のフィルタリング」セクションで、「冒涜的な表現のフィルタリング」を選択して、プロンプトとレスポンスの冒涜的な表現をブロックします。冒涜的な言葉のリストは従来の定義に基づいており、継続的に更新されます。

    2. 「カスタム語句の追加」セクションで、ブロックするガードレールの語句を追加する方法を選択します。ファイルをアップロードすることを選択した場合、ファイル内の各行には 1 つの単語または最大 3 つの単語のフレーズを含める必要があります。ヘッダーを含めないでください。次のオプションがあります。

      オプション 手順
      単語とフレーズを手動で追加する 「単語とフレーズの表示と編集」セクションに単語とフレーズを直接追加します
      ローカルファイルからのアップロード 単語とフレーズを含む .txt ファイルまたは .csv ファイルをアップロードするには、このオプションを選択した後、ファイルを選択を選択します。
      Amazon S3 オブジェクトからのアップロード Amazon S3 からファイルをアップロードするには、このオプションを選択してから S3 オブジェクトを指定します。ファイル内の各行には、1 つの単語または最大 3 つの単語のフレーズを含める必要があります。
    3. ガードレールの単語とフレーズを編集して、単語とフレーズの表示と編集セクションでブロックします。次のオプションがあります。

      • ローカルファイルまたは Amazon S3 オブジェクトから単語リストをアップロードした場合、このセクションには単語リストが入力されます。エラーのある項目をフィルタリングするには、エラーを表示 を選択します。

      • 単語リストに項目を追加するには、単語またはフレーズを追加 を選択します。ボックス内に最大 3 つの単語の単語またはフレーズを入力し、Enter キーを押すか、チェックマークアイコンを選択して項目を確認します。

      • 項目を編集するには、項目の横にある編集アイコン ( Edit icon represented by a pencil symbol. ) を選択します。

      • 単語リストから項目を削除するには、ごみ箱アイコン ( Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family. ) を選択するか、項目を編集する場合は項目の横にある削除アイコン ( Close or cancel icon represented by an "X" symbol. ) を選択します。

      • エラーを含む項目を削除するには、すべて削除を選択し、エラーのあるすべての行を削除を選択します。

      • すべての項目を削除するには、すべて削除を選択し、すべての行を削除を選択します。

      • 項目を検索するには、検索バーに式を入力します。

      • エラーのある項目のみを表示するには、すべて表示 というラベルのドロップダウンメニューを選択し、エラーのみ表示 を選択します。

      • テーブル内の各ページのサイズまたはテーブル内の列表示を設定するには、設定アイコン () を選択します Gear icon representing settings or configuration options. 。設定を行い、確認 を選択します。

      • デフォルトでは、このセクションにはテーブルエディタが表示されます。各行に単語またはフレーズを入力できるテキストエディタに切り替えるには、テキストエディタ を選択します。テキストエディタには、次の機能があります。

        • 別のテキストエディタから単語リストをコピーして、このエディタに貼り付けることができます。

        • エラーを含む項目の横に赤い X アイコンが表示され、エディタの下にあるエラーのリストが表示されます。

    4. スキップを選択して確認および作成してガードレールを作成するか、へを選択して PIIおよび正規表現パターンのフィルターを追加します。

  8. (オプション) 「機密情報フィルターの追加」ページで、機密情報をブロックまたはマスクするようにフィルターを設定します。詳細については、「機密情報フィルターを使用して会話PIIから削除する」を参照してください。以下の操作を実行します。

    1. PII タイプセクションで、個人を特定できる情報 (PII) カテゴリをブロックまたはマスクするように設定します。次のオプションがあります。

      • PII タイプを追加するには、PIIタイプの追加 を選択します。次に、以下の操作を実行します。

        1. タイプ 列で、PIIタイプを選択します。

        2. ガードレールの動作列で、ガードレールがPIIタイプを含むコンテンツをブロックするか、識別子でマスクするかを選択します。

      • すべてのPIIタイプを追加するには、PIIタイプを追加 の横にあるドロップダウン矢印を選択します。次に、ガードレールの動作を選択して適用します。

        警告

        動作を指定すると、PIIタイプに設定した既存の動作はすべて上書きされます。

      • PII タイプを削除するには、ごみ箱アイコン () を選択します Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family.

      • エラーを含む行を削除するには、すべて削除を選択し、エラーのあるすべての行を削除を選択します。

      • すべてのPIIタイプを削除するには、すべて削除を選択し、すべての行を削除を選択します。

      • 行を検索するには、検索バーに式を入力します。

      • エラーのある行のみを表示するには、「すべて表示」というラベルのドロップダウンメニューを選択し、「エラーのみを表示」を選択します。

      • テーブル内の各ページのサイズまたはテーブル内の列表示を設定するには、設定アイコン () を選択します Gear icon representing settings or configuration options. 。設定を行い、確認 を選択します。

    2. 正規表現パターンセクションで、正規表現を使用して、フィルタリングするガードレールのパターンを定義します。次のオプションがあります。

      • パターンを追加するには、正規表現パターンの追加 を選択します。次のフィールドを設定します。

        フィールド 説明
        [Name] (名前) パターンの名前
        正規表現パターン パターンを定義する正規表現
        ガードレールの動作 パターンを含むコンテンツをブロックするか、識別子でマスクするかを選択します。ログでのみパターンをマスクするには、なし を選択します。
        説明を追加する (オプション) パターンの説明を記述する
      • パターンを編集するには、アクション列のトピックと同じ行の 3 つのドットアイコンを選択します。次に、編集 を選択します。編集が完了したら、確認 を選択します。

      • パターンを削除するには、削除するパターンのチェックボックスをオンにします。削除 を選択し、選択した の削除 を選択します。

      • すべてのパターンを削除するには、削除 を選択し、次にすべての を削除 を選択します。

      • パターンを検索するには、検索バーに式を入力します。

      • テーブル内の各ページのサイズまたはテーブル内の列表示を設定するには、設定アイコン () を選択します Gear icon representing settings or configuration options. 。設定を行い、確認 を選択します。

    3. 機密情報フィルターの設定が完了したら、へ またはスキップ を選択して、 を確認して作成します

  9. コンテキストに基づくグラウンドの追加 チェックページ (オプション) で、非グラウンド情報または無関係な情報をブロックするようにしきい値を設定します。

    注記

    チェックのタイプごとに、スライダーを移動するか、しきい値を 0 から 0.99 に入力できます。使用する適切なしきい値を選択します。しきい値が高いほど、レスポンスを根拠とする、または高い信頼度で関連性を持たせる必要があります。しきい値を下回るレスポンスはフィルタリングされます。コンテキストのグラウンドチェックの詳細については、「コンテキストのグラウンドチェック」を参照してください。

    1. 「Grounding」フィールドで「Enable grounding check」を選択して、モデルレスポンスがグラウンドされているかどうかを確認します。

    2. 関連性 フィールドで、関連性チェックを有効にする を選択して、モデルレスポンスが関連しているかどうかをチェックします。

    3. [次へ] を選択します。

  10. 確認と作成 — ガードレールの設定を確認します。

    1. 変更するセクションで編集を選択します。

    2. ガードレールの設定に問題がなければ、作成 を選択してガードレールを作成します。

API

ガードレールを作成するには、 CreateGuardrailリクエストを送信します。リクエスト形式は次のとおりです。

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "contentPolicyConfig": { "filtersConfig": [ { "inputStrength": "NONE | LOW | MEDIUM | HIGH", "outputStrength": "NONE | LOW | MEDIUM | HIGH", "type": "SEXUAL | VIOLENCE | HATE | INSULTS | MISCONDUCT | PROMPT_ATTACK" } ] }, "wordPolicyConfig": { "wordsConfig": [ { "text": "string" } ], "managedWordListsConfig": [ { "type": "string" } ] }, "sensitiveInformationPolicyConfig": { "piiEntitiesConfig": [ { "type": "string", "action": "string" } ], "regexesConfig": [ { "name": "string", "description": "string", "regex": "string", "action": "string" } ] }, "description": "string", "kmsKeyId": "string", "name": "string", "tags": [ { "key": "string", "value": "string" } ], "topicPolicyConfig": { "topicsConfig": [ { "definition": "string", "examples": [ "string" ], "name": "string", "type": "DENY" } ] } }
  • ガードレールに namedescription を指定します。

  • ガードレールがプロンプトまたはモデルレスポンスを正常にブロックしたときのメッセージを blockedInputMessagingおよび blockedOutputsMessagingフィールドで指定します。

  • topicPolicy オブジェクトで拒否するガードレールのトピックを指定します。topics リスト内の各項目は 1 つのトピックに関連しています。トピック内のフィールドの詳細については、「トピックhttps://docs.aws.amazon.com/bedrock/latest/APIReference/API_Topic.html」を参照してください。

    • ガードレールがトピックを適切に識別descriptionできるように、 nameと を渡します。

    • action フィールドに DENYを指定します。

    • (オプション) examplesリスト内のトピックに属するものとして分類する例を最大 5 つ指定します。

  • contentPolicy オブジェクトの Amazon Bedrock で定義されている有害なカテゴリのフィルター強度を指定します。filters リスト内の各項目は、有害なカテゴリに関連しています。詳細については、「コンテンツフィルターを使用して有害な単語や会話をブロックする」を参照してください。コンテンツフィルターのフィールドの詳細については、「」を参照してくださいContentFilter

    • type フィールドにカテゴリを指定します。

    • textToTextFiltersForPrompt フィールドの strengthフィールドのプロンプトと の strengthフィールドのモデルレスポンスのフィルターの強度を指定しますtextToTextFiltersForResponse

  • (オプション) ガードレールにタグをアタッチします。詳細については、「タグを使用してリソースを管理する」を参照してください。

  • (オプション) セキュリティのため、 kmsKeyIdフィールドにKMSキーARNの を含めます。

レスポンスの形式は次のとおりです。

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }