ガードレールを作成する - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ガードレールを作成する

ガードレールを作成するには、設定のセットアップ、拒否するトピックの定義、有害で機密性の高いコンテンツを処理するフィルターの指定、プロンプトとユーザーのレスポンスがブロックされたときのメッセージの記述を行います。

ガードレールには、プロンプトとユーザーのレスポンスがブロックされたときのフィルターとメッセージングが少なくとも 1 つ含まれている必要があります。デフォルトのメッセージングを使用することもできます。「ガードレールを変更する」の手順に従い、ガードレールに必要なすべてのコンポーネントを設定して、フィルターを追加し、ガードレールで後から反復処理できます。

任意の方法のタブを選択し、ステップに従います。

Console
AWS コンソールでガードレールを作成するには
  1. Amazon Bedrock アクセス許可を持つ IAM ロール AWS Management Console を使用して にサインインし、https://console.aws.amazon.com/bedrock/ で Amazon Bedrock コンソールを開きます。

  2. 左のナビゲーションペインから [ガードレール] を選択します。

  3. [ガードレール] セクションで、[ガードレールを作成] を選択します。

  4. [ガードレールの詳細を提供] ページで、以下の作業を行います。

    1. [ガードレールの詳細] セクションで、ガードレールの [名前] とオプションの [説明] に入力します。

    2. ガードレールが呼び出されたときに表示される [ブロックされたプロンプトのメッセージを表示] に入力します。[ブロックされた同じメッセージをレスポンスで使用する] チェックボックスをオンにして、応答でガードレールが呼び出されたときに同じメッセージを使用します。

    3. (オプション) デフォルトでは、ガードレールは で暗号化されます AWS マネージドキー。独自のカスタマーマネージド KMS キーを使用するには、[KMS キーの選択] の横にある右矢印を選択して、[暗号化設定のカスタマイズ (高度)] チェックボックスをオンにします。既存の AWS KMS キーを選択するか、 キーの作成を選択して新しい AWS KMS キーを作成できます。

    4. ガードレール作成オプションでは、[有害性フィルターを使用したクイック作成] を選択してデフォルト設定を使用するか、[独自のガードレールを作成] を選択してガードレール設定をカスタマイズします。また、[有害性フィルターの表示と編集] を選択して、ガードレールフィルターの冒涜的な表現とプロンプト攻撃フィルターの設定を表示またはカスタマイズすることもできます。

    5. (オプション) ガードレールにタグを追加するには、[タグ] の横にある右矢印を選択します。次に、[新しいタグを追加] を選択し、タグのキーと値のペアを定義します。詳細については、「Amazon Bedrock リソースにタグ付け」を参照してください。

    6. [Next (次へ)] を選択します。

    注記

    ガードレールを作成するには、1 つ以上のフィルターを設定する必要があります。次に、[作成] を選択して、他のフィルターの作成をスキップできます。

  5. (オプション) [コンテンツフィルターの設定] ページで、次の手順を実行して、「コンテンツフィルターを使用して有害な単語や会話をブロックする」で定義されているカテゴリに関連するコンテンツをフィルタリングする強度を設定します。

    1. 有害なカテゴリのフィルターを設定するには、有害なカテゴリフィルターを設定するを選択します。テキストまたはイメージを選択して、プロンプトまたはモデルへのレスポンスからテキストまたはイメージコンテンツをフィルタリングします。各カテゴリに適用するフィルターのレベルには、なし、低、中、または高を選択します。プロンプトまたはレスポンスに対して異なるフィルターレベルを持つように選択できます。有害なカテゴリのプロンプト攻撃のフィルターを選択できます。ユーザーがモデルに提供するプロンプトに対して、各フィルターの厳格度レベルを設定します。

    2. プロンプト攻撃のフィルターを設定するには、[プロンプト攻撃フィルターを有効にする] を選択します。ジェイルブレイクおよびプロンプトインジェクション攻撃を検出してブロックするフィルターの厳格度レベルを設定します。

    3. 作成を選択してガードレールを作成するか、詳細フィルターを使用してフィルター設定をカスタマイズします。

  6. (オプション) [拒否されたトピックを追加] ページで、拒否されたトピックを追加するか、[スキップして確認および作成] を選択します。

    1. ブロックするトピックを定義するには、[拒否されたトピックを追加] を選択します。次に、以下の操作を実行します。

      1. トピックの名前を入力します。

      2. [トピックの定義] ボックスで、トピックを定義します。拒否されたトピックを定義する方法のガイドラインについては、「拒否トピックをブロックして有害コンテンツの除去に役立てる」を参照してください。

      3. (オプション) このトピックに関連する代表的な入力プロンプトまたはモデルレスポンスを追加するには、[サンプルフレーズを追加] の横にある右矢印を選択します。ボックスにフレーズを入力します。別のフレーズを追加するには、[フレーズを追加] を選択します。

      4. 拒否されたトピックの設定が完了したら、[確認] を選択します。

    2. [拒否されたトピック] を使用すると、次のアクションを実行できます。

      • 別のトピックを追加するには、[拒否されたトピックを追加] を選択します。

      • トピックを編集するには、[アクション] 列のトピックと同じ行にある 3 つのドットアイコンを選択します。次に、[編集] を選択します。編集が完了したら、[確認] を選択します。

      • トピックを削除するには、削除するトピックのチェックボックスをオンにします。[削除]]、[選択されたものを削除] の順に選択します。

      • すべてのトピックを削除するには、[削除][すべてを削除] を選択します。

      • テーブル内の各ページのサイズまたはテーブル内の列表示を設定するには、設定アイコン ( Gear icon representing settings or configuration options. ) を選択します。設定を行い、[確認] を選択します。

    3. 拒否されたトピックの設定が完了したら、[次へ] を選択します。

  7. (オプション) [ワードフィルターを追加] ページで、次の手順を実行します。

    1. [冒涜的な表現をフィルタリング] セクションで、[冒涜的な表現をフィルタリング] を選択して、プロンプトとレスポンスの冒涜的な表現をブロックします。冒涜的な表現のリストは、従来の定義に基づいており、継続的に更新されています。

    2. [カスタムの単語やフレーズを追加] セクションで、ブロックする語句をガードレールに追加する方法を選択します。ファイルのアップロードを選択した場合、ファイル内の各行に 1 つの単語または最大 3 つの単語のフレーズを含める必要があります。ヘッダーは含めないでください。次のオプションがあります。

      オプション 指示
      単語やフレーズを手動で追加 [単語やフレーズを表示および編集] セクションに単語とフレーズを直接追加します。
      ローカルファイルからアップロード 単語とフレーズを含んでいる .txt または .csv ファイルをアップロードするには、このオプションを選択した後に [ファイルを選択] を選択します。
      Amazon S3 オブジェクトからアップロード Amazon S3 からファイルをアップロードするには、このオプションを選択した後に [S3 オブジェクト] を指定します。ファイル内の各行に 1 つの単語または最大 3 つの単語のフレーズを含める必要があります。
    3. [単語やフレーズを表示および編集] セクションでブロックするガードレールの単語とフレーズを編集します。次のオプションがあります。

      • ローカルファイルまたは Amazon S3 オブジェクトから単語リストをアップロードした場合、このセクションには単語リストが入力されます。エラーのある項目をフィルタリングするには、[エラーを表示] を選択します。

      • 単語リストに項目を追加するには、[単語やフレーズを追加] を選択します。ボックス内に単語または最大 3 つの単語のフレーズを入力し、Enter キーを押すか、チェックマークアイコンを選択して項目を確認します。

      • 項目を編集するには、項目の横にある編集アイコン ( Edit icon represented by a pencil symbol. ) を選択します。

      • 単語リストから項目を削除するには、ごみ箱アイコン ( Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family. ) を選択するか、項目を編集する場合は、項目の横にある削除アイコン ( Close or cancel icon represented by an "X" symbol. ) を選択します。

      • エラーが含まれている項目を削除するには、[すべて削除]を選択して、[エラーのあるすべての行を削除] を選択します。

      • すべての項目を削除するには、[すべて削除] を選択して、[すべての行を削除] を選択します。

      • 項目を検索するには、検索バーに式を入力します。

      • エラーが含まれている項目のみを表示するには、[すべて表示] というラベルが付いたドロップダウンメニューを選択し、[エラーのみ表示] を選択します。

      • テーブル内の各ページのサイズまたはテーブル内の列表示を設定するには、設定アイコン ( Gear icon representing settings or configuration options. ) を選択します。設定を行い、[確認] を選択します。

      • デフォルトでは、このセクションに [テーブル] エディタが表示されます。各行に単語またはフレーズを入力できるテキストエディタに切り替えるには、[テキストエディタ] を選択します。[テキストエディタ] には、次の機能があります。

        • 別のテキストエディタから単語リストをコピーして、このエディタに貼り付けることができます。

        • エラーが含まれている項目の横に赤い X アイコンが表示され、エディタの下部にエラーのリストが表示されます。

    4. [スキップして確認および作成] を選択してガードレールを作成するか、[次へ] を選択して PII と正規表現パターンのフィルターを追加します。

  8. (オプション) [機密情報フィルターを追加] ページで、機密情報をブロックまたはマスクするようにフィルターを設定します。詳細については、「機密情報フィルターを使用して会話から PII を削除する」を参照してください。以下の操作を実行します。

    1. [PII タイプ] セクションで、ブロックまたはマスクする個人を特定できる情報 (PII) カテゴリを設定します。次のオプションがあります。

      • PII タイプを追加するには、[PII タイプを追加] を選択します。次に、以下の操作を実行します。

        1. [タイプ] 列で、PII タイプを選択します。

        2. [ガードレールの動作] 列で、ガードレールが PII タイプを含んでいるコンテンツをブロックするか、識別子によってマスクするかを選択します。

      • すべての PII タイプを追加するには、[PII タイプを追加] の横にあるドロップダウン矢印を選択します。次に、ガードレールの動作を選択して適用します。

        警告

        動作を指定すると、PII タイプに設定した既存の動作は上書きされます。

      • PII タイプを削除するには、ごみ箱アイコン ( Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family. ) を選択します。

      • エラーが含まれている行を削除するには、[すべて削除] を選択して、[エラーのあるすべての行を削除] を選択します。

      • すべての行を削除するには、[すべて削除] を選択して、[すべての行を削除] を選択します。

      • 行を検索するには、検索バーに式を入力します。

      • エラーが含まれている行のみを表示するには、[すべて表示] というラベルが付いたドロップダウンメニューを選択し、[エラーのみ表示] を選択します。

      • テーブル内の各ページのサイズまたはテーブル内の列表示を設定するには、設定アイコン ( Gear icon representing settings or configuration options. ) を選択します。設定を行い、[確認] を選択します。

    2. [正規表現パターン] セクションで、正規表現を使用して、ガードレールがフィルタリングするパターンを定義します。次のオプションがあります。

      • パターンを追加するには、[正規表現パターンを追加] を選択します。以下のフィールドを設定します。

        フィールド 説明
        名前 パターンの名前
        正規表現パターン パターンを定義する正規表現。
        ガードレールの動作 パターンを含んでいるコンテンツをブロックするか、識別子によってマスクするかを選択します。ログでのみパターンをマスクするには、[なし] を選択します。
        説明を追加します。 (オプション) パターンの説明を記述する
      • パターンを編集するには、[アクション] 列のトピックと同じ行にある 3 つのドットアイコンを選択します。次に、[編集] を選択します。編集が完了したら、[確認] を選択します。

      • パターン (複数可) を削除するには、削除するパターンのチェックボックスをオンにします。[削除]]、[選択されたものを削除] の順に選択します。

      • すべてのパターンを削除するには、[削除][すべてを削除] を選択します。

      • パターンを検索するには、検索バーに式を入力します。

      • テーブル内の各ページのサイズまたはテーブル内の列表示を設定するには、設定アイコン ( Gear icon representing settings or configuration options. ) を選択します。設定を行い、[確認] を選択します。

    3. 機密情報フィルターの設定が完了したら、[次へ] または [スキップして確認および作成] を選択します。

  9. [コンテキストグラウンディングチェックを追加] ページ (オプション) で、根拠のない情報または無関係な情報をブロックするようにしきい値を設定します。

    注記

    チェックのタイプごとに、スライダーを移動したり、しきい値を 0 から 0.99 に入力したりできます。使用に適したしきい値を選択します。しきい値が高いほど、レスポンスに求められるグラウンディングと関連性の信頼度が高くなります。しきい値を下回るレスポンスはフィルタリングされます。コンテキストグラウンディングチェックの詳細については、「」を参照してくださいコンテキストグラウンディングチェックを使用して、レスポンスのハルシネーションをフィルタリングする

    1. [グラウンディング] フィールドで、[グラウンディングチェックを有効にする] を選択して、モデルレスポンスに根拠があるかどうかを確認します。

    2. [関連性] フィールドで、[関連性チェックを有効にする] を選択して、モデルレスポンスに関連性があるかどうかを確認します。

    3. [次へ] を選択してください。

  10. 確認および作成 - ガードレールの設定を確認します。

    1. 変更するセクションで [編集] を選択します。

    2. ガードレールの設定に満足したら、[作成] を選択してガードレールを作成します。

API

ガードレールを作成するには、CreateGuardrail リクエストを送信します。リクエストの形式は次のとおりです。

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "contentPolicyConfig": { "filtersConfig": [ { "inputStrength": "NONE | LOW | MEDIUM | HIGH", "outputStrength": "NONE | LOW | MEDIUM | HIGH", "type": "SEXUAL | VIOLENCE | HATE | INSULTS | MISCONDUCT | PROMPT_ATTACK" } ] }, "wordPolicyConfig": { "wordsConfig": [ { "text": "string" } ], "managedWordListsConfig": [ { "type": "string" } ] }, "sensitiveInformationPolicyConfig": { "piiEntitiesConfig": [ { "type": "string", "action": "string" } ], "regexesConfig": [ { "name": "string", "description": "string", "regex": "string", "action": "string" } ] }, "description": "string", "kmsKeyId": "string", "name": "string", "tags": [ { "key": "string", "value": "string" } ], "topicPolicyConfig": { "topicsConfig": [ { "definition": "string", "examples": [ "string" ], "name": "string", "type": "DENY" } ] } }
  • ガードレールの namedescription を指定します。

  • blockedInputMessaging および blockedOutputsMessaging フィールドでプロンプトまたはモデルレスポンスをガードレールが正常にブロックしたときのメッセージを指定します。

  • topicPolicy オブジェクトで拒否するガードレールのトピックを指定します。topics リスト内の各項目は 1 つのトピックに関連しています。トピックの詳細については、「Topic」を参照してください。

    • namedescription を指定します。これにより、ガードレールがトピックを適切に識別できます。

    • action フィールドで DENY を指定します。

    • (オプション) examples リスト内のトピックに属するものとして分類する例を最大 5 つまで指定します。

  • Amazon Bedrock で定義されている有害なカテゴリのフィルター強度を contentPolicy オブジェクトで指定します。filters リスト内の各項目は、有害なカテゴリに関連しています。詳細については、「コンテンツフィルターを使用して有害な単語や会話をブロックする」を参照してください。コンテンツフィルターのフィールドの詳細については、「ContentFilter」を参照してください。

    • type フィールドにカテゴリを指定します。

    • textToTextFiltersForPrompt フィールドの strength フィールドにプロンプトのフィルターの強度を指定し、textToTextFiltersForResponsestrength フィールドにモデルレスポンスの強度を指定します。

  • (オプション) ガードレールにタグをアタッチします。詳細については、「Amazon Bedrock リソースにタグ付け」を参照してください。

  • (オプション) セキュリティのために、kmsKeyId フィールドに KMS キーの ARN を含めます。

レスポンスの形式は次のとおりです。

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }