가드레일 생성

가드레일을 만들기 위해서는 구성을 설정하고, 거부할 주제를 정의하고, 유해하고 민감한 콘텐츠를 처리하기 위한 필터를 제공하고, 프롬프트 및 사용자 응답이 차단될 때를 대비한 메시지를 작성해야 합니다.

가드레일에는 프롬프트와 사용자 응답이 차단되는 경우를 대비해 최소 하나 이상의 필터와 메시지가 포함되어 있어야 합니다. 기본 메시지를 사용하도록 선택할 수 있습니다. 나중에 가드레일 수정의 단계에 따라 필터를 추가하고 가드레일을 반복하여 가드레일에 필요한 모든 구성 요소를 구성할 수 있습니다.

원하는 방법의 탭을 선택한 다음 다음 단계를 따릅니다.

Console

AWS 콘솔에서 가드레일을 생성하려면

Amazon Bedrock 권한이 있는 IAM 역할을 AWS Management Console 사용하여에 로그인하고 https://console.aws.amazon.com/bedrock/ Amazon Bedrock 콘솔을 엽니다.
왼쪽 탐색 창에서 가드레일을 선택합니다.
가드레일 섹션에서 가드레일 생성을 선택합니다.
가드레일 세부 정보 제공 페이지에서 다음 작업을 수행합니다.
1. 가드레일 세부 정보 섹션에서 가드레일의 이름 및 필요한 경우 설명을 제공합니다.
2. 가드레일이 간접적으로 호출될 때 표시될 프롬프트에 대해 차단된 메시지를 입력합니다. 응답에 가드레일이 간접적으로 호출될 때 동일한 메시지를 사용하도록 응답에 동일한 차단된 메시지 사용 확인란을 선택합니다.
3. (선택 사항) 기본적으로 가드레일은 로 암호화됩니다 AWS 관리형 키. 자체 고객 관리형 KMS 키를 사용하려면 KMS 키 선택 옆의 오른쪽 화살표를 선택하고 암호화 설정 사용자 지정(고급) 확인란을 선택합니다. 기존 AWS KMS 키를 선택하거나 키 생성을 선택하여 새 AWS KMS 키를 생성할 수 있습니다.
4. 가드레일 생성 옵션에서 유해성 필터로 빠른 생성을 선택하여 기본 설정을 사용하거나 자체 가드레일 생성을 선택하여 가드레일 설정을 사용자 지정합니다. 유해성 필터 보기 및 편집을 선택하여 가드레일 욕설 필터링 및 프롬프트 공격 필터 설정을 확인하거나 사용자 지정할 수도 있습니다.
5. (선택 사항) 가드레일에 태그를 추가하려면 태그 옆의 오른쪽 화살표를 선택합니다. 그런 다음 새 태그 추가를 선택하고 태그의 키-값 페어를 정의합니다. 자세한 내용은 Amazon Bedrock 리소스 태그 지정 섹션을 참조하세요.
6. Next(다음)를 선택합니다.
참고
가드레일을 만들려면 하나 이상의 필터를 구성해야 합니다. 그런 다음 생성을 선택하여 다른 필터 생성을 건너뛸 수 있습니다.
(선택 사항) 콘텐츠 필터 구성 페이지에서 다음을 수행하여 콘텐츠 필터로 유해한 단어 및 대화 차단에 정의된 카테고리와 관련된 콘텐츠를 얼마나 강력하게 필터링할지 설정합니다.
1. 유해 범주에 대한 필터를 구성하려면 유해 범주 필터 구성을 선택합니다. 텍스트 및/또는 이미지를 선택하여 모델에 대한 프롬프트 또는 응답에서 텍스트 또는 이미지 콘텐츠를 필터링합니다. 각 범주에 적용할 필터링 수준에 대해 없음, 낮음, 중간 또는 높음을 선택합니다. 프롬프트 또는 응답에 대해 다른 필터 수준을 사용하도록 선택할 수 있습니다. 유해 카테고리에서 프롬프트 공격에 대한 필터를 선택할 수 있습니다. 사용자가 모델에 제공하는 프롬프트에 대해 각 필터를 얼마나 엄격하게 적용할 것인지 구성합니다.
2. 프롬프트 공격에 대한 필터를 구성하려면 프롬프트 공격 필터 활성화를 선택합니다. 필터로 탈옥 및 프롬프트 인젝션 공격을 얼마나 엄격하게 감지하고 차단할 것인지 구성합니다.
3. 생성을 선택하여 가드레일을 생성하거나 고급 필터 사용을 선택하여 필터 설정을 사용자 지정합니다.
(선택 사항) 거부된 주제 추가 페이지에서 거부된 주제를 추가하거나 검토 및 생성으로 건너뛰기를 선택할 수 있습니다.
1. 차단할 주제를 정의하려면 거부된 주제 추가를 선택합니다. 뒤이어 다음과 같이 하세요.
  1. 주제의 이름을 입력합니다.
  2. 주제에 대한 정의 상자에서 주제를 정의합니다. 거부된 주제를 정의하는 방법에 대한 지침은 거부된 주제 차단으로 유해한 콘텐츠 제거 섹션을 참조하세요.
  3. (선택 사항) 이 주제와 관련된 대표적인 입력 프롬프트 또는 모델 응답을 추가하려면 샘플 문구 추가 옆의 오른쪽 화살표를 선택합니다. 상자에 문구를 입력합니다. 다른 문구를 추가하려면 문구 추가를 선택합니다.
  4. 거부된 주제 구성을 완료했으면 확인을 선택합니다.
2. 거부된 주제를 사용하여 다음 작업을 수행할 수 있습니다.
  - 다른 주제를 추가하려면 거부된 주제 추가를 선택합니다.
  - 주제를 편집하려면 작업 열에서 주제와 같은 행에 있는 점 3개 아이콘을 선택합니다. 그런 다음 편집을 선택합니다. 편집이 완료되면 확인을 선택합니다.
  - 주제를 삭제하려면 삭제할 주제의 확인란을 선택합니다. 삭제를 선택한 다음 선택 항목 삭제를 선택합니다.
  - 모든 주제를 삭제하려면 삭제를 선택한 다음 모두 삭제를 선택합니다.
  - 테이블의 각 페이지 크기나 테이블의 열 표시를 구성하려면 설정 아이콘( )을 선택합니다. 기본 설정을 구성한 다음 확인을 선택합니다.
3. 거부된 주제 구성을 마치면 다음을 선택합니다.

(선택 사항) 단어 필터 추가 페이지에서 다음을 수행합니다.

욕설 필터링 섹션에서 욕설 필터링을 선택하여 프롬프트 및 응답의 욕설을 차단합니다. 욕설 목록은 일반적인 정의를 기반으로 하며 지속적으로 업데이트됩니다.

사용자 지정 단어 및 문구 추가 섹션에서 가드레일이 차단할 단어 및 문구를 추가하는 방법을 선택합니다. 파일 업로드를 선택할 경우, 파일의 각 줄에 단어 하나가 포함되거나 최대 세 단어로 된 문구가 포함되어야 합니다. 헤더는 포함시키지 않습니다. 다음과 같은 옵션이 있습니다:

옵션	지침
단어와 문구를 수동으로 추가	단어 및 문구 보기 및 편집 섹션에 단어와 문구를 직접 추가할 수 있습니다.
로컬 파일 업로드	단어와 문구가 포함된 .txt 또는 .csv 파일을 업로드하려면 이 옵션을 선택한 후 파일 선택을 선택합니다.
Amazon S3 객체에서 업로드	Amazon S3에서 파일을 업로드하려면 이 옵션을 선택한 후 S3 객체를 지정합니다. 파일의 각 줄에는 단어 하나가 포함되거나 최대 세 단어로 된 문구가 포함되어야 합니다.

단어 및 문구 보기 및 편집 섹션에서 가드레일로 차단할 단어 및 문구를 편집합니다. 다음과 같은 옵션이 있습니다:
- 로컬 파일 또는 Amazon S3 객체에서 단어 목록을 업로드한 경우 이 섹션에 단어 목록이 채워집니다. 오류가 있는 항목을 필터링하려면 오류 표시를 선택합니다.
- 단어 목록에 항목을 추가하려면 단어 또는 문구 추가를 선택합니다. 상자에 단어 하나 또는 최대 세 단어의 문구를 입력하고 Enter 키를 누르거나 확인 표시 아이콘을 선택하여 항목을 확인합니다.
- 항목을 편집하려면 항목 옆의 편집 아이콘( )을 선택합니다.
- 단어 목록에서 항목을 삭제하려면 휴지통 아이콘( )을 선택하거나, 항목을 편집하려는 경우 항목 옆에 있는 삭제 아이콘( )을 선택합니다.
- 오류가 포함된 항목을 삭제하려면 모두 삭제를 선택한 다음 오류가 있는 모든 행 삭제를 선택합니다.
- 모든 항목을 삭제하려면 모두 삭제를 선택한 다음 모든 행 삭제를 선택합니다.
- 항목을 검색하려면 검색 창에 표현식을 입력합니다.
- 오류가 있는 항목만 표시하려면 모두 표시 드롭다운 메뉴를 선택하고 오류만 표시를 선택합니다.
- 테이블의 각 페이지 크기나 테이블의 열 표시를 구성하려면 설정 아이콘( )을 선택합니다. 기본 설정을 구성한 다음 확인을 선택합니다.
- 기본적으로 이 섹션에는 테이블 편집기가 표시됩니다. 각 줄에 단어 또는 문구를 입력할 수 있는 텍스트 편집기로 전환하려면 텍스트 편집기를 선택합니다. 텍스트 편집기는 다음 기능을 제공합니다.
  - 다른 텍스트 편집기에서 단어 목록을 복사하여 이 편집기에 붙여 넣을 수 있습니다.
  - 오류가 포함된 항목 옆에 빨간색 X 아이콘이 표시되고 편집기 아래에 오류 목록이 나타납니다.
검토 및 생성으로 건너뛰기를 선택하여 가드레일을 만들거나, 다음을 선택하여 PII 및 정규식 패턴에 대한 필터를 추가합니다.

(선택 사항) 민감한 정보 필터 추가 페이지에서 민감한 정보를 차단하거나 마스킹하도록 필터를 구성합니다. 자세한 내용은 민감한 정보 필터를 사용하여 대화에서 PII 제거 섹션을 참조하세요. 다음을 수행합니다.

PII 유형 섹션에서 개인 식별 정보(PII) 카테고리를 차단하거나 마스킹하도록 구성합니다. 다음과 같은 옵션이 있습니다:
- PII 유형을 추가하려면 PII 유형 추가를 선택합니다. 뒤이어 다음과 같이 하세요.
  1. 유형 열에서 PII 유형을 선택합니다.
  2. 가드레일 동작 열에서 가드레일이 PII 유형이 포함된 콘텐츠를 차단해야 하는지 아니면 식별자로 마스킹해야 하는지 선택합니다.
- 모든 PII 유형을 추가하려면 PII 유형 추가 옆의 드롭다운 화살표를 선택합니다. 그런 다음 적용할 가드레일 동작을 선택합니다.
  
  주의
  동작을 지정하면 PII 유형에 대해 구성한 기존 동작을 덮어씁니다.
- PII 유형을 삭제하려면 휴지통 아이콘( )을 선택합니다.
- 오류가 있는 행을 삭제하려면 모두 삭제를 선택한 다음 오류가 있는 모든 행 삭제를 선택합니다.
- 모든 PII 유형을 삭제하려면 모두 삭제를 선택한 다음 모든 행 삭제를 선택합니다.
- 행을 검색하려면 검색 창에 표현식을 입력합니다.
- 오류가 있는 행만 표시하려면 모두 표시 드롭다운 메뉴를 선택하고 오류만 표시를 선택합니다.
- 테이블의 각 페이지 크기나 테이블의 열 표시를 구성하려면 설정 아이콘( )을 선택합니다. 기본 설정을 구성한 다음 확인을 선택합니다.

정규식 패턴 섹션에서 정규식을 사용하여 필터링할 가드레일의 패턴을 정의합니다. 다음과 같은 옵션이 있습니다:

패턴을 추가하려면 정규식 패턴 추가를 선택합니다. 다음 필드를 구성합니다.

필드	설명
명칭	패턴의 이름
정규식 패턴	패턴을 정의하는 정규식
가드레일 동작	패턴이 포함된 콘텐츠를 차단할지 아니면 식별자로 마스킹할지 선택합니다. 로그에서만 패턴을 마스킹하려면 없음을 선택합니다.
설명 추가	(선택 사항) 패턴에 대한 설명 작성

패턴을 편집하려면 작업 열에서 주제와 같은 행에 있는 점 3개 아이콘을 선택합니다. 그런 다음 편집을 선택합니다. 편집이 완료되면 확인을 선택합니다.
패턴을 삭제하려면 삭제할 패턴의 확인란을 선택합니다. 삭제를 선택한 다음 선택 항목 삭제를 선택합니다.
모든 패턴을 삭제하려면 삭제를 선택한 다음 모두 삭제를 선택합니다.
패턴을 검색하려면 검색 창에 표현식을 입력합니다.
테이블의 각 페이지 크기나 테이블의 열 표시를 구성하려면 설정 아이콘( )을 선택합니다. 기본 설정을 구성한 다음 확인을 선택합니다.

민감한 정보 필터 구성을 마치면 다음 또는 검토 및 생성으로 건너뛰기를 선택합니다.

컨텍스트 근거 검사 추가 페이지(선택 사항)에서 근거가 없거나 관련이 없는 정보를 차단하도록 임계값을 구성합니다.

참고
각 검사 유형에 대해 슬라이더를 이동하거나 직접 입력하는 방식으로 임계값을 0에서 0.99 사이로 입력할 수 있습니다. 사용에 적합한 임계값을 선택합니다. 더 높은 임계값을 적용하려면 응답이 근거가 있거나 높은 신뢰도로 관련성이 있어야 합니다. 임계값 미만의 응답은 필터링됩니다. 컨텍스트 기반 검사에 대한 자세한 내용은 섹션을 참조하세요컨텍스트 근거 검사를 사용하여 응답에서 할루시네이션 필터링.
1. 근거 필드에서 근거 검사 활성화를 선택하여 모델 응답이 근거가 있는지 확인합니다.
2. 관련성 필드에서 관련성 확인 활성화를 선택하여 모델 응답이 관련성이 있는지 확인합니다.
3. 다음을 선택합니다.
검토 및 생성 - 가드레일의 설정을 검토합니다.
1. 변경하려는 섹션에서 편집을 선택합니다.
2. 가드레일 설정을 마치면 생성을 선택하여 가드레일을 만듭니다.

API

가드레일을 만들려면 CreateGuardrail 요청을 보냅니다. 요청 형식은 다음과 같습니다.


POST /guardrails HTTP/1.1
Content-type: application/json

{
   "blockedInputMessaging": "string",
   "blockedOutputsMessaging": "string",
   "contentPolicyConfig": { 
      "filtersConfig": [ 
         { 
            "inputStrength": "NONE | LOW | MEDIUM | HIGH",
            "outputStrength": "NONE | LOW | MEDIUM | HIGH",
            "type": "SEXUAL | VIOLENCE | HATE | INSULTS | MISCONDUCT | PROMPT_ATTACK"
         }
      ]
   },
    "wordPolicyConfig": {
    "wordsConfig": [
      {
        "text": "string"
      }
    ],
    "managedWordListsConfig": [
      {
        "type": "string"
      }
    ]
  },
  "sensitiveInformationPolicyConfig": {
    "piiEntitiesConfig": [
      {
        "type": "string",
        "action": "string"
      }
    ],
    "regexesConfig": [
      {
        "name": "string",
        "description": "string",
        "regex": "string",
        "action": "string"
      }
    ]
  },
   "description": "string",
   "kmsKeyId": "string",
   "name": "string",
   "tags": [ 
      { 
         "key": "string",
         "value": "string"
      }
   ],
   "topicPolicyConfig": { 
      "topicsConfig": [ 
         { 
            "definition": "string",
            "examples": [ "string" ],
            "name": "string",
            "type": "DENY"
         }
      ]
   }
}

가드레일에 name 및 description을 지정합니다.
가드레일이 blockedInputMessaging 및 blockedOutputsMessaging 필드에서 프롬프트 또는 모델 응답을 성공적으로 차단했을 때의 메시지를 지정합니다.
topicPolicy 객체에서 가드레일이 거부할 주제를 지정합니다. topics 목록의 각 항목은 하나의 주제와 관련이 있습니다. 주제의 필드에 대한 자세한 내용은 주제를 참조하세요.
- 가드레일이 주제를 제대로 식별할 수 있도록 name 및 description을 제공합니다.
- action 필드에 DENY를 지정합니다.
- (선택 사항) examples 목록의 주제에 속한다고 분류할 수 있는 최대 5개의 예시를 제공합니다.
contentPolicy 객체에서 Amazon Bedrock에 정의된 유해 카테고리에 대한 필터 강도를 지정합니다. filters 목록의 각 항목은 유해 카테고리와 관련이 있습니다. 자세한 내용은 콘텐츠 필터로 유해한 단어 및 대화 차단 섹션을 참조하세요. 콘텐츠 필터의 필드에 대한 자세한 내용은 ContentFilter를 참조하세요.
- type 필드에 카테고리를 지정합니다.
- textToTextFiltersForPrompt 필드의 strength 필드에 프롬프트에 대한 필터의 강도를 지정하고. textToTextFiltersForResponse의 strength 필드에 모델 응답을 지정합니다.
(선택 사항) 가드레일에 태그를 연결합니다. 자세한 내용은 Amazon Bedrock 리소스 태그 지정 섹션을 참조하세요.
(선택 사항) 보안을 위해 kmsKeyId 필드에 KMS 키의 ARN을 포함합니다.

응답 형식은 다음과 같습니다.


HTTP/1.1 202
Content-type: application/json

{
   "createdAt": "string",
   "guardrailArn": "string",
   "guardrailId": "string",
   "version": "string"
}

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

가드레일 사용을 위한 사전 조건

Amazon Bedrock Guardrails에 대한 권한

가드레일 생성

AWS 콘솔에서 가드레일을 생성하려면

참고

주의

참고