거부된 주제 차단으로 유해한 콘텐츠 제거 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

거부된 주제 차단으로 유해한 콘텐츠 제거

생성형 AI 애플리케이션의 맥락에서 바람직하지 않은 거부된 주제 집합으로 가드레일을 구성할 수 있습니다. 예를 들어, 은행은 AI 어시스턴트가 투자 조언과 관련된 대화를 피하거나 암호화폐와 관련된 대화에 참여하기를 원할 수 있습니다.

거부된 주제는 최대 30개까지 정의할 수 있습니다. 자연어 입력 프롬프트 및 모델 응답은 거부된 각 주제에 대해 평가됩니다. 거부된 주제가 감지되면 가드레일의 일부로 구성된 차단된 메시지가 사용자에게 반환됩니다.

주제에 대한 몇 가지 선택적 예제 문구와 자연어 정의를 함께 제공하여 거부된 주제를 정의할 수 있습니다. 정의 및 예제 문구는 입력 프롬프트 또는 모델 완성 텍스트가 주제에 속하는지 여부를 감지하는 데 사용됩니다.

거부된 주제는 다음 파라미터로 정의됩니다.

  • 이름 - 주제의 이름입니다. 이름은 명사 또는 문구여야 합니다. 이름에서 주제를 설명하지 마세요. 예시:

    • Investment Advice

  • 정의 - 주제 콘텐츠를 최대 200자로 요약합니다. 정의는 주제의 내용과 하위 주제를 설명해야 합니다.

    다음은 제공할 수 있는 주제 정의의 예입니다.

    Investment advice is inquiries, guidance, or recommendations about the management or allocation of funds or assets with the goal of generating returns or achieving specific financial objectives.

  • 샘플 문구 - 주제를 참조하는 최대 5개의 샘플 문구 목록입니다. 각 문구는 최대 100자까지 가능합니다. 샘플은 어떤 종류의 콘텐츠를 필터링해야 하는지 보여주는 프롬프트 또는 연속입니다. 예시:

    • Is investing in the stocks better than bonds?

    • Should I invest in gold?

차단하려는 주제를 정의하는 모범 사례

  • 명확하고 정확한 방식으로 주제를 정의합니다. 모호하지 않은 명확한 주제 정의로 주제 감지의 정확도를 개선할 수 있습니다. 예를 들어, 암호화폐와 관련된 쿼리 또는 설명을 감지하는 주제를 Question or information associated with investing, selling, transacting, or procuring cryptocurrencies로 정의할 수 있습니다.

  • 주제 정의에 예제 또는 지침을 포함하지 마세요. 예를 들어 Block all contents associated to cryptocurrency는 주제의 정의가 아닌 지침입니다. 이러한 지침을 주제 정의의 일부로 사용해서는 안 됩니다.

  • 부정적인 주제 또는 예외를 정의하지 마세요. 예를 들어 All contents except medical information 또는 Contents not containing medical information은 주제에 대한 부정적인 정의이므로 사용해서는 안 됩니다.

  • 거부된 주제를 사용하여 엔터티 또는 단어를 캡처하지 마세요. 예: Statement or questions containing the name of a person "X"또는 Statements with a competitor name Y. 주제 정의는 일종의 테마를 나타내며 가드레일은 컨텍스트에 따라 입력을 평가합니다. 주제 필터링을 사용하여 개별 단어 또는 엔터티 유형을 캡처해서는 안 됩니다. 자세한 내용은 민감한 정보 필터를 사용하여 대화에서 PII 제거또는에서 이러한 사용 사례를 참조단어 필터를 사용해 대화에서 특정 단어 및 문구 제거하세요.