Bloquee los temas rechazados para eliminar el contenido dañino - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Bloquee los temas rechazados para eliminar el contenido dañino

Los guardrails se pueden configurar con un conjunto de temas rechazados que no son deseables en el contexto de una aplicación de IA generativa. Por ejemplo, un banco puede querer que su asistente de inteligencia artificial evite cualquier conversación relacionada con consejos de inversión o participe en conversaciones relacionadas con las criptomonedas.

Puedes definir hasta 30 temas rechazados. Las solicitudes de entrada y los modelos completados se evaluarán en función de cada uno de estos temas rechazados. Si se detecta uno de los temas rechazados, se devolverá al usuario el mensaje bloqueado configurado como parte de la barandilla.

Los temas rechazados se pueden definir proporcionando una definición del tema en lenguaje natural junto con algunas frases de ejemplo opcionales del tema. La definición y las frases de ejemplo se utilizan para detectar si un mensaje de entrada o la finalización de un modelo pertenece al tema.

Los temas denegados se definen con los siguientes parámetros.

  • Nombre: el nombre del tema. El nombre debe ser un sustantivo o una frase. No describas el tema en el nombre. Por ejemplo:

    • Investment Advice

  • Definición: hasta 200 caracteres que resumen el contenido del tema. La definición debe describir el contenido del tema y sus subtemas.

    El siguiente es un ejemplo de definición de tema que puede proporcionar:

    Investment advice is inquiries, guidance, or recommendations about the management or allocation of funds or assets with the goal of generating returns or achieving specific financial objectives.

  • Frases de muestra: una lista de hasta cinco frases de muestra que hacen referencia al tema. Cada frase puede tener hasta 100 caracteres. Un ejemplo es un mensaje o una continuación que muestra qué tipo de contenido debe filtrarse. Por ejemplo:

    • Is investing in the stocks better than bonds?

    • Should I invest in gold?

Mejores prácticas para definir un tema que quieres bloquear

  • Defina el tema de una manera nítida y precisa. Una definición de tema clara e inequívoca puede mejorar la precisión de la detección del tema. Por ejemplo, un tema para detectar consultas o declaraciones asociadas a las criptomonedas se puede definir comoQuestion or information associated with investing, selling, transacting, or procuring cryptocurrencies.

  • No incluya ejemplos ni instrucciones en la definición del tema. Por ejemplo, Block all contents associated to cryptocurrency es una instrucción y no una definición del tema. Dichas instrucciones no deben usarse como parte de las definiciones del tema.

  • No defina temas negativos ni excepciones. Por ejemplo, All contents except medical information o Contents not containing medical information son definiciones negativas de un tema y no deben usarse.

  • No utilice temas rechazados para capturar entidades o palabras. Por ejemplo, Statement or questions containing the name of a person "X" o Statements with a competitor name Y. Las definiciones de los temas representan un tema o un tema y Guardrails evalúa una entrada contextualmente. El filtrado de temas no debe usarse para capturar palabras individuales o tipos de entidades. En su lugar, considere usar Elimine PII de las conversaciones mediante filtros de información confidencial o Elimine una lista específica de palabras y frases de las conversaciones con filtros de palabras para esos casos de uso.