Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Detenga el contenido dañino en los modelos que utilizan Amazon Bedrock Guardrails
Amazon Bedrock Guardrails le permite implementar protecciones para sus aplicaciones de IA generativa en función de sus casos de uso y políticas de IA responsables. Puede crear varias barreras de protección adaptadas a diferentes casos de uso y aplicarlas en varios modelos básicos (FM), lo que proporciona una experiencia de usuario uniforme y estandariza los controles de seguridad y privacidad en todas las aplicaciones de IA generativa. Puede utilizar barandillas con entradas de usuario basadas en texto y modelar respuestas.
Las barandillas se pueden utilizar de varias formas para proteger las aplicaciones de IA generativa. Por ejemplo:
Una aplicación de chatbot puede utilizar barandillas para filtrar las entradas dañinas de los usuarios y las respuestas tóxicas de los modelos.
Una aplicación bancaria puede utilizar barreras para bloquear las consultas de los usuarios o modelar las respuestas relacionadas con la búsqueda o la prestación de asesoramiento en materia de inversiones.
Una aplicación de centro de llamadas para resumir las transcripciones de las conversaciones entre usuarios y agentes puede utilizar barandillas para redactar la información de identificación personal de los usuarios () a fin de proteger la privacidad de los usuarios. PII
Puede configurar las siguientes políticas a modo de barrera para evitar el contenido no deseado y perjudicial y eliminar la información confidencial para proteger la privacidad.
-
Filtros de contenido: ajuste la intensidad de los filtros para bloquear las solicitudes de entrada o modelar las respuestas que contengan contenido dañino.
-
Temas rechazados: defina un conjunto de temas que no sean deseables en el contexto de su solicitud. Estos temas se bloquearán si se detectan en las consultas de los usuarios o en las respuestas del modelo.
-
Filtros de palabras: configure los filtros para bloquear palabras, frases y blasfemias no deseadas. Estas palabras pueden incluir términos ofensivos, nombres de competidores, etc.
-
Filtros de información confidencial: bloquean o ocultan información confidencial, como la información de identificación personal (PII) o las expresiones regulares personalizadas, en las entradas de los usuarios y en las respuestas del modelo.
-
Verificación de la base contextual: detecte y filtre las alucinaciones en las respuestas de los modelos basándose en una fuente y en su relevancia para la consulta del usuario.
Además de las políticas anteriores, también puede configurar los mensajes para que se devuelvan al usuario si una entrada de usuario o una respuesta modelo infringe las políticas definidas en la barrera de protección.
Puede crear varias versiones de barandilla para su barandilla. Al crear una barandilla, hay un borrador de trabajo disponible automáticamente para que lo modifique de forma iterativa. Experimente con diferentes configuraciones y utilice la ventana de prueba integrada para comprobar si son adecuadas para su caso de uso. Si está satisfecho con un conjunto de configuraciones, puede crear una versión de la barandilla y utilizarla con los modelos de base compatibles.
Las barandillas se pueden usar directamente FMs durante la API invocación de la inferencia especificando el ID de la barandilla y la versión. Si se utiliza una barandilla, esta evaluará las solicitudes de entrada y las terminaciones de FM en función de las políticas definidas.
Para recuperar aplicaciones de generación aumentada (RAG) o conversacionales, es posible que necesite evaluar únicamente la entrada del usuario en la solicitud de entrada y, al mismo tiempo, descartar las instrucciones del sistema, los resultados de la búsqueda, el historial de conversaciones o algunos ejemplos breves. Para evaluar de forma selectiva una sección de la solicitud de entrada, consulte. Aplicar etiquetas a la entrada del usuario para filtrar el contenido
importante
Amazon Bedrock Guardrails solo admite inglés. La evaluación del contenido del texto en otros idiomas puede arrojar resultados poco fiables.
Temas
- Cómo funciona Amazon Bedrock Guardrails
- Regiones y modelos compatibles con Amazon Bedrock Guardrails
- Componentes de una barandilla
- Requisitos previos para usar barandas con su AWS cuenta
- Crea una barandilla
- Configure los permisos para usar barandas para el filtrado de contenido
- Pruebe una barandilla
- Ver información sobre sus barandas
- Modificar una barandilla
- Eliminar una barandilla
- Despliega tu barandilla
- Utilice barandas para su caso de uso