Pruebe una barandilla - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Pruebe una barandilla

Tras crear una barandilla, estará disponible una versión provisional (DRAFT). El borrador de trabajo es una versión de la barandilla que puede editar e iterar continuamente hasta alcanzar una configuración satisfactoria para su caso de uso. Puede probar el borrador de trabajo u otras versiones de la barandilla para comprobar si las configuraciones son adecuadas para su caso de uso. Edite las configuraciones en el borrador de trabajo y pruebe diferentes indicaciones para ver qué tan bien la barandilla evalúa e intercepta las indicaciones o respuestas.

Cuando esté satisfecho con la configuración, podrá crear una versión de la barandilla, que actuará como una instantánea de las configuraciones del borrador de trabajo al crear la versión. Puede utilizar las versiones para agilizar el despliegue de las barandillas en las aplicaciones de producción cada vez que las modifique. Los cambios en el borrador de trabajo o en una nueva versión creada no se reflejarán en su aplicación de IA generativa hasta que utilice específicamente la nueva versión en la aplicación.

Console
Para probar una barandilla y comprobar si bloquea el contenido dañino
  1. Inicie sesión en el AWS Management Console utilizando un IAMrol con permisos de Amazon Bedrock y abrir la consola de Amazon Bedrock en. https://console.aws.amazon.com/bedrock/

  2. Seleccione Guardrails en el panel de navegación izquierdo. A continuación, seleccione una barandilla en la sección Barandillas.

  3. Aparece una ventana de prueba a la derecha. Tiene las siguientes opciones en la ventana de prueba:

    1. Por defecto, en la ventana de prueba se utiliza el borrador de trabajo de la barandilla. Para probar una versión diferente de la barandilla, elija Borrador provisional en la parte superior de la ventana de prueba y, a continuación, seleccione la versión.

    2. Para seleccionar un modelo, elija Seleccionar modelo. Después de hacer una elección, selecciona Aplicar. Para cambiar el modelo, selecciona Cambiar.

    3. Introduzca un mensaje en el cuadro de diálogo.

    4. Para obtener una respuesta modelo, seleccione Ejecutar.

    5. El modelo devuelve una respuesta en el cuadro de respuesta final (que puede ser modificada por la barandilla). Si la barandilla bloquea o filtra el mensaje o la respuesta del modelo, aparece un mensaje en la sección de verificación del guardarraíl que indica el número de infracciones detectadas por la barandilla.

    6. Para ver los temas o las categorías perjudiciales de la pregunta o respuesta que fueron reconocidos y permitidos por el filtro o bloqueados por él, seleccione Ver rastreo.

    7. Utilice las pestañas Solicitud y Modelo de respuesta para ver los temas o las categorías perjudiciales que fueron filtrados o bloqueados por la barrera.

También puedes probar la barandilla en el parque de juegos Text. Seleccione el patio de recreo y seleccione la barandilla en el panel de configuraciones antes de probar las instrucciones.

API

Para usar una barandilla en la invocación de modelos, envíe una solicitud o. InvokeModelInvokeModelWithResponseStream Como alternativa, si estás creando una aplicación conversacional, puedes usar Converse. API

Formato de solicitud

Los puntos finales de solicitud para invocar un modelo, con y sin transmisión, son los siguientes. Reemplazar modelId con el ID del modelo que se va a utilizar.

  • InvokeModel— POST /modelo/modelId/invocar /1.1 HTTP

  • InvokeModelWithResponseStream— POST /modelo/modelId//1.1 invoke-with-response-stream HTTP

El encabezado de ambas API operaciones tiene el siguiente formato.

Accept: accept Content-Type: contentType X-Amzn-Bedrock-Trace: trace X-Amzn-Bedrock-GuardrailIdentifier: guardrailIdentifier X-Amzn-Bedrock-GuardrailVersion: guardrailVersion

Los parámetros se describen a continuación.

  • Se establece Accept en el MIME tipo de cuerpo de inferencia de la respuesta. El valor predeterminado es application/json.

  • Se establece Content-Type en el MIME tipo de datos de entrada de la solicitud. El valor predeterminado es application/json.

  • Se configura X-Amzn-Bedrock-Trace ENABLED para permitir un rastreo que permita ver, entre otras cosas, qué contenido ha sido bloqueado por las barandillas y por qué.

  • Configure X-Amzn-Bedrock-GuardrailIdentifier el identificador de la barandilla que desee aplicar a la solicitud y modele la respuesta.

  • Configure X-Amzn-Bedrock-GuardrailVersion la versión de la barandilla que desee aplicar a la solicitud y modele la respuesta.

El formato general del cuerpo de la solicitud se muestra en el siguiente ejemplo. La tagSuffix propiedad solo se usa con el etiquetado de entrada. También puede configurar la barandilla para que transmita de forma sincrónica o asíncrona utilizando. streamProcessingMode Esto InvokeModelWithResponseStream solo funciona con.

{ <see model details>, "amazon-bedrock-guardrailConfig": { "tagSuffix": "string", "streamProcessingMode": "SYNCHRONOUS" | "ASYNCHRONOUS" } }
aviso

Se producirá un error en las siguientes situaciones

  • Activa la barandilla pero no hay ningún amazon-bedrock-guardrailConfig campo en el cuerpo de la solicitud.

  • Deshabilita la barandilla pero especifica un amazon-bedrock-guardrailConfig campo en el cuerpo de la solicitud.

  • Activa la barandilla, pero no lo está. contentType application/json

Para ver el cuerpo de la solicitud para los distintos modelos, consulte. Parámetros de inferencia para modelos fundacionales

nota

En Cohere Command modelos, solo puede especificar una generación en el num_generations campo si utiliza una barandilla.

Si habilita una barandilla y su rastreo, el formato general de la respuesta para invocar un modelo, con y sin transmisión, es el siguiente. Para ver el formato del resto de cada modelo, consulte. body Parámetros de inferencia para modelos fundacionales La contentType coincide con lo que especificó en la solicitud.

  • InvokeModel

    HTTP/1.1 200 Content-Type: contentType { <see model details for model-specific fields>, "completion": "<model response>", "amazon-bedrock-guardrailAction": "INTERVENED | NONE", "amazon-bedrock-trace": { "guardrail": { "modelOutput": [ "<see model details for model-specific fields>" ], "input": { "<sample-guardrailId>": { "topicPolicy": { "topics": [ { "name": "string", "type": "string", "action": "string" } ] }, "contentPolicy": { "filters": [ { "type": "string", "confidence": "string", "action": "string" } ] }, "wordPolicy": { "customWords": [ { "match": "string", "action": "string" } ], "managedWordLists": [ { "match": "string", "type": "string", "action": "string" } ] }, "sensitiveInformationPolicy": { "piiEntities": [ { "type": "string", "match": "string", "action": "string" } ], "regexes": [ { "name": "string", "regex": "string", "match": "string", "action": "string" } ] } } }, "outputs": ["<same guardrail trace format as input>"] } } }
  • InvokeModelWithResponseStream— Cada respuesta devuelve un texto chunk cuyo texto se encuentra en el bytes campo, junto con las excepciones que se produzcan. La traza de la barandilla se devuelve solo para el último fragmento.

    HTTP/1.1 200 X-Amzn-Bedrock-Content-Type: contentType Content-type: application/json { "chunk": { "bytes": "<blob>" }, "internalServerException": {}, "modelStreamErrorException": {}, "throttlingException": {}, "validationException": {}, "amazon-bedrock-guardrailAction": "INTERVENED | NONE", "amazon-bedrock-trace": { "guardrail": { "modelOutput": ["<see model details for model-specific fields>"], "input": { "<sample-guardrailId>": { "topicPolicy": { "topics": [ { "name": "string", "type": "string", "action": "string" } ] }, "contentPolicy": { "filters": [ { "type": "string", "confidence": "string", "action": "string" } ] }, "wordPolicy": { "customWords": [ { "match": "string", "action": "string" } ], "managedWordLists": [ { "match": "string", "type": "string", "action": "string" } ] }, "sensitiveInformationPolicy": { "piiEntities": [ { "type": "string", "match": "string", "action": "string" } ], "regexes": [ { "name": "string", "regex": "string", "match": "string", "action": "string" } ] } } }, "outputs": ["<same guardrail trace format as input>"] } } }

La respuesta devuelve los siguientes campos si habilitas una barandilla.

  • amazon-bedrock-guardrailAction— Especifica si la barandilla INTERVENED o no (). NONE

  • amazon-bedrock-trace— Solo aparece si se habilita el rastreo. Contiene una lista de trazas, cada una de las cuales proporciona información sobre el contenido que ha bloqueado la barandilla. La traza contiene los siguientes campos:

    • modelOutput— Un objeto que contiene las salidas del modelo que estaba bloqueado.

    • input— Contiene los siguientes detalles sobre la evaluación del mensaje por parte de la barandilla:

      • topicPolicy— Contiene topics una lista de evaluaciones de cada política temática que se haya infringido. Cada tema incluye los siguientes campos:

        • name— El nombre de la política temática.

        • type— Especifica si se debe denegar el tema.

        • action— Especifica que el tema se ha bloqueado

      • contentPolicy— Contiene filters una lista de evaluaciones de cada filtro de contenido infringido. Cada filtro incluye los siguientes campos:

        • type— La categoría del filtro de contenido.

        • confidence— El nivel de confianza en que el producto puede clasificarse como perteneciente a la categoría nociva.

        • action— Especifica que el contenido se ha bloqueado. Este resultado depende de la resistencia del filtro colocado en la barandilla.

      • wordPolicy— Contiene una colección de palabras personalizadas y las palabras gestionadas que se han filtrado y la correspondiente evaluación de esas palabras. Cada lista contiene los siguientes campos:

        • customWords— Una lista de palabras personalizadas que coinciden con el filtro.

          • match— La palabra o frase que coincide con el filtro.

          • action— Especifica que la palabra estaba bloqueada.

        • managedWordLists— Una lista de palabras gestionadas que coinciden con el filtro.

          • match— La palabra o frase que coincide con el filtro.

          • type— Especifica el tipo de palabra gestionada que coincide con el filtro. Por ejemplo, PROFANITY si coincide con el filtro de blasfemias.

          • action— Especifica que la palabra estaba bloqueada.

      • sensitiveInformationPolicy— Contiene los siguientes objetos, que contienen evaluaciones de información de identificación personal (PII) y filtros de expresiones regulares que se infringieron:

        • piiEntities— Una lista de las evaluaciones de cada PII filtro infringido. Cada filtro contiene los siguientes campos:

          • type— El PII tipo que se encontró.

          • match— La palabra o frase que coincide con el filtro.

          • action— Especifica si la palabra se ha sustituido por un identificador (ANONYMIZED) BLOCKED o se ha sustituido por él.

        • regexes— Una lista de las evaluaciones de cada filtro de expresiones regulares que se haya infringido. Cada filtro contiene los siguientes campos:

          • name— El nombre del filtro de expresiones regulares.

          • regex— El PII tipo que se encontró.

          • match— La palabra o frase que coincide con el filtro.

          • action— Especifica si la palabra se ha sustituido por un identificador (ANONYMIZED) BLOCKED o se ha sustituido por él.

    • outputs— Una lista de detalles sobre la evaluación de la respuesta del modelo por parte de la barandilla. Cada elemento de la lista es un objeto que coincide con el formato del input objeto. Para obtener más información, consulte el input campo.