Utilice un rendimiento aprovisionado - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Utilice un rendimiento aprovisionado

Después de adquirir un rendimiento aprovisionado, puede usarlo con las siguientes funciones para aumentar su rendimiento:

  • Inferencia del modelo: puede probar el rendimiento aprovisionado en un entorno de consolas de Amazon Bedrock. Cuando esté listo para implementar el rendimiento aprovisionado, configure la aplicación para que invoque el modelo aprovisionado. Seleccione la pestaña correspondiente al método que prefiera y siga los pasos.

    Console
    Para usar un rendimiento aprovisionado en el área de juegos de consolas de Amazon Bedrock
    1. Inicie sesión en el rol de AWS Management Console uso de IAM con los permisos de Amazon Bedrock y abra la consola de Amazon Bedrock en https://console.aws.amazon.com/bedrock/.

    2. En el panel de navegación izquierdo, seleccione Chat, Texto o Imagen en Playgrounds, según su caso de uso.

    3. Selecciona Seleccionar modelo.

    4. En el 1. En la columna Categoría, seleccione un proveedor o una categoría de modelo personalizado. A continuación, en la 2. En la columna Modelo, seleccione el modelo al que está asociado su rendimiento aprovisionado.

    5. En la sección 3. En la columna Rendimiento, seleccione el rendimiento aprovisionado.

    6. Seleccione Apply.

    Para obtener información sobre cómo usar los parques infantiles de Amazon Bedrock, consulte. Genere respuestas en una interfaz visual utilizando parques infantiles

    API

    Para ejecutar una inferencia mediante un rendimiento aprovisionado, envíe una InvokeModelWithResponseStreamsolicitud InvokeModelo (consulte el enlace para ver los formatos de solicitud y respuesta y los detalles de los campos) con un punto de ejecución de Amazon Bedrock. Especifique el ARN del modelo aprovisionado como parámetro modelId. Para ver los requisitos del cuerpo de la solicitud para los distintos modelos, consulte. Parámetros de inferencia para modelos fundacionales

    Consulte los ejemplos de código

  • Asocie un rendimiento aprovisionado a un alias de agente: puede asociar un rendimiento aprovisionado al crear o actualizar un alias de agente. En la consola de Amazon Bedrock, puede elegir el rendimiento aprovisionado al configurar el alias o al editarlo. En la API de Amazon Bedrock, la provisionedThroughput especificas routingConfiguration cuando envías una solicitud CreateAgentAliaso UpdateAgentAlias;.