Aumento de la capacidad de invocación de modelos con el rendimiento aprovisionado en Amazon Bedrock

El rendimiento es el número y la velocidad de entradas y salidas que procesa y devuelve un modelo. Puede adquirir rendimiento aprovisionado para proporcionar un mayor nivel de rendimiento para un modelo a un costo fijo. Para poder personalizar un modelo, debe adquirir rendimiento aprovisionado para poder usarlo.

El rendimiento aprovisionado que compre se le facturará por hora. Para obtener más información acerca de los precios, consulte Precios de Amazon Bedrock. El precio por hora depende de los siguientes factores:

El modelo que elija (en el caso de los modelos personalizados, el precio es el mismo que el del modelo base con el que se ha personalizado).
El número de unidades modelo (MU) que ha especificado para el rendimiento aprovisionado. Una MU ofrece un nivel de rendimiento específico para el modelo especificado. El nivel de rendimiento de una MU especifica lo siguiente:
- El número de tokens de entrada que puede procesar una MU en todas las solicitudes en un lapso de tiempo de un minuto.
- El número de tokens de salida que puede procesar una MU en todas las solicitudes en un lapso de tiempo de un minuto.
nota
Para obtener más información sobre lo que especifica una MU, los precios por MU y para solicitar aumentos de límites, ponte en contacto con tu Cuenta de AWS gerente.
El tiempo que se compromete a mantener el rendimiento aprovisionado. Cuanto mayor sea la duración del compromiso, mayor será el descuento del precio por hora. Puede elegir entre los siguientes niveles de compromiso:
- Sin compromiso: puede eliminar el rendimiento aprovisionado en cualquier momento.
- Un mes: no puede eliminar el rendimiento aprovisionado hasta que finalice el plazo de compromiso de un mes.
- Seis meses: no puede eliminar el rendimiento aprovisionado hasta que finalice el plazo de compromiso de seis meses.
nota
La facturación continúa hasta que elimine el rendimiento aprovisionado.

Los siguientes pasos describen el proceso de configuración y uso del rendimiento aprovisionado.

Determine la cantidad de MU que quiere comprar para un rendimiento aprovisionado y la cantidad de tiempo durante la que quiere comprometerse a utilizar el rendimiento aprovisionado.
Adquisición de rendimiento aprovisionado para un modelo base o personalizado.
Una vez creado el modelo aprovisionado, puede usarlo para ejecutar la inferencia del modelo.

Temas

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Eliminación de un perfil de inferencia de aplicaciones

Regiones y modelos admitidos

Aumento de la capacidad de invocación de modelos con el rendimiento aprovisionado en Amazon Bedrock

nota

nota

Temas