Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Aumente la capacidad de invocación de modelos con el rendimiento aprovisionado en Amazon Bedrock
El rendimiento se refiere al número y la velocidad de entradas y salidas que un modelo procesa y devuelve. Puede adquirir el rendimiento aprovisionado para proporcionar un mayor nivel de rendimiento para un modelo a un costo fijo. Si ha personalizado un modelo, debe adquirir el rendimiento aprovisionado para poder utilizarlo.
Se le facturará por hora el rendimiento aprovisionado que compre. Para obtener información detallada sobre los precios, consulta Amazon Bedrock Pricing
-
El modelo que elijas (en el caso de los modelos personalizados, el precio es el mismo que el del modelo base con el que se personalizó).
-
El número de unidades de modelo (MUs) que especifique para el rendimiento aprovisionado. Una MU ofrece un nivel de rendimiento específico para el modelo especificado. El nivel de rendimiento de una MU especifica lo siguiente:
-
El número de tokens de entrada que una MU puede procesar en todas las solicitudes en un lapso de un minuto.
-
La cantidad de tokens de salida que una MU puede generar en todas las solicitudes en un lapso de un minuto.
nota
Para obtener más información sobre lo que especifica una MU, ponte en contacto con tu Cuenta de AWS gerente.
-
-
El tiempo que se compromete a mantener el rendimiento aprovisionado. Cuanto mayor sea la duración del compromiso, mayor será el descuento del precio por hora. Puede elegir entre los siguientes niveles de compromiso:
-
Sin compromiso: puede eliminar el rendimiento aprovisionado en cualquier momento.
-
1 mes: no puede eliminar el rendimiento aprovisionado hasta que finalice el plazo de compromiso de un mes.
-
6 meses: no puede eliminar el rendimiento aprovisionado hasta que finalice el plazo de compromiso de seis meses.
nota
La facturación continúa hasta que elimines el rendimiento aprovisionado.
-
Los siguientes pasos describen el proceso de configuración y uso del rendimiento aprovisionado.
-
Determine la cantidad MUs que desea adquirir para un rendimiento aprovisionado y el tiempo durante el cual quiere comprometerse a usarlo.
-
Adquiera el rendimiento aprovisionado para un modelo básico o personalizado.
-
Una vez creado el modelo aprovisionado, puede usarlo para ejecutar la inferencia del modelo.
Temas
- Región y modelos compatibles para el rendimiento aprovisionado
- Requisitos previos para el rendimiento aprovisionado
- Adquiera un rendimiento aprovisionado para un modelo Amazon Bedrock
- Ver información sobre un rendimiento aprovisionado
- Modificar un rendimiento aprovisionado
- Utilice un rendimiento aprovisionado con un recurso de Amazon Bedrock
- Eliminar el rendimiento aprovisionado
- Ejemplos de código para el rendimiento aprovisionado