Aumente la capacidad de invocación de modelos con el rendimiento aprovisionado en Amazon Bedrock - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Aumente la capacidad de invocación de modelos con el rendimiento aprovisionado en Amazon Bedrock

El rendimiento se refiere al número y la velocidad de entradas y salidas que un modelo procesa y devuelve. Puede adquirir el rendimiento aprovisionado para proporcionar un mayor nivel de rendimiento para un modelo a un costo fijo. Si ha personalizado un modelo, debe adquirir el rendimiento aprovisionado para poder utilizarlo.

Se le facturará por hora el rendimiento aprovisionado que compre. Para obtener información detallada sobre los precios, consulta Amazon Bedrock Pricing. El precio por hora depende de los siguientes factores:

  1. El modelo que elijas (en el caso de los modelos personalizados, el precio es el mismo que el del modelo base con el que se personalizó).

  2. El número de unidades de modelo (MUs) que especifique para el rendimiento aprovisionado. Una MU ofrece un nivel de rendimiento específico para el modelo especificado. El nivel de rendimiento de una MU especifica lo siguiente:

    • El número de tokens de entrada que una MU puede procesar en todas las solicitudes en un lapso de un minuto.

    • La cantidad de tokens de salida que una MU puede generar en todas las solicitudes en un lapso de un minuto.

    nota

    Para obtener más información sobre lo que especifica una MU, ponte en contacto con tu Cuenta de AWS gerente.

  3. El tiempo que se compromete a mantener el rendimiento aprovisionado. Cuanto mayor sea la duración del compromiso, mayor será el descuento del precio por hora. Puede elegir entre los siguientes niveles de compromiso:

    • Sin compromiso: puede eliminar el rendimiento aprovisionado en cualquier momento.

    • 1 mes: no puede eliminar el rendimiento aprovisionado hasta que finalice el plazo de compromiso de un mes.

    • 6 meses: no puede eliminar el rendimiento aprovisionado hasta que finalice el plazo de compromiso de seis meses.

    nota

    La facturación continúa hasta que elimines el rendimiento aprovisionado.

Los siguientes pasos describen el proceso de configuración y uso del rendimiento aprovisionado.

  1. Determine la cantidad MUs que desea adquirir para un rendimiento aprovisionado y el tiempo durante el cual quiere comprometerse a usarlo.

  2. Adquiera el rendimiento aprovisionado para un modelo básico o personalizado.

  3. Una vez creado el modelo aprovisionado, puede usarlo para ejecutar la inferencia del modelo.