Aumento de la capacidad de invocación de modelos con el rendimiento aprovisionado en Amazon Bedrock - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Aumento de la capacidad de invocación de modelos con el rendimiento aprovisionado en Amazon Bedrock

El rendimiento es el número y la velocidad de entradas y salidas que procesa y devuelve un modelo. Puede adquirir rendimiento aprovisionado para proporcionar un mayor nivel de rendimiento para un modelo a un costo fijo. Para poder personalizar un modelo, debe adquirir rendimiento aprovisionado para poder usarlo.

El rendimiento aprovisionado que compre se le facturará por hora. Para obtener más información acerca de los precios, consulte Precios de Amazon Bedrock. El precio por hora depende de los siguientes factores:

  1. El modelo que elija (en el caso de los modelos personalizados, el precio es el mismo que el del modelo base con el que se ha personalizado).

  2. El número de unidades modelo (MUs) que especifique para el rendimiento aprovisionado. Una MU ofrece un nivel de rendimiento específico para el modelo especificado. El nivel de rendimiento de una MU especifica lo siguiente:

    • El número de tokens de entrada que puede procesar una MU en todas las solicitudes en un lapso de tiempo de un minuto.

    • El número de tokens de salida que puede procesar una MU en todas las solicitudes en un lapso de tiempo de un minuto.

    nota

    Para obtener más información sobre lo que especifica una MU, póngase en contacto con el administrador de la Cuenta de AWS .

  3. El tiempo que se compromete a mantener el rendimiento aprovisionado. Cuanto mayor sea la duración del compromiso, mayor será el descuento del precio por hora. Puede elegir entre los siguientes niveles de compromiso:

    • Sin compromiso: puede eliminar el rendimiento aprovisionado en cualquier momento.

    • Un mes: no puede eliminar el rendimiento aprovisionado hasta que finalice el plazo de compromiso de un mes.

    • Seis meses: no puede eliminar el rendimiento aprovisionado hasta que finalice el plazo de compromiso de seis meses.

    nota

    La facturación continúa hasta que elimine el rendimiento aprovisionado.

Los siguientes pasos describen el proceso de configuración y uso del rendimiento aprovisionado.

  1. Determine el número de unidades MUs que desea adquirir para un rendimiento aprovisionado y el tiempo durante el que quiere comprometerse a utilizarlo.

  2. Adquisición de rendimiento aprovisionado para un modelo base o personalizado.

  3. Una vez creado el modelo aprovisionado, puede usarlo para ejecutar la inferencia del modelo.