Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Aumento de la capacidad de invocación de modelos con el rendimiento aprovisionado en Amazon Bedrock

Modo de enfoque
Aumento de la capacidad de invocación de modelos con el rendimiento aprovisionado en Amazon Bedrock - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

El rendimiento es el número y la velocidad de entradas y salidas que procesa y devuelve un modelo. Puede adquirir rendimiento aprovisionado para proporcionar un mayor nivel de rendimiento para un modelo a un costo fijo. Para poder personalizar un modelo, debe adquirir rendimiento aprovisionado para poder usarlo.

El rendimiento aprovisionado que compre se le facturará por hora. Para obtener más información acerca de los precios, consulte Precios de Amazon Bedrock. El precio por hora depende de los siguientes factores:

  1. El modelo que elija (en el caso de los modelos personalizados, el precio es el mismo que el del modelo base con el que se ha personalizado).

  2. El número de unidades modelo (MUs) que especifique para el rendimiento aprovisionado. Una MU ofrece un nivel de rendimiento específico para el modelo especificado. El nivel de rendimiento de una MU especifica lo siguiente:

    • El número de tokens de entrada que puede procesar una MU en todas las solicitudes en un lapso de tiempo de un minuto.

    • El número de tokens de salida que puede procesar una MU en todas las solicitudes en un lapso de tiempo de un minuto.

    nota

    Para obtener más información sobre lo que especifica una MU, póngase en contacto con el administrador de la Cuenta de AWS .

  3. El tiempo que se compromete a mantener el rendimiento aprovisionado. Cuanto mayor sea la duración del compromiso, mayor será el descuento del precio por hora. Puede elegir entre los siguientes niveles de compromiso:

    • Sin compromiso: puede eliminar el rendimiento aprovisionado en cualquier momento.

    • Un mes: no puede eliminar el rendimiento aprovisionado hasta que finalice el plazo de compromiso de un mes.

    • Seis meses: no puede eliminar el rendimiento aprovisionado hasta que finalice el plazo de compromiso de seis meses.

    nota

    La facturación continúa hasta que elimine el rendimiento aprovisionado.

Los siguientes pasos describen el proceso de configuración y uso del rendimiento aprovisionado.

  1. Determine el número de unidades MUs que desea adquirir para un rendimiento aprovisionado y el tiempo durante el que quiere comprometerse a utilizarlo.

  2. Adquisición de rendimiento aprovisionado para un modelo base o personalizado.

  3. Una vez creado el modelo aprovisionado, puede usarlo para ejecutar la inferencia del modelo.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.