Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Configurar un recurso de invocación de modelos mediante perfiles de inferencia

Modo de enfoque
Configurar un recurso de invocación de modelos mediante perfiles de inferencia - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Los perfiles de inferencia son un recurso de Amazon Bedrock que define un modelo y una o más regiones a las que el perfil de inferencia puede dirigir las solicitudes de invocación del modelo. Puede utilizar los perfiles de inferencia para las siguientes tareas:

  • Realice un seguimiento de las métricas de uso: configure CloudWatch registros y envíe las solicitudes de invocación del modelo con un perfil de inferencia de la aplicación para recopilar las métricas de uso para la invocación del modelo. Puede examinar estas métricas cuando consulte la información sobre el perfil de inferencia y utilizarlas para fundamentar sus decisiones. Para obtener más información sobre cómo configurar CloudWatch los registros, consulteSupervise la invocación del modelo mediante registros CloudWatch .

  • Use etiquetas para monitorear los costos: adjunte etiquetas al perfil de inferencia de una aplicación para realizar un seguimiento de los costos cuando envíe solicitudes de invocación de modelos bajo demanda. Para obtener más información sobre cómo utilizar las etiquetas para la asignación de costes, consulte Organización y seguimiento de los costes mediante etiquetas de asignación de AWS costes en la guía del AWS Billing usuario.

  • Inferencia entre regiones: aumente su rendimiento mediante un perfil de inferencia que incluya varios. Regiones de AWS El perfil de inferencia distribuirá las solicitudes de invocación de modelos entre estas regiones para aumentar el rendimiento y el rendimiento. Para obtener más información sobre la inferencia entre regiones, consulte. Aumente el rendimiento con la inferencia entre regiones

Amazon Bedrock ofrece los siguientes tipos de perfiles de inferencia:

  • Perfiles de inferencia entre regiones (definidos por el sistema): perfiles de inferencia que están predefinidos en Amazon Bedrock e incluyen varias regiones a las que se pueden dirigir las solicitudes de un modelo.

  • Perfiles de inferencia de aplicaciones: perfiles de inferencia que un usuario crea para realizar un seguimiento de los costos y el uso del modelo. Puede crear un perfil de inferencia que dirija las solicitudes de invocación del modelo a una o varias regiones:

    • Para crear un perfil de inferencia que haga un seguimiento de los costos y el uso de un modelo en una región, especifique el modelo base de la región a la que desea que el perfil de inferencia dirija las solicitudes.

    • Para crear un perfil de inferencia que haga un seguimiento de los costos y el uso de un modelo en varias regiones, especifique el perfil de inferencia entre regiones (definido por el sistema) que defina el modelo y las regiones a las que desea que el perfil de inferencia dirija las solicitudes.

Puede usar perfiles de inferencia con las siguientes funciones para enrutar las solicitudes a varias regiones y realizar un seguimiento del uso y el costo de las solicitudes de invocación realizadas con estas funciones:

El precio del uso de un perfil de inferencia se calcula en función del precio del modelo en la región desde la que se llama al perfil de inferencia. Para obtener más información acerca de los precios, consulte Precios de Amazon Bedrock.

Para obtener más información sobre el rendimiento que puede ofrecer un perfil de inferencia entre regiones, consulte. Aumente el rendimiento con la inferencia entre regiones

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.