Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Procese múltiples solicitudes con inferencia por lotes
Con la inferencia por lotes, puede ejecutar varias solicitudes de inferencia de forma asíncrona para procesar una gran cantidad de solicitudes de manera eficiente al ejecutar la inferencia en los datos almacenados en un bucket de S3. Puede utilizar la inferencia por lotes para mejorar el rendimiento de la inferencia de modelos en conjuntos de datos de gran tamaño.
nota
La inferencia por lotes no se admite en los modelos aprovisionados.
Para ver las cuotas de la inferencia por lotes, consulte Cuotas de inferencias por lotes.
Amazon Bedrock admite la inferencia por lotes en todas las modalidades a partir de los modelos compatibles.
Almacene sus datos en un bucket de Amazon S3 para prepararlos para la inferencia por lotes. A continuación, podrá realizar y gestionar los trabajos de inferencia por lotes mediante la consola Amazon Bedrock o la. ModelInvocationJob
APIs
Temas
- Regiones y modelos compatibles en la inferencia por lotes
- Requisitos previos para la inferencia por lotes
- Creación de un trabajo de inferencia por lotes
- Ver información sobre los trabajos de inferencia por lotes
- Detención de un trabajo de inferencia por lotes
- Ver los resultados de un trabajo de inferencia por lotes
- Ejemplos de código