Crear un trabajo de inferencia por lotes

Tras configurar un bucket de Amazon S3 con archivos para ejecutar la inferencia de modelos, puede crear un trabajo de inferencia por lotes. Antes de empezar, compruebe que ha configurado los archivos de acuerdo con las instrucciones descritas en Formateo y carga de los datos de la inferencia por lotes.

nota

Para enviar un trabajo de inferencia por lotes mediante una VPC, debe usar la API. Seleccione la pestaña API para obtener información sobre cómo incluir la configuración de la VPC.

Para obtener más información sobre cómo crear un trabajo de inferencia en lotes, seleccione la pestaña correspondiente al método que prefiera y siga los pasos:

Console

Creación de un trabajo de inferencia por lotes

Inicie sesión AWS Management Console con una identidad de IAM que tenga permisos para usar la consola Amazon Bedrock. A continuación, abra la consola Amazon Bedrock en https://console.aws.amazon.com/bedrock.
En el panel de navegación de la izquierda, seleccione Inferencia por lotes.
En la sección Trabajos de inferencia por lotes, elija Crear trabajo.
En la sección Detalles del trabajo, asigne un Nombre del trabajo al trabajo de inferencia por lotes y seleccione un modelo para usarlo en el trabajo de inferencia por lotes eligiendo Seleccionar modelo.
En la sección Tipo de invocación del modelo, elija el formato de API para los datos de entrada. Elige InvokeModelsi los datos de entrada utilizan formatos de solicitud específicos del modelo o elige Converse si los datos de entrada utilizan el formato de la API de Converse. El valor predeterminado es InvokeModel.
En la sección Datos de entrada, elija Examinar S3 y seleccione la ubicación de S3 para el trabajo de inferencia en lotes. La inferencia en lotes procesa todos los archivos JSONL y los archivos de contenido adjuntos en esa ubicación de S3, tanto si la ubicación es una carpeta de S3 como un solo archivo JSONL.

nota
Si los datos de entrada están en un bucket de S3 que pertenece a una cuenta diferente de aquella desde la que envía el trabajo, debe usar la API para enviar el trabajo de inferencia por lotes. Para obtener información sobre cómo hacerlo, seleccione la pestaña API de arriba.
En la sección Datos de salida, elija Examinar S3 y seleccione una ubicación de S3 para almacenar los archivos de salida de su trabajo de inferencia por lotes. De forma predeterminada, los datos de salida se cifrarán mediante un Clave administrada de AWS. Para elegir una clave de KMS personalizada, seleccione Personalizar configuración de cifrado (avanzada) y elija una clave. Para obtener más información sobre el cifrado de los recursos de Amazon Bedrock y la configuración de una clave de KMS personalizada, consulte Cifrado de datos.

nota
Si tiene previsto escribir los datos de salida en un bucket de S3 que pertenece a una cuenta diferente de aquella desde la que envía el trabajo, debe usar la API para enviar el trabajo de inferencia por lotes. Para obtener información sobre cómo hacerlo, seleccione la pestaña API de arriba.
En la sección Acceso al servicio, seleccione una de las siguientes opciones:
- Usar un rol de servicio existente: seleccione un rol de servicio en la lista desplegable. Para obtener más información sobre cómo configurar un rol personalizado con los permisos adecuados, consulte Permisos obligatorios para la inferencia por lotes.
- Crear y usar un nuevo rol de servicio: introduzca un nombre para el rol de servicio.
(Opcional) Para asociar etiquetas al trabajo de inferencia por lotes, expanda la sección Etiquetas y añada una clave y un valor opcional para cada etiqueta. Para obtener más información, consulte Etiquetado de los recursos de Amazon Bedrock.
Elija Crear trabajo de inferencia por lotes.

API

Para crear un trabajo de inferencia por lotes, envíe una CreateModelInvocationJobsolicitud con un punto final del plano de control de Amazon Bedrock.

Los siguientes campos son obligatorios:

Campo	Caso de uso
jobName	Para especificar un nombre para el trabajo.
roleArn	Para especificar el Nombre de recurso de Amazon (ARN) del rol de servicio con permisos para crear y administrar el trabajo. Para obtener más información, consulte Creación de un rol de servicio personalizado para la inferencia en lotes.
modelId	Para especificar el ID o el ARN del modelo que se va a utilizar en la inferencia.
entrada DataConfig	Especificar la ubicación de S3 que contiene los datos de entrada. La inferencia en lotes procesa todos los archivos JSONL y los archivos de contenido adjuntos en esa ubicación de S3, tanto si la ubicación es una carpeta de S3 como un solo archivo JSONL. Para obtener más información, consulte Formateo y carga de los datos de la inferencia por lotes.
salida DataConfig	Para especificar la ubicación de S3 en la que escribir las respuestas del modelo.

Los siguientes campos son opcionales:

Campo	Caso de uso
modelo InvocationType	Para especificar el formato de API de los datos de entrada. `Converse`Configúrelo para usar el formato de la API de Converse o `InvokeModel` (predeterminado) para usar formatos de solicitud específicos del modelo. Para obtener más información sobre el formato de solicitud de Converse, consulte Converse.
tiempo de espera DurationInHours	Para especificar la duración en horas tras la cual se agotará el tiempo de espera del trabajo.
etiquetas	Para especificar las etiquetas que desee asociar al trabajo. Para obtener más información, consulte Etiquetado de los recursos de Amazon Bedrock.
vpcConfig	Para especificar la configuración de VPC que se va a utilizar para proteger los datos durante el trabajo. Para obtener más información, consulte Protección de los trabajos de inferencia de lotes mediante una VPC.
cliente RequestToken	Para garantizar que la solicitud de la API se complete solo una vez. Para obtener más información, consulte Ensuring idempotency.

La respuesta devuelve un jobArn que puede usar para hacer referencia al trabajo al realizar otras llamadas a la API relacionadas con la inferencia por lotes.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

[Opcional] Configuración de una VPC

Monitorear trabajos