Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Creación de un trabajo de inferencia por lotes
Tras configurar un bucket de Amazon S3 con archivos para ejecutar la inferencia de modelos, puede crear un trabajo de inferencia por lotes.
nota
Para enviar un trabajo de inferencia por lotes mediante unVPC, debe utilizar elAPI. Seleccione la API pestaña para obtener información sobre cómo incluir la VPC configuración.
Para obtener información sobre cómo crear un trabajo de inferencia por lotes, elija la pestaña correspondiente al método que prefiera y, a continuación, siga estos pasos:
- Console
-
Creación de un trabajo de inferencia por lotes
-
Inicie sesión en el AWS Management Console uso de un IAMrol con los permisos de Amazon Bedrock y abra la consola de Amazon Bedrock en. https://console.aws.amazon.com/bedrock/
-
En el panel de navegación de la izquierda, seleccione Inferencia por lotes.
-
En la sección Trabajos de inferencia por lotes, elija Crear trabajo.
-
En la sección Detalles del trabajo, asigne un Nombre del trabajo al trabajo de inferencia por lotes y seleccione un modelo para usarlo en el trabajo de inferencia por lotes eligiendo Seleccionar modelo.
-
En la sección Datos de entrada, elija Examinar S3 y seleccione la ubicación de S3 que contiene los archivos para su trabajo de inferencia por lotes. Compruebe que los archivos se ajusten al formato descrito en Formateo y carga de los datos de la inferencia por lotes.
nota
Si los datos de entrada se encuentran en un depósito de S3 que pertenece a una cuenta diferente a la cuenta desde la que envía el trabajo, debe utilizarlos API para enviar el trabajo de inferencia por lotes. Para obtener información sobre cómo hacerlo, seleccione la API pestaña de arriba.
-
En la sección Datos de salida, elija Examinar S3 y seleccione una ubicación de S3 para almacenar los archivos de salida de su trabajo de inferencia por lotes. De forma predeterminada, los datos de salida se cifrarán mediante un Clave administrada de AWS. Para elegir una KMS clave personalizada, seleccione Personalizar la configuración de cifrado (avanzada) y elija una clave. Para obtener más información sobre el cifrado de los recursos de Amazon Bedrock y la configuración de una KMS clave personalizada, consulteCifrado de datos.
nota
Si piensa escribir los datos de salida en un bucket de S3 que pertenezca a una cuenta diferente de aquella desde la que envía el trabajo, debe utilizar el API para enviar el trabajo de inferencia por lotes. Para obtener información sobre cómo hacerlo, seleccione la API pestaña de arriba.
-
En la sección Acceso al servicio, seleccione una de las siguientes opciones:
-
Usar un rol de servicio existente: seleccione un rol de servicio en la lista desplegable. Para obtener más información sobre cómo configurar un rol personalizado con los permisos adecuados, consulte Permisos obligatorios para la inferencia por lotes.
-
Crear y usar un nuevo rol de servicio: introduzca un nombre para el rol de servicio.
-
-
(Opcional) Para asociar etiquetas al trabajo de inferencia por lotes, expanda la sección Etiquetas y añada una clave y un valor opcional para cada etiqueta. Para obtener más información, consulte Etiquetado de los recursos de Amazon Bedrock.
-
Elija Crear trabajo de inferencia por lotes.
-
- API
-
Para crear un trabajo de inferencia por lotes, envíe una CreateModelInvocationJobsolicitud con un punto final del plano de control de Amazon Bedrock.
Los siguientes campos son obligatorios:
Campo Caso de uso jobName Para especificar un nombre para el trabajo. roleArn Para especificar el nombre de recurso de Amazon (ARN) del rol de servicio con permisos para crear y administrar el trabajo. Para obtener más información, consulte Crear un rol de servicio personalizado para la inferencia por lotes. modelId Para especificar el ID o ARN el modelo que se va a utilizar en la inferencia. inputDataConfig Para especificar la ubicación de S3 que contiene las peticiones y las configuraciones que se van a enviar al trabajo. Para obtener más información, consulte Formateo y carga de los datos de la inferencia por lotes. outputDataConfig Para especificar la ubicación de S3 en la que escribir las respuestas del modelo. Los siguientes campos son opcionales:
Campo Caso de uso timeoutDurationInHoras Para especificar la duración en horas tras la cual se agotará el tiempo de espera del trabajo. tags Para especificar las etiquetas que desee asociar al trabajo. Para obtener más información, consulte Etiquetado de los recursos de Amazon Bedrock. vpcConfig Para especificar la VPC configuración que se va a utilizar para proteger los datos durante el trabajo. Para obtener más información, consulte Proteja los trabajos de inferencia por lotes mediante un VPC. clientRequestToken Para garantizar que la API solicitud se complete solo una vez. Para obtener más información, consulte Ensuring idempotency. La respuesta devuelve un valor
jobArn
que puede utilizar para hacer referencia al trabajo cuando realice otras llamadas relacionadas con la inferencia API de lotes.