Creación de un trabajo de inferencia por lotes - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Creación de un trabajo de inferencia por lotes

Tras configurar un bucket de Amazon S3 con archivos para ejecutar la inferencia de modelos, puede crear un trabajo de inferencia por lotes.

nota

Para enviar un trabajo de inferencia por lotes mediante unVPC, debe utilizar el. API Seleccione la API pestaña para obtener información sobre cómo incluir la VPC configuración.

Para obtener información sobre cómo crear un trabajo de inferencia por lotes, seleccione la pestaña correspondiente al método que prefiera y siga los pasos:

Console
Para crear un trabajo de inferencia por lotes
  1. Inicie sesión en el AWS Management Console uso de un IAMrol con los permisos de Amazon Bedrock y abra la consola de Amazon Bedrock en. https://console.aws.amazon.com/bedrock/

  2. En el panel de navegación izquierdo, seleccione Inferencia de lotes.

  3. En la sección Trabajos de inferencia por lotes, elija Crear trabajo.

  4. En la sección Detalles del trabajo, asigne un nombre de trabajo al trabajo de inferencia por lotes y seleccione un modelo para usarlo en el trabajo de inferencia por lotes seleccionando Seleccionar modelo.

  5. En la sección Datos de entrada, elija Examinar S3 y seleccione la ubicación de S3 que contiene los archivos para su trabajo de inferencia por lotes. Compruebe que los archivos se ajusten al formato descrito enFormatee y cargue sus datos de inferencia por lotes.

    nota

    Si los datos de entrada están en un depósito de S3 que pertenece a una cuenta diferente de aquella desde la que envía el trabajo, debe utilizarlos API para enviar el trabajo de inferencia por lotes. Para obtener información sobre cómo hacerlo, seleccione la API pestaña de arriba.

  6. En la sección Datos de salida, elija Examinar S3 y seleccione una ubicación de S3 para almacenar los archivos de salida de su trabajo de inferencia por lotes. De forma predeterminada, los datos de salida se cifrarán mediante un. Clave administrada de AWS Para elegir una KMS clave personalizada, seleccione Personalizar la configuración de cifrado (avanzada) y elija una clave. Para obtener más información sobre el cifrado de los recursos de Amazon Bedrock y la configuración de una KMS clave personalizada, consulteCifrado de datos.

    nota

    Si piensa escribir los datos de salida en un bucket de S3 que pertenece a una cuenta diferente de aquella desde la que envía el trabajo, debe utilizar el API para enviar el trabajo de inferencia por lotes. Para obtener información sobre cómo hacerlo, seleccione la API pestaña de arriba.

  7. En la sección Acceso al servicio, selecciona una de las siguientes opciones:

    • Usar un rol de servicio existente: seleccione un rol de servicio en la lista desplegable. Para obtener más información sobre cómo configurar un rol personalizado con los permisos adecuados, consulte Permisos necesarios para la inferencia de lotes.

    • Crear y usar un nuevo rol de servicio: introduzca un nombre para el rol de servicio.

  8. (Opcional) Para asociar etiquetas al trabajo de inferencia por lotes, expanda la sección Etiquetas y añada una clave y un valor opcional para cada etiqueta. Para obtener más información, consulte Etiquetado de los recursos de Amazon Bedrock.

  9. Elija Crear trabajo de inferencia por lotes.

API

Para crear un trabajo de inferencia por lotes, envíe una CreateModelInvocationJobsolicitud (consulte el enlace para ver los formatos de solicitud y respuesta y los detalles de los campos) con un punto final del plano de control de Amazon Bedrock.

Los siguientes campos son obligatorios:

Campo Caso de uso
jobName Para especificar un nombre para el trabajo.
roleArn Para especificar el nombre de recurso de Amazon (ARN) del rol de servicio con permisos para crear y administrar el trabajo. Para obtener más información, consulte Crear un rol de servicio para la inferencia por lotes.
modelId Para especificar el ID o ARN el modelo que se va a utilizar en la inferencia.
inputDataConfig Para especificar la ubicación de S3 que contiene las solicitudes y las configuraciones que se van a enviar al trabajo. Para obtener más información, consulte Formatee y cargue sus datos de inferencia por lotes.
outputDataConfig Para especificar la ubicación de S3 en la que escribir las respuestas del modelo.

Los siguientes campos son opcionales:

Campo Caso de uso
timeoutDurationInHoras Para especificar la duración en horas tras la cual se agotará el tiempo de espera del trabajo.
etiquetas Para especificar las etiquetas que se van a asociar al trabajo. Para obtener más información, consulte Etiquetado de los recursos de Amazon Bedrock.
vpcConfig Para especificar la VPC configuración que se va a utilizar para proteger los datos durante el trabajo. Para obtener más información, consulte Proteja los trabajos de inferencia por lotes mediante un VPC.
clientRequestToken Identificador para garantizar que la API solicitud se complete solo una vez.

La respuesta devuelve un jobArn que puede utilizar para hacer referencia al trabajo cuando realice otras llamadas relacionadas con la inferencia API de lotes.