Enumeración de los trabajos de inferencia por lotes - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Enumeración de los trabajos de inferencia por lotes

nota

La inferencia por lotes está en versión de vista previa y sujeta a cambios. Actualmente, la inferencia por lotes solo está disponible a través de la API. Puede acceder a las API por lotes a través de los siguientes SDK.

Le recomendamos que cree un entorno virtual para usar el SDK. Como las API de inferencia por lotes no están disponibles en los SDK más recientes, le recomendamos que desinstale la última versión del SDK del entorno virtual antes de instalar la versión con las API de inferencia por lotes. Para ver un ejemplo guiado, consulte. Ejemplos de código

Request format
GET /model-invocation-jobs?maxResults=maxResults&nameContains=nameContains&nextToken=nextToken&sortBy=sortBy&sortOrder=sortOrder&statusEquals=statusEquals&submitTimeAfter=submitTimeAfter&submitTimeBefore=submitTimeBefore HTTP/1.1
Response format
HTTP/1.1 200 Content-type: application/json { "invocationJobSummaries": [ { "clientRequestToken": "string", "endTime": "string", "inputDataConfig": { "s3InputDataConfig": { "s3Uri": "string", "s3InputFormat": "JSONL" } }, "jobArn": "string", "jobName": "string", "lastModifiedTime": "string", "message": "string", "modelId": "string", "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "string" } }, "roleArn": "string", "status": "Submitted | InProgress | Completed | Failed | Stopping | Stopped", "submitTime": "string" } ], "nextToken": "string" }

Para obtener información sobre un trabajo de inferencia por lotes, envíe un ListModelInvocationJobs. Puede especificar las opciones siguientes.

  • Filtre los resultados especificando el estado, la hora de envío o las subcadenas del nombre del trabajo. Puede especificar los siguientes estados:

    • Submitted

    • InProgress

    • Completed

    • Failed

    • Stopping

    • Stopped

  • Ordenación por la hora a la que se creó el trabajo (CreationTime). Puede ordenar por orden Ascending o Descending.

  • El número máximo de resultados que se devuelven en una respuesta. Si hay más resultados que la cantidad que ha establecido, la respuesta devuelve un nextToken que puede enviar en otra solicitud ListModelInvocationJobs para ver el siguiente lote de trabajos.

La respuesta devuelve una lista de objetos InvocationJobSummary. Cada objeto contiene información sobre un trabajo de inferencia por lotes.