Listar trabalhos de inferência em lote - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Listar trabalhos de inferência em lote

nota

A inferência em lote está em versão de pré-visualização e está sujeita a alterações. No momento, a inferência em lote só está disponível por meio da API. Acesse as APIs de lote por meio dos SDKs a seguir.

Recomendamos que você crie um ambiente virtual para usar o SDK. Como as APIs de inferência em lote não estão disponíveis nos SDKs mais recentes, recomendamos que você desinstale a versão mais recente do SDK do ambiente virtual antes de instalar a versão com as APIs de inferência em lote. Para ver um exemplo guiado, consulteExemplos de código.

Request format
GET /model-invocation-jobs?maxResults=maxResults&nameContains=nameContains&nextToken=nextToken&sortBy=sortBy&sortOrder=sortOrder&statusEquals=statusEquals&submitTimeAfter=submitTimeAfter&submitTimeBefore=submitTimeBefore HTTP/1.1
Response format
HTTP/1.1 200 Content-type: application/json { "invocationJobSummaries": [ { "clientRequestToken": "string", "endTime": "string", "inputDataConfig": { "s3InputDataConfig": { "s3Uri": "string", "s3InputFormat": "JSONL" } }, "jobArn": "string", "jobName": "string", "lastModifiedTime": "string", "message": "string", "modelId": "string", "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "string" } }, "roleArn": "string", "status": "Submitted | InProgress | Completed | Failed | Stopping | Stopped", "submitTime": "string" } ], "nextToken": "string" }

Para obter informações sobre um trabalho de inferência em lote, envie um ListModelInvocationJobs. Você pode definir as especificações a seguir.

  • Filtre os resultados especificando o status, a hora de envio ou as substrings no nome do trabalho. Você pode especificar os status a seguir.

    • Submitted

    • InProgress

    • Completed

    • Failed

    • Stopping

    • Stopped

  • Ordene pela hora em que o trabalho foi criado (CreationTime). Você pode classificar em ordem Ascending ou Descending.

  • O número máximo de resultados a serem retornados em uma resposta. Se houver mais resultados do que o número definido, a resposta retornará um nextToken que você poderá enviar em outra solicitação ListModelInvocationJobs para ver o próximo lote de trabalhos.

A resposta retorna uma lista de objetos InvocationJobSummary. Cada objeto contém informações sobre um trabalho de inferência em lote.