Elencazione dei processi di inferenza in batch - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Elencazione dei processi di inferenza in batch

Nota

L'inferenza in batch è disponibile nella versione di anteprima ed è soggetta a modifiche. L'inferenza in batch è attualmente disponibile solo tramite l'API. Accedi alle API in batch tramite i seguenti SDK.

Ti consigliamo di creare un ambiente virtuale per utilizzare l'SDK. Poiché le API di inferenza in batch non sono disponibili negli SDK più recenti, consigliamo di disinstallare l'ultima versione dell'SDK dall'ambiente virtuale prima di installare la versione con le API di inferenza in batch. Per un esempio guidato, consulta. Esempi di codice

Request format
GET /model-invocation-jobs?maxResults=maxResults&nameContains=nameContains&nextToken=nextToken&sortBy=sortBy&sortOrder=sortOrder&statusEquals=statusEquals&submitTimeAfter=submitTimeAfter&submitTimeBefore=submitTimeBefore HTTP/1.1
Response format
HTTP/1.1 200 Content-type: application/json { "invocationJobSummaries": [ { "clientRequestToken": "string", "endTime": "string", "inputDataConfig": { "s3InputDataConfig": { "s3Uri": "string", "s3InputFormat": "JSONL" } }, "jobArn": "string", "jobName": "string", "lastModifiedTime": "string", "message": "string", "modelId": "string", "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "string" } }, "roleArn": "string", "status": "Submitted | InProgress | Completed | Failed | Stopping | Stopped", "submitTime": "string" } ], "nextToken": "string" }

Per ottenere informazioni su un processo di inferenza in batch, invia un ListModelInvocationJobs. Puoi impostare le seguenti specifiche.

  • Filtra i risultati specificando lo stato, l'ora di invio o le sottostringhe nel nome del processo. È possibile specificare gli stati seguenti.

    • Submitted

    • InProgress

    • Completed

    • Failed

    • Stopping

    • Stopped

  • Ordina in base all'ora di creazione del processo. Puoi scegliere l'ordinamento Ascending o Descending.

  • Il numero massimo di risultati da restituire nella risposta. Se i risultati sono superiori al numero impostato, la risposta restituisce un nextToken che puoi inviare in un'altra richiesta ListModelInvocationJobs per visualizzare il successivo batch di processi.

La risposta restituisce un elenco di oggetti InvocationJobSummary. Ogni oggetto contiene informazioni su un processo di inferenza in batch.