Affichage des tâches d’inférence par lots - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Affichage des tâches d’inférence par lots

Note

L’inférence par lots est actuellement disponible en version préliminaire et susceptible d’être modifiée. L’inférence par lots n’est actuellement disponible que via l’API. Accédez aux API par lots via les kits SDK suivants.

Nous vous recommandons de créer un environnement virtuel pour utiliser le SDK. Les API d'inférence par lots ne étant pas disponibles dans les derniers SDK, nous vous recommandons de désinstaller la dernière version du SDK de l'environnement virtuel avant d'installer la version avec les API d'inférence par lots. Pour un exemple guidé, voirExemples de code.

Request format
GET /model-invocation-jobs?maxResults=maxResults&nameContains=nameContains&nextToken=nextToken&sortBy=sortBy&sortOrder=sortOrder&statusEquals=statusEquals&submitTimeAfter=submitTimeAfter&submitTimeBefore=submitTimeBefore HTTP/1.1
Response format
HTTP/1.1 200 Content-type: application/json { "invocationJobSummaries": [ { "clientRequestToken": "string", "endTime": "string", "inputDataConfig": { "s3InputDataConfig": { "s3Uri": "string", "s3InputFormat": "JSONL" } }, "jobArn": "string", "jobName": "string", "lastModifiedTime": "string", "message": "string", "modelId": "string", "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "string" } }, "roleArn": "string", "status": "Submitted | InProgress | Completed | Failed | Stopping | Stopped", "submitTime": "string" } ], "nextToken": "string" }

Pour obtenir des informations sur une tâche d’inférence par lots, envoyez une demande ListModelInvocationJobs. Vous pouvez définir les spécifications suivantes.

  • Filtrez les résultats en spécifiant le statut, l’heure d’envoi ou les sous-chaînes du nom de la tâche. Vous pouvez spécifier les statuts suivants :

    • Submitted

    • InProgress

    • Completed

    • Failed

    • Stopping

    • Stopped

  • Effectuez un tri en fonction de l’heure à laquelle la tâche a été créée (CreationTime). Vous pouvez spécifier un ordre de tri croissant (Ascending) ou décroissant (Descending).

  • Nombre maximum de résultats à renvoyer en réponse. Si le nombre de résultats est supérieur à ce que vous avez défini, la réponse renvoie un nextToken que vous pouvez envoyer dans une autre demande ListModelInvocationJobs afin de voir le lot suivant de tâches.

La réponse renvoie une liste d’objets InvocationJobSummary. Chaque objet contient des informations sur une tâche d’inférence par lots.