배치 추론 작업 나열 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

배치 추론 작업 나열

참고

배치 추론은 현재 미리 보기이므로 변경될 수도 있습니다. 배치 추론은 현재 API를 통해서만 사용할 수 있습니다. 다음 SDK를 통해 배치 API에 액세스할 수 있습니다.

SDK를 사용할 가상 환경을 만드는 것이 좋습니다. 최신 SDK에서는 일괄 추론 API를 사용할 수 없으므로 일괄 추론 API가 포함된 버전을 설치하기 전에 가상 환경에서 최신 버전의 SDK를 제거하는 것이 좋습니다. 가이드 예제는 을 참조하십시오. 코드 샘플

Request format
GET /model-invocation-jobs?maxResults=maxResults&nameContains=nameContains&nextToken=nextToken&sortBy=sortBy&sortOrder=sortOrder&statusEquals=statusEquals&submitTimeAfter=submitTimeAfter&submitTimeBefore=submitTimeBefore HTTP/1.1
Response format
HTTP/1.1 200 Content-type: application/json { "invocationJobSummaries": [ { "clientRequestToken": "string", "endTime": "string", "inputDataConfig": { "s3InputDataConfig": { "s3Uri": "string", "s3InputFormat": "JSONL" } }, "jobArn": "string", "jobName": "string", "lastModifiedTime": "string", "message": "string", "modelId": "string", "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "string" } }, "roleArn": "string", "status": "Submitted | InProgress | Completed | Failed | Stopping | Stopped", "submitTime": "string" } ], "nextToken": "string" }

배치 추론 작업에 대한 정보를 얻으려면 ListModelInvocationJobs를 전송합니다. 다음 사양을 설정할 수 있습니다

  • 작업 이름에 상태, 제출 시각 또는 하위 문자열을 지정하여 결과를 필터링합니다. 다음 상태를 지정할 수 있습니다.

    • Submitted

    • InProgress

    • Completed

    • Failed

    • Stopping

    • Stopped

  • 작업이 생성된 시각(CreationTime)으로 정렬합니다. Ascending 또는 Descending 순서대로 정렬할 수 있습니다.

  • 응답으로 반환할 최대 결과 수입니다. 설정한 수보다 많은 결과가 있는 경우 응답에서 nextToken이 반환되며, 이를 다른 ListModelInvocationJobs 요청으로 전송하여 다음 작업 배치를 확인할 수 있습니다.

응답은 InvocationJobSummary 객체 목록을 반환합니다. 각 객체에 배치 추론 작업에 대한 정보가 포함되어 있습니다.