배치 추론 작업 생성 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

배치 추론 작업 생성

모델 추론을 실행하기 위한 파일로 Amazon S3 버킷을 설정한 후 배치 추론 작업을 만들 수 있습니다.

참고

를 사용하여 배치 추론 작업을 제출하려면를 사용해야 VPC합니다API. API 탭을 선택하여 VPC 구성을 포함하는 방법을 알아봅니다.

배치 추론 작업을 생성하는 방법을 알아보려면 원하는 메서드의 탭을 선택한 다음 다음 단계를 따릅니다.

Console
배치 추론 작업을 만드는 방법
  1. IAM Amazon Bedrock 권한이 있는 역할을 AWS Management Console 사용하여에 로그인하고에서 Amazon Bedrock 콘솔을 엽니다https://console.aws.amazon.com/bedrock/.

  2. 왼쪽 탐색 창에서 배치 추론을 선택합니다.

  3. 배치 추론 작업 섹션에서 작업 생성을 선택합니다.

  4. 작업 세부 정보 섹션에서 배치 추론 작업에 작업 이름을 부여하고 모델 선택을 선택하여 배치 추론 작업에 사용할 모델을 선택합니다.

  5. 입력 데이터 섹션에서 S3 찾아보기를 선택하고 배치 추론 작업의 파일이 포함된 S3 위치를 선택합니다. 파일이 추론 데이터의 형식 지정 및 업로드에 설명된 형식을 준수하는지 확인합니다.

    참고

    입력 데이터가 작업을 제출하는 계정과 다른 계정에 속하는 S3 버킷에 있는 경우 API를 사용하여 배치 추론 작업을 제출해야 합니다. 이를 수행하는 방법을 알아보려면 위의 API 탭을 선택합니다.

  6. 출력 데이터 섹션에서 S3 찾아보기를 선택하고 S3 위치를 선택하여 배치 추론 작업의 출력 파일을 저장합니다. 기본적으로 출력 데이터는에 의해 암호화됩니다 AWS 관리형 키. 사용자 지정 KMS 키를 선택하려면 암호화 설정 사용자 지정(고급)을 선택하고 키를 선택합니다. Amazon Bedrock 리소스의 암호화 및 사용자 지정 KMS 키 설정에 대한 자세한 내용은 섹션을 참조하세요데이터 암호화.

    참고

    작업을 제출하는 계정과 다른 계정에 속한 S3 버킷에 출력 데이터를 쓰려는 경우 API를 사용하여 배치 추론 작업을 제출해야 합니다. 이를 수행하는 방법을 알아보려면 위의 API 탭을 선택합니다.

  7. 서비스 액세스 섹션에서 다음 옵션 중 하나를 선택합니다.

    • 기존 서비스 역할 사용 - 드롭다운 목록에서 서비스 역할을 선택합니다. 적절한 권한이 있는 사용자 지정 역할을 설정하는 방법에 대한 자세한 내용은 배치 추론에 필요한 필수 권한 섹션을 참조하세요.

    • 새 서비스 역할 생성 및 사용 - 서비스 역할의 이름을 입력합니다.

  8. (선택 사항) 태그를 배치 추론 작업과 연결하려면 태그 섹션을 확장하고 각 태그에 키 및 선택적 값을 추가합니다. 자세한 내용은 Amazon Bedrock 리소스 태그 지정 단원을 참조하십시오.

  9. 배치 추론 작업 생성을 선택합니다.

API

배치 추론 작업을 생성하려면 Amazon Bedrock 컨트롤 플레인 엔드포인트CreateModelInvocationJob 요청을 보냅니다.

필수 필드는 다음과 같습니다.

필드 사용 사례
jobName 작업의 이름을 지정합니다.
roleArn 작업을 생성하고 관리할 수 있는 권한이 있는 서비스 역할의 Amazon 리소스 이름(ARN)을 지정합니다. 자세한 내용은 배치 추론을 위한 사용자 지정 서비스 역할 생성 단원을 참조하십시오.
modelId 추론에 사용할 모델의 ID 또는 ARN를 지정합니다.
inputDataConfig 작업에 제출할 프롬프트 및 구성이 포함된 S3 위치를 지정합니다. 자세한 내용은 추론 데이터의 형식 지정 및 업로드 단원을 참조하십시오.
outputDataConfig 모델 응답을 쓸 S3 위치를 지정합니다.

다음 필드는 선택 사항입니다.

필드 사용 사례
timeoutDurationIn시간 작업이 시간 초과되는 기간을 시간 단위로 지정합니다.
tags 작업과 연결할 태그를 지정합니다. 자세한 내용은 Amazon Bedrock 리소스 태그 지정 단원을 참조하십시오.
vpcConfig 작업 중에 데이터를 보호하는 데 사용할 VPC 구성을 지정합니다. 자세한 내용은 를 사용하여 배치 추론 작업 보호 VPC 단원을 참조하십시오.
clientRequestToken API 요청이 한 번만 완료되도록 하려면 자세한 내용은 Ensuring idempotency를 참조하세요.

응답은 다른 배치 추론 관련 API 호출을 수행할 때 작업을 참조하는 데 사용할 수 jobArn 있는를 반환합니다.