

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 배치 추론 작업 생성
<a name="batch-inference-create"></a>

모델 추론을 실행하기 위한 파일로 Amazon S3 버킷을 설정한 후 배치 추론 작업을 만들 수 있습니다. 시작하기 전에 [추론 데이터의 형식 지정 및 업로드](batch-inference-data.md)에 설명된 지침에 따라 파일을 설정했는지 확인합니다.

**참고**  
VPC를 사용하여 배치 추론 작업을 제출하려면 API를 사용해야 합니다. API 탭을 선택하여 VPC 구성을 포함하는 방법을 알아봅니다.

배치 추론 작업을 생성하는 방법을 알아보려면 원하는 방법의 탭을 선택한 후 다음 단계를 따릅니다.

------
#### [ Console ]

**배치 추론 작업을 만드는 방법**

1. Amazon Bedrock 콘솔을 사용할 권한이 있는 IAM 자격 증명 AWS Management Console 으로에 로그인합니다. 그 다음 [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock)에서 Amazon Bedrock 콘솔을 엽니다.

1. 왼쪽 탐색 창에서 **배치 추론**을 선택합니다.

1. **배치 추론 작업** 섹션에서 **작업 생성**을 선택합니다.

1. **작업 세부 정보** 섹션에서 배치 추론 작업에 **작업 이름**을 부여하고 **모델 선택**을 선택하여 배치 추론 작업에 사용할 모델을 선택합니다.

1. **모델 호출 유형** 섹션에서 입력 데이터의 API 형식을 선택합니다. 입력 데이터가 모델별 요청 형식을 사용하는 경우 **InvokeModel**을 선택하고, 입력 데이터가 **Converse** API 형식을 사용하는 경우 Converse를 선택합니다. 기본값은 **InvokeModel**입니다.

1. **입력 데이터** 섹션에서 **S3 찾아보기**를 선택하고 배치 추론 작업의 S3 위치를 선택합니다. 배치 추론은 위치가 S3 폴더이든 단일 JSONL 파일이든 관계없이 해당 S3 위치에서 모든 JSONL 및 관련 콘텐츠 파일을 처리합니다.
**참고**  
입력 데이터가 작업을 제출하는 계정과 다른 계정에 속한 S3 버킷에 있는 경우, API를 사용하여 배치 추론 작업을 제출해야 합니다. 이를 수행하는 방법을 알아보려면 위의 API 탭을 선택합니다.

1. **출력 데이터** 섹션에서 ** S3 찾아보**기를 선택하고 배치 추론 작업의 출력 파일을 저장할 S3 위치를 선택합니다. 기본적으로 출력 데이터는에 의해 암호화됩니다 AWS 관리형 키. 사용자 지정 KMS 키를 선택하려면 **암호화 설정 사용자 지정(고급)**을 선택하고 키를 선택합니다. Amazon Bedrock 리소스의 암호화 및 사용자 지정 KMS 키 설정에 대한 자세한 내용은 [데이터 암호화](data-encryption.md) 섹션을 참조하세요.
**참고**  
작업을 제출하는 계정과 다른 계정에 속한 S3 버킷에 출력 데이터를 쓰려는 경우, API를 사용하여 배치 추론 작업을 제출해야 합니다. 이를 수행하는 방법을 알아보려면 위의 API 탭을 선택합니다.

1. **서비스 액세스** 섹션에서 다음 옵션 중 하나를 선택합니다.
   + **기존 서비스 역할 사용** - 드롭다운 목록에서 서비스 역할을 선택합니다. 적절한 권한이 있는 사용자 지정 역할을 설정하는 방법에 대한 자세한 내용은 [배치 추론에 필요한 필수 권한](batch-inference-permissions.md) 섹션을 참조하세요.
   + **새 서비스 역할 생성 및 사용** - 서비스 역할의 이름을 입력합니다.

1. (선택 사항) 태그를 배치 추론 작업과 연결하려면 **태그** 섹션을 확장하고 각 태그에 키 및 선택적 값을 추가합니다. 자세한 내용은 [Amazon Bedrock 리소스 태그 지정](tagging.md) 섹션을 참조하세요.

1. **배치 추론 작업 생성**을 선택합니다.

------
#### [ API ]

배치 추론 작업을 만들려면 [Amazon Bedrock 컨트롤 플레인 엔드포인트](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)를 사용하여 [CreateModelInvocationJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateModelInvocationJob.html) 요청을 전송합니다.

필수 필드는 다음과 같습니다.


****  

| Field | 사용 사례: | 
| --- | --- | 
| jobName | 작업의 이름을 지정합니다. | 
| roleArn | 작업을 만들고 관리할 수 있는 권한이 있는 서비스 역할의 Amazon 리소스 이름(ARN)을 지정합니다. 자세한 내용은 [배치 추론을 위한 사용자 지정 서비스 역할 생성](batch-iam-sr.md) 섹션을 참조하세요. | 
| modelId | 추론에 사용할 모델의 ID 또는 ARN을 지정합니다. | 
| inputDataConfig | 입력 데이터가 포함된 S3 위치를 지정합니다. 배치 추론은 위치가 S3 폴더이든 단일 JSONL 파일이든 관계없이 해당 S3 위치에서 모든 JSONL 및 관련 콘텐츠 파일을 처리합니다. 자세한 내용은 [추론 데이터의 형식 지정 및 업로드](batch-inference-data.md) 단원을 참조하십시오. | 
| outputDataConfig | 모델 응답을 쓸 S3 위치를 지정합니다. | 

다음 필드는 선택 사항입니다.


****  

| Field | 사용 사례: | 
| --- | --- | 
| modelInvocationType | 입력 데이터의 API 형식을 지정합니다. Converse API 형식을 사용하려면 Converse로 설정하고, 모델별 요청 형식을 사용하려면 InvokeModel (기본값)로 설정합니다. Converse 요청 형식에 대한 자세한 내용은 [Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html)를 참조하세요. | 
| timeoutDurationInHours | 작업이 시간 초과되는 기간을 시간 단위로 지정합니다. | 
| tags | 작업과 연결할 태그를 지정합니다. 자세한 내용은 [Amazon Bedrock 리소스 태그 지정](tagging.md) 섹션을 참조하세요. | 
| vpcConfig | 작업 중 데이터를 보호하는 데 사용할 VPC 구성을 지정합니다. 자세한 내용은 [VPC를 사용하여 배치 추론 작업 보호](batch-vpc.md) 섹션을 참조하세요. | 
| clientRequestToken | API 요청이 한 번만 완료되도록 합니다. 자세한 내용은 [멱등성 보장하기](https://docs.aws.amazon.com/ec2/latest/devguide/ec2-api-idempotency.html)를 참조하세요. | 

응답은 다른 배치 추론 관련 API 직접 호출을 수행할 때 작업을 참조하는 데 사용할 수 있는 `jobArn`을 반환합니다.

------