기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
배치 추론을 사용하면 여러 프롬프트를 제출하고 응답을 비동기적으로 생성할 수 있습니다. 배치 추론을 사용하면 단일 요청을 보내고 Amazon S3 버킷에서 응답을 생성하여 많은 수의 요청을 효율적으로 처리할 수 있습니다. 만든 파일에서 모델 입력을 정의한 후 파일을 S3 버킷에 업로드합니다. 그런 다음 배치 추론 요청을 제출하고 S3 버킷을 지정합니다. 작업이 완료되면 S3에서 출력 파일을 검색할 수 있습니다. 배치 추론을 사용하여 대규모 데이터 세트에 대한 모델 추론 성능을 개선할 수 있습니다.
참고
배치 추론은 프로비저닝된 모델에서는 지원되지 않습니다.
배치 추론에 대한 일반 정보는 다음 리소스를 참조하세요.
-
배치 추론에 대한 요금을 확인하려면 Amazon Bedrock 요금
을 참조하세요. -
배치 추론 할당량을 확인하려면 AWS 일반 참조의 Amazon Bedrock endpoints and quotas를 참조하세요.