추론 프로파일을 사용하여 모델 호출 리소스 설정 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

추론 프로파일을 사용하여 모델 호출 리소스 설정

추론 프로파일은 추론 프로파일이 모델 호출 요청을 라우팅할 수 있는 모델과 하나 이상의 리전을 정의하는 Amazon Bedrock의 리소스입니다. 다음 작업에 추론 프로파일을 사용할 수 있습니다.

  • 사용량 지표 추적 - CloudWatch 로그를 설정하고 애플리케이션 추론 프로필로 모델 호출 요청을 제출하여 모델 호출에 대한 사용량 지표를 수집합니다. 추론 프로파일에 대한 정보를 보고 이를 사용하여 결정을 알릴 때 이러한 지표를 검사할 수 있습니다. CloudWatch 로그를 설정하는 방법에 대한 자세한 내용은 섹션을 참조하세요 CloudWatch 로그를 사용하여 모델 호출 모니터링.

  • 태그를 사용하여 비용 모니터링 - 온디맨드 모델 호출 요청을 제출할 때 비용을 추적하기 위해 애플리케이션 추론 프로파일에 태그를 연결합니다. 비용 할당에 태그를 사용하는 방법에 대한 자세한 내용은 AWS Billing 사용 설명서의 비용 할당 태그를 사용하여 AWS 비용 구성 및 추적을 참조하세요.

  • 리전 간 추론 - 여러 개가 포함된 추론 프로파일을 사용하여 처리량을 늘립니다 AWS 리전. 추론 프로파일은 이러한 리전에 모델 호출 요청을 분산하여 처리량과 성능을 높입니다. 리전 간 추론에 대한 자세한 내용은 섹션을 참조하세요리전 간 추론을 통한 처리량 증가.

Amazon Bedrock은 다음과 같은 유형의 추론 프로파일을 제공합니다.

  • 교차 리전(시스템 정의) 추론 프로필 - Amazon Bedrock에서 사전 정의되고 모델에 대한 요청을 라우팅할 수 있는 여러 리전을 포함하는 추론 프로필입니다.

  • 애플리케이션 추론 프로필 - 사용자가 비용 및 모델 사용량을 추적하기 위해 생성하는 추론 프로필입니다. 모델 호출 요청을 한 리전 또는 여러 리전으로 라우팅하는 추론 프로파일을 생성할 수 있습니다.

    • 한 리전의 모델에 대한 비용 및 사용량을 추적하는 추론 프로파일을 생성하려면 추론 프로파일이 요청을 라우팅할 리전에서 파운데이션 모델을 지정합니다.

    • 여러 리전에서 모델의 비용 및 사용량을 추적하는 추론 프로파일을 생성하려면 추론 프로파일이 요청을 라우팅할 모델 및 리전을 정의하는 교차 리전(시스템 정의) 추론 프로파일을 지정합니다.

다음 기능과 함께 추론 프로파일을 사용하여 요청을 여러 리전으로 라우팅하고 이러한 기능으로 이루어진 호출 요청의 사용량과 비용을 추적할 수 있습니다.

추론 프로파일 사용 요금은 추론 프로파일을 호출하는 리전의 모델 가격을 기준으로 계산됩니다. 요금에 대한 자세한 내용은 Amazon Bedrock 요금을 참조하세요.

교차 리전 추론 프로파일이 제공할 수 있는 처리량에 대한 자세한 내용은 섹션을 참조하세요리전 간 추론을 통한 처리량 증가.