기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
모델 추론 중에 에이전트가 처리할 수 있는 토큰의 속도와 수를 높이려면, 에이전트가 사용하는 모델에 대해 구매한 프로비저닝된 처리량을 연결합니다. 프로비저닝된 처리량 및 구매 방법에 대한 자세한 내용은 Amazon Bedrock에서 프로비저닝된 처리량으로 모델 간접 호출 용량 증대 섹션을 참조하세요.
에이전트 별칭을 생성하거나 업데이트할 때 프로비저닝된 처리량을 연결할 수 있습니다. Amazon Bedrock 콘솔에서 별칭을 설정하거나 편집할 때 프로비저닝된 처리량을 선택합니다. Amazon Bedrock API에서 CreateAgentAlias 또는 UpdateAgentAlias; 요청을 보낼 때 routingConfiguration
에서 provisionedThroughput
을 지정합니다.