프로비저닝된 처리량 수정
기존 프로비저닝된 처리량의 이름 또는 태그를 편집할 수 있습니다.
프로비저닝된 처리량과 연결된 모델을 변경하는 데는 다음 제한 사항이 적용됩니다.
-
기본 모델과 연결된 프로비저닝된 처리량의 모델은 변경할 수 없습니다.
-
프로비저닝된 처리량이 사용자 지정 모델과 연결된 경우, 사용자 지정된 기본 모델 또는 동일한 기본 모델에서 파생된 다른 사용자 지정 모델로 연결을 변경할 수 있습니다.
프로비저닝된 처리량의 업데이트 중에 최종 고객의 지속적인 트래픽을 중단하지 않고도 프로비저닝된 처리량을 사용하여 추론을 실행할 수 있습니다. 프로비저닝된 처리량에 연결된 모델을 변경한 경우, 업데이트가 완전히 배포될 때까지 이전 모델에서 출력을 받을 수 있습니다.
프로비저닝된 처리량을 편집하는 방법을 알아보려면 선택한 방법에 해당하는 탭을 선택하고 안내된 단계를 따릅니다.
- Console
-
-
Amazon Bedrock 권한이 있는 IAM 역할을 사용하여 AWS Management Console에 로그인하고 https://console.aws.amazon.com/bedrock/
에서 Amazon Bedrock 콘솔을 엽니다. -
왼쪽 탐색 창의 평가 및 배포 아래에서 프로비저닝된 처리량을 선택합니다.
-
프로비저닝된 처리량 섹션에서 프로비저닝된 처리량을 선택합니다.
-
편집을 선택합니다. 다음 필드를 편집할 수 있습니다.
-
프로비저닝된 처리량 이름 - 프로비저닝된 처리량의 이름을 변경합니다.
-
모델 선택 - 프로비저닝된 처리량에 사용자 지정 모델이 연결되어 있는 경우, 연결된 모델을 변경할 수 있습니다.
-
-
태그 섹션에서 프로비저닝된 처리량에 연결된 태그를 편집할 수 있습니다. 자세한 내용은 Amazon Bedrock 리소스 태그 지정 단원을 참조하십시오.
-
편집 내용 저장을 선택하여 변경 사항을 저장합니다.
-
콘솔에 프로비저닝된 처리량 개요 페이지가 표시됩니다. 프로비저닝된 처리량 테이블의 프로비저닝된 처리량 상태가 업데이트 중으로 변경됩니다. 프로비저닝된 처리량 업데이트가 완료되면 상태가 서비스 중으로 바뀝니다. 업데이트가 실패하면 상태가 실패로 바뀝니다.
-
- API
-
프로비저닝된 처리량을 편집하려면 Amazon Bedrock 컨트롤 플레인 엔드포인트를 사용하여 UpdateProvisionedModelThroughput 요청(요청 및 응답 형식과 필드 세부 정보는 링크 참조)을 전송합니다.
다음 테이블에서는 파라미터 및 요청 본문을 간략하게 설명합니다(자세한 내용과 요청 구조는 UpdateProvisionedModelThroughput 요청 구문 참조).
변수 필수? 사용 사례 provisionedModelId 예 업데이트할 프로비저닝된 처리량의 이름 또는 ARN을 지정합니다. desiredModelId 아니요 프로비저닝된 처리량에 연결할 새 모델을 지정합니다(기본 모델에 연결된 프로비저닝된 처리량에는 사용할 수 없음). desiredProvisionedModelName 아니요 프로비저닝된 처리량에 새 이름을 지정합니다. 작업이 성공하면 응답은 HTTP 200 상태 응답을 반환합니다. 프로비저닝된 처리량을 사용할 준비가 되었는지 확인하려면 GetProvisionedModelThroughput 요청을 전송하고 상태가
InService
인지 확인합니다. 상태가Updating
인 경우 프로비저닝된 처리량을 업데이트하거나 삭제할 수 없습니다. 업데이트가 실패하면 상태가Failed
가 되고 GetProvisionedModelThroughput 응답에failureMessage
가 포함됩니다.프로비저닝된 처리량에 태그를 추가하려면 Amazon Bedrock 컨트롤 플레인 엔드포인트를 사용하여 TagResource 요청(요청 및 응답 형식과 필드 세부 정보는 링크 참조)을 전송하고 프로비저닝된 처리량의 Amazon 리소스 이름(ARN)을 포함합니다. 요청 본문에는 각 태그에 지정한 키-값 페어가 포함된 객체인
tags
필드가 포함되어 있습니다.프로비저닝된 처리량에서 태그를 제거하려면 Amazon Bedrock 컨트롤 플레인 엔드포인트를 사용하여 UntagResource 요청(요청 및 응답 형식과 필드 세부 정보는 링크 참조)을 전송하고 프로비저닝된 처리량의 Amazon 리소스 이름(ARN)을 포함합니다.
tagKeys
요청 파라미터는 제거하려는 태그의 키가 포함된 목록입니다.