프로비저닝된 처리량 수정 - Amazon Bedrock

프로비저닝된 처리량 수정

기존 프로비저닝된 처리량의 이름 또는 태그를 편집할 수 있습니다.

프로비저닝된 처리량과 연결된 모델을 변경하는 데는 다음 제한 사항이 적용됩니다.

  • 기본 모델과 연결된 프로비저닝된 처리량의 모델은 변경할 수 없습니다.

  • 프로비저닝된 처리량이 사용자 지정 모델과 연결된 경우, 사용자 지정된 기본 모델 또는 동일한 기본 모델에서 파생된 다른 사용자 지정 모델로 연결을 변경할 수 있습니다.

프로비저닝된 처리량의 업데이트 중에 최종 고객의 지속적인 트래픽을 중단하지 않고도 프로비저닝된 처리량을 사용하여 추론을 실행할 수 있습니다. 프로비저닝된 처리량에 연결된 모델을 변경한 경우, 업데이트가 완전히 배포될 때까지 이전 모델에서 출력을 받을 수 있습니다.

프로비저닝된 처리량을 편집하는 방법을 알아보려면 선택한 방법에 해당하는 탭을 선택하고 안내된 단계를 따릅니다.

Console
  1. Amazon Bedrock 권한이 있는 IAM 역할을 사용하여 AWS Management Console에 로그인하고 https://console.aws.amazon.com/bedrock/에서 Amazon Bedrock 콘솔을 엽니다.

  2. 왼쪽 탐색 창의 평가 및 배포 아래에서 프로비저닝된 처리량을 선택합니다.

  3. 프로비저닝된 처리량 섹션에서 프로비저닝된 처리량을 선택합니다.

  4. 편집을 선택합니다. 다음 필드를 편집할 수 있습니다.

    • 프로비저닝된 처리량 이름 - 프로비저닝된 처리량의 이름을 변경합니다.

    • 모델 선택 - 프로비저닝된 처리량에 사용자 지정 모델이 연결되어 있는 경우, 연결된 모델을 변경할 수 있습니다.

  5. 태그 섹션에서 프로비저닝된 처리량에 연결된 태그를 편집할 수 있습니다. 자세한 내용은 Amazon Bedrock 리소스 태그 지정 단원을 참조하십시오.

  6. 편집 내용 저장을 선택하여 변경 사항을 저장합니다.

  7. 콘솔에 프로비저닝된 처리량 개요 페이지가 표시됩니다. 프로비저닝된 처리량 테이블의 프로비저닝된 처리량 상태업데이트 중으로 변경됩니다. 프로비저닝된 처리량 업데이트가 완료되면 상태서비스 중으로 바뀝니다. 업데이트가 실패하면 상태실패로 바뀝니다.

API

프로비저닝된 처리량을 편집하려면 Amazon Bedrock 컨트롤 플레인 엔드포인트를 사용하여 UpdateProvisionedModelThroughput 요청(요청 및 응답 형식과 필드 세부 정보는 링크 참조)을 전송합니다.

다음 테이블에서는 파라미터 및 요청 본문을 간략하게 설명합니다(자세한 내용과 요청 구조는 UpdateProvisionedModelThroughput 요청 구문 참조).

변수 필수? 사용 사례
provisionedModelId 업데이트할 프로비저닝된 처리량의 이름 또는 ARN을 지정합니다.
desiredModelId 아니요 프로비저닝된 처리량에 연결할 새 모델을 지정합니다(기본 모델에 연결된 프로비저닝된 처리량에는 사용할 수 없음).
desiredProvisionedModelName 아니요 프로비저닝된 처리량에 새 이름을 지정합니다.

작업이 성공하면 응답은 HTTP 200 상태 응답을 반환합니다. 프로비저닝된 처리량을 사용할 준비가 되었는지 확인하려면 GetProvisionedModelThroughput 요청을 전송하고 상태가 InService인지 확인합니다. 상태가 Updating인 경우 프로비저닝된 처리량을 업데이트하거나 삭제할 수 없습니다. 업데이트가 실패하면 상태가 Failed가 되고 GetProvisionedModelThroughput 응답에 failureMessage가 포함됩니다.

프로비저닝된 처리량에 태그를 추가하려면 Amazon Bedrock 컨트롤 플레인 엔드포인트를 사용하여 TagResource 요청(요청 및 응답 형식과 필드 세부 정보는 링크 참조)을 전송하고 프로비저닝된 처리량의 Amazon 리소스 이름(ARN)을 포함합니다. 요청 본문에는 각 태그에 지정한 키-값 페어가 포함된 객체인 tags 필드가 포함되어 있습니다.

프로비저닝된 처리량에서 태그를 제거하려면 Amazon Bedrock 컨트롤 플레인 엔드포인트를 사용하여 UntagResource 요청(요청 및 응답 형식과 필드 세부 정보는 링크 참조)을 전송하고 프로비저닝된 처리량의 Amazon 리소스 이름(ARN)을 포함합니다. tagKeys 요청 파라미터는 제거하려는 태그의 키가 포함된 목록입니다.

코드 예시 보기