기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
오토 스케일링을 사용하는 엔드포인트 업데이트
엔드포인트를 업데이트할 때 Application Auto Scaling은 엔드포인트의 어떤 모델이 오토 스케일링 대상인지 확인합니다. 업데이트로 인해 오토 스케일링 대상인 모델의 인스턴스 유형을 변경하면 업데이트는 실패합니다.
에는 모델을 업데이트하기 전에 오토 스케일링에서 모델을 등록 취소해야 한다는 경고가 AWS Management Console표시됩니다. UpdateEndpoint API를 호출하여 엔드포인트를 업데이트하려는 경우 호출은 실패합니다. 엔드포인트를 업데이트하기 전에 DeregisterScalableTarget Application Auto Scaling API 작업을 호출하여 이 엔드포인트에 대해 구성된 모든 크기 조정 정책을 삭제한 다음 크기 조정 가능 대상으로서 변형을 등록 취소합니다. 엔드포인트를 업데이트한 이후 업데이트된 변형을 크기 조정 가능한 대상으로 등록하고 크기 조정 정책을 첨부할 수 있습니다.
한 가지 예외가 있습니다. Auto Scaling에 대해 구성된 변형의 모델을 변경하면 Amazon SageMaker AI Auto Scaling이 업데이트를 허용합니다. 이는 모델 변경이 일반적으로 크기 조정 작업을 변경하는 데 충분한 성능에 영향을 미치지 않기 때문입니다. 오토 스케일링에 대해 구성된 변형의 모델을 업데이트하는 경우 모델 변경이 성능과 크기 조정 작업에 큰 영향을 미치지 않도록 해야 합니다.
Auto Scaling이 적용된 SageMaker AI 엔드포인트를 업데이트할 때 다음 단계를 완료합니다.
오토 스케일링이 적용된 엔드포인트를 업데이트하려면
-
DeregisterScalableTarget을 호출하여 엔드포인트를 확장 가능 대상에서 등록 취소합니다.
-
업데이트 작업이 진행되는 동안(또는 이전 단계에서 오토 스케일링을 해제한 경우)에는 오트 스케일링이 차단되므로 업데이트 중에 엔드포인트에 대한 인스턴스 수를 늘리기 위한 추가 예방 조치를 취할 수 있습니다. 이렇게 하려면 UpdateEndpointWeightsAndCapacities를 호출하여 엔드포인트에서 호스팅되는 프로덕션 변형에 대한 인스턴스 수를 업데이트하세요.
-
응답의
EndpointStatus
필드 값이InService
일 때까지 DescribeEndpoint를 반복하여 호출합니다. -
DescribeEndpointConfig를 호출하여 현재 엔드포인트 구성의 값을 얻습니다.
-
CreateEndpointConfig를 호출하여 새로운 엔드포인트 구성을 생성합니다. 기존 인스턴스 수 또는 가중치를 유지하려는 프로덕션 변형의 경우 이전 단계의 DescribeEndpointConfig 호출에 대한 응답과 동일한 변형 이름을 사용합니다. 다른 모든 값에는 이전 단계에서 DescribeEndpointConfig를 호출할 때 응답으로 받은 값을 사용합니다.
-
UpdateEndpoint를 호출하여 엔드포인트를 업데이트합니다. 이전 단계에서 생성한 엔드포인트 구성을
EndpointConfig
필드로 지정합니다. 인스턴스 수 또는 가중치 같은 변형 속성을 유지하려면RetainAllVariantProperties
파라미터 값을True
로 설정합니다. 이는 같은 이름의 프로덕션 변형이 새로운EndpointConfig
가 있는InitialInstanceCount
필드의 값에 관계없이DescribeEndpoint
호출에 대한 응답에서 가장 최근의DesiredInstanceCount
로 업데이트되도록 지정합니다. -
(선택 사항) RegisterScalableTarget 및 PutScalingPolicy을 호출하여 오토 스케일링 다시 활성화.
참고
1단계와 7단계는 다음과 같은 변경 사항으로 엔드포인트를 업데이트하는 경우에만 필요합니다.
-
오토 스케일링이 구성된 프로덕션 변형에 대한 인스턴스 유형 변경
-
오토 스케일링이 구성된 프로덕션 변형 제거