기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
처리량 모드
Amazon SageMaker Feature Store는 온디맨드(On-demand
) 및 프로비저닝된(Provisioned
) 처리량 모드라는 두 가지 요금 모델을 제공합니다. On-demand
는 예측 불가능한 트래픽에 가장 적합하고, Provisioned
는 일관되고 예측 가능한 트래픽에 가장 적합합니다.
애플리케이션 트래픽 패턴이 변경되거나 예측이 불가능한 기간을 수용하기 위해 지정된 특성 그룹에 대해 On-demand
및 Provisioned
처리량 모드 간에 전환할 수 있는 옵션이 있습니다. 특성 그룹 처리량 모드는 24시간 동안 한 번만 On-demand
로 업데이트할 수 있습니다. 처리량 모드는 UpdateFeatureGroup API를 사용해 프로그래밍 방식으로 또는 콘솔 UI를 통해 업데이트할 수 있습니다. 콘솔 사용 방법에 대한 자세한 내용은 콘솔에서 Amazon SageMaker Feature Store 사용 섹션을 참조하세요.
Provisioned
처리량 모드는 오프라인 전용 특성 그룹 또는 Standard
스토리지 유형을 사용하는 특성 그룹에서 사용할 수 있습니다. 다른 스토리지 구성의 경우 On-demand
처리량 모드가 사용됩니다. 온라인 및 오프라인 스토리지 구성에 대한 자세한 내용은 각각 온라인 저장소 및 오프라인 저장소 섹션을 참조하세요.
요금에 대한 자세한 내용은 Amazon SageMaker AI 요금을
온디맨드 처리량 모드
On-demand
(기본값) 처리량 모드는 워크로드를 알 수 없고 애플리케이션 트래픽을 예측할 수 없는 특성 그룹을 사용하며 용량 요구 사항을 예측할 수 없는 경우에 가장 적합합니다.
On-demand
모드에서는 애플리케이션이 특성 그룹에서 수행하는 읽기 및 쓰기에 대해 요금이 부과됩니다. Feature Store는 늘어나거나 줄어드는 워크로드를 즉시 수용하기 때문에 애플리케이션에서 수행할 것으로 예상되는 읽기 및 쓰기 처리량을 지정할 필요가 없습니다. ReadRequestsUnits
및 WriteRequestsUnits
에서 측정되는 사용량에 대해서만 비용을 지불합니다.
CreateFeatureGroup 또는 UpdateFeatureGroup API를 사용하거나 콘솔 UI를 통해 On-demand
처리량 모드를 활성화할 수 있습니다. 콘솔 UI 사용 방법에 대한 자세한 내용은 콘솔에서 Amazon SageMaker Feature Store 사용 섹션을 참조하세요.
중요
특성 그룹 처리량 모드는 24시간 동안 한 번만 On-demand
로 업데이트할 수 있습니다.
프로비저닝된 처리량 모드
Provisioned
처리량 모드는 워크로드가 예측 가능한 특성 그룹을 사용하며 비용을 통제하기 위해 용량 요구 사항을 예측할 수 있을 때 가장 적합합니다. 이 모드를 사용하면 처리량 요구 사항을 미리 예상할 수 있는 특정 워크로드에 대해 비용 효과가 높아질 수 있습니다.
특성 그룹을 Provisioned
모드로 설정하면 애플리케이션이 특성 그룹에서 사용할 수 있는 최대 용량인 용량 단위를 지정합니다. 애플리케이션에서 이 Provisioned
처리량 용량을 초과할 경우 스로틀링 요청이 적용됩니다.
아래에 읽기 및 쓰기 용량 단위에 대한 정보가 나와 있습니다.
-
GetRecord
API를 사용하여 최대 4KB의 단일 레코드를 검색하면 최소 1개의 RCU(읽기 용량 단위)를 사용합니다. 더 큰 페이로드를 검색하려면 더 많은 RCU가 사용될 수 있습니다. 필요한 총 읽기 용량 단위 수는 Feature Store 서비스에서 추가하는 레코드당 작은 메타데이터를 포함하여 항목 크기에 따라 달라집니다. -
PutRecord
API를 사용한 페이로드가 1KB인 단일 쓰기 요청은 최소 1개의 WCU(쓰기 용량 단위)를 소비하며, 분수 페이로드는 가장 가까운 KB로 반올림됩니다. 이벤트 시간, 레코드의 삭제 상태 및 Time to Live(TTL) 상태에 따라 더 많이 소비될 수 있습니다. TTL에 대한 자세한 내용은 레코드의 TTL (Time to live) 기간 섹션을 참조하세요.
중요
용량 단위를 설정할 때 다음을 고려하세요.
-
Provisioned
용량을 완전히 활용하지 않더라도 특성 그룹에 대해 프로비저닝하는 읽기 및 쓰기 용량에 대한 요금이 부과됩니다. -
읽기 또는 쓰기 용량을 너무 낮게 설정하면 요청에 스로틀링이 적용될 수 있습니다.
-
경우에 따라 레코드는 다양한 특성을 활성화하기 위해 Feature Store 서비스에서 추가하는 레코드 수준 메타데이터로 인해 추가 용량 단위를 사용할 수 있습니다.
-
GetRecord
또는BatchGetRecord
API를 사용하여 특성의 하위 집합만 검색해도 여전히 전체 레코드에 해당하는 RCU가 사용됩니다. -
쓰기 용량의 경우 많은 수의 기록 쓰기가 발생할 수 있는 채우기 또는 대량 수집을 수행할 때 스로틀링을 방지하기 위해 최근 피크 용량의 2배를 프로비저닝해야 합니다. 이는 기록 레코드 작성이 추가 쓰기 용량을 소비하기 때문입니다.
-
Feature Store는 현재
Provisioned
모드에 대한 오토 스케일링을 지원하지 않습니다.
CreateFeatureGroup 또는 UpdateFeatureGroup API를 사용하거나 콘솔 UI를 통해 On-demand
처리량 모드를 활성화할 수 있습니다. 콘솔 UI 사용 방법에 대한 자세한 내용은 콘솔에서 Amazon SageMaker Feature Store 사용 섹션을 참조하세요.
다음은 Provisioned
모드가 활성화될 때 특성 그룹의 RCU 및 WCU 처리량을 늘리거나 줄이는 방법을 설명합니다.
프로비저닝된 처리량 늘리기
UpdateFeatureGroup API 또는 콘솔 UI를 사용하여 필요한 만큼 자주 RCU 또는 WCU를 늘릴 수 있습니다.
프로비저닝된 처리량 줄이기
UpdateFeatureGroup API 또는 콘솔 UI를 사용하여 특성 그룹의 RCU 및 WCU(또는 둘 다)를 줄일 수 있습니다.
특성 그룹에서 하루에 수행할 수 있는 Provisioned
용량 감소 횟수에는 기본 할당량이 있습니다. 하루는 협정 세계시(UTC)에 따라 정의됩니다. 특정 일에 아직 용량 감소를 수행하지 않은 경우 한 시간 내에 최대 4회 용량 감소를 수행할 수 있습니다. 그 후에는 이전 시간에 용량 감소를 수행하지 않았다면 시간당 1회 추가 용량 감소를 수행할 수 있습니다. 이에 따라 하루에 줄일 수 있는 최대 횟수를 27회로 설정할 수 있습니다(처음 1시간 동안 4회 줄이기, 이후 1시간마다 1회 줄이기(당일 기준)).
처리량 모드 지표
On-demand
모드의 특성 그룹은 ConsumedReadRequestsUnits
및 ConsumedWriteRequestsUnits
지표를 내보냅니다. Provisioned
모드의 특성 그룹은 ConsumedReadCapacityUnits
및 ConsumedWriteCapacityUnits
지표를 내보냅니다. Feature Store 지표에 대한 자세한 내용은 Amazon SageMaker 특성 스토어 지표 섹션을 참조하세요.
처리량 모드 한도
각 AWS 계정 에는 가용성을 보장하고 결제 위험을 관리하는 데 도움이 되는 기본 서비스 할당량 또는 한도가 적용됩니다. 기본 할당량과 한도에 대한 자세한 내용은 할당량, 이름 지정 규칙 및 데이터 형식 섹션을 참조하세요.
경우에 따라 이러한 한도가 설명서에 명시된 한도보다 낮을 수 있습니다. 이 한도를 늘려야 하는 경우 증가 요청을 제출할 수 있습니다. 작업 중단을 방지하기 위해 기존 한도에 도달하기 전에 요청하는 것이 좋습니다. 서비스 할당량과 할당량 증가를 요청하는 방법에 대한 자세한 내용은 AWS 서비스 할당량을 참조하세요.