기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
이 주제에서는 예측 조정의 작동 방식과 예측 조정 정책을 생성할 때 고려해야 할 사항을 설명합니다.
작동 방법
예측 조정을 사용하려면 모니터링 및 분석할 CloudWatch 지표를 지정하는 예측 조정 정책을 생성합니다. 예측 조정이 미래 값 예측을 시작하려면 이 지표에 24시간 이상의 데이터가 있어야 합니다.
정책을 생성한 후 예측 조정은 패턴을 식별하기 위해 지난 14일까지의 지표 데이터를 분석하기 시작합니다. 이 분석을 사용하여 향후 48시간의 용량 요건에 대한 시간별 예측을 생성합니다. 예측은 최신 CloudWatch 데이터를 사용하여 6시간마다 업데이트됩니다. 새로운 데이터가 들어오면 예측 조정을 통해 향후 예측의 정확도를 지속적으로 개선할 수 있습니다.
예측 조정을 처음 활성화하면 예측 전용 모드에서 실행됩니다. 이 모드에서는 용량 예측을 생성하지만 이러한 예측을 기반으로 Auto Scaling 그룹을 실제로 조정하지는 않습니다. 이를 통해 예측의 정확성과 적합성을 평가할 수 있습니다. GetPredictiveScalingForecast
API 작업 또는 AWS Management Console을 사용하여 예측 데이터를 볼 수 있습니다.
예측 데이터를 검토하고 해당 데이터를 기반으로 조정을 시작하기로 결정한 후에 조정 정책을 예측 및 조정 모드로 전환합니다. 이 모드에서는 다음을 수행합니다.
-
예측에서 부하가 증가할 것으로 예상되는 경우 Amazon EC2 Auto Scaling은 스케일 아웃을 통해 용량을 늘립니다.
-
예측에서 부하가 감소할 것으로 예상되는 경우 용량을 제거하기 위해 스케일 인하지 않습니다. 더 이상 필요하지 않은 용량을 제거하려면 동적 조정 정책을 생성해야 합니다.
기본적으로 Amazon EC2 Auto Scaling은 해당 시간의 예측을 기반으로 매 시간 시작 시 Auto Scaling 그룹을 조정합니다. 선택적으로 PutScalingPolicy
API 작업의 SchedulingBufferTime
속성 또는 AWS Management Console의 사전 시작 인스턴스 설정을 사용하여 더 이른 시작 시간을 지정할 수 있습니다. 이에 따라 Amazon EC2 Auto Scaling이 예상 수요보다 먼저 새 인스턴스를 시작하므로 부팅하고 트래픽을 처리할 시간을 확보할 수 있습니다.
예측된 수요보다 먼저 새 인스턴스를 시작할 수 있도록 Auto Scaling 그룹의 기본 인스턴스 워밍업을 활성화하는 것이 좋습니다. 이는 동적 조정 정책에서 용량을 줄여야 한다고 표시하더라도 Amazon EC2 Auto Scaling이 스케일 인되지 않는 동안 스케일 아웃 활동 이후의 기간을 지정합니다. 이렇게 하면 새로 시작된 인스턴스가 스케일 인 작업에 고려되기 전에 증가된 트래픽에 대한 서비스를 시작하기에 충분한 시간을 확보할 수 있습니다. 자세한 내용은 Auto Scaling 그룹의 기본 인스턴스 워밍업 설정 단원을 참조하십시오.
최대 용량 제한
Auto Scaling 그룹에는 그룹에 대해 시작할 수 있는 EC2 인스턴스의 최대 수를 제한하는 최대 용량 설정이 있습니다. 기본적으로 조정 정책이 설정되면 용량을 최대 용량보다 크게 늘일 수 없습니다.
또는 예측 용량이 Auto Scaling 그룹의 최대 용량에 가깝거나 이를 초과하는 경우 그룹의 최대 용량을 자동으로 늘리도록 허용할 수 있습니다. 이 동작을 활성화하려면 PutScalingPolicy
API 작업에서 MaxCapacityBreachBehavior
및 MaxCapacityBuffer
속성을 사용하거나 AWS Management Console에서 최대 용량 동작 설정을 사용합니다.
주의
최대 용량을 자동으로 늘리도록 허용할 때에는 주의해야 합니다. 증가한 최대 용량을 모니터링하고 관리하지 않으면 의도한 것보다 더 많은 인스턴스가 시작될 수 있습니다. 증가한 최대 용량은 수동으로 업데이트할 때까지 Auto Scaling 그룹의 새로운 정상 최대 용량이 됩니다. 최대 용량은 원래 최대 용량으로 자동으로 감소하지 않습니다.
고려 사항
-
예측 스케일 아웃이 워크로드에 적합한지 확인합니다. 워크로드가 특정 요일이나 시간에 반복되는 로드 패턴을 나타내는 경우, 예측 조정에 적합합니다. 이를 확인하려면 예상 전용 모드에서 예측적 조정 정책을 구성한 다음 콘솔의 권장 사항을 참조하세요. Amazon EC2 Auto Scaling은 잠재적인 정책 성능에 대한 관찰에 근거하여 권장 사항을 제공합니다. 예측적 조정이 애플리케이션 크기를 능동적으로 조정하도록 하기 전에 예측과 권장 사항을 평가합니다.
-
예측 조정이 예상을 시작하려면 최소 24시간 동안의 기록 데이터가 필요합니다. 그러나 기록 데이터가 2주 전체에 걸쳐 있는 경우, 예측이 더 정확합니다. 새 Auto Scaling 그룹을 생성하고 이전 그룹을 삭제하여 애플리케이션을 업데이트하는 경우, 예측 조정에서 예상 생성을 다시 시작하기 전에 새 Auto Scaling 그룹에는 24시간 동안의 기록 로드 데이터가 필요합니다. 사용자 지정 지표를 사용하여 이전 Auto Scaling 그룹과 새 Auto Scaling 그룹의 지표를 집계할 수 있습니다. 그렇지 않으면 더욱 정확한 예측을 위해 며칠을 기다려야 할 수 있습니다.
-
애플리케이션의 전체 로드를 정확하게 나타내고 확장해야 하는 애플리케이션의 측면인 부하 지표를 선택합니다.
-
예측 조정과 함께 동적 조정을 사용하면 애플리케이션에 대한 수요 곡선을 면밀히 따를 수 있으며, 트래픽이 적은 기간에는 스케일 인하고 트래픽이 예상보다 높을 때는 스케일 아웃합니다. 여러 조정 정책이 활성화된 경우, 각 정책에서는 원하는 용량을 독립적으로 결정하며 원하는 용량이 최대값으로 설정됩니다. 예컨대, 대상 추적 조정 정책에서 대상 사용률을 유지하기 위해 인스턴스 10개가 필요하고, 예측 조정 정책에서 대상 사용률을 유지하기 위해 인스턴스 8개가 필요한 경우, 그룹의 원하는 용량은 10으로 설정됩니다. 동적 조정이 익숙하지 않은 경우 대상 추적 조정 정책을 사용하는 것이 좋습니다. 자세한 내용은 Amazon EC2 Auto Scaling의 동적 조정 단원을 참조하십시오.
-
예측 조정의 핵심적인 가정은 Auto Scaling 그룹이 동질적이며 모든 인스턴스의 용량이 동일하다는 것입니다. 그룹에 속하지 않는 경우, 예측 용량이 정확하지 않을 수 있습니다. 따라서 혼합 인스턴스 그룹에 대한 예측 조정 정책을 생성할 때는 주의해야 합니다. 용량이 동일하지 않은 여러 유형의 인스턴스를 프로비저닝할 수 있기 때문입니다. 다음은 예측 용량이 부정확할 수 있는 몇 가지 예입니다.
-
예측 조정 정책은 CPU 사용률에 근거하여 하지만, 각 Auto Scaling 인스턴스의 vCPU 수는 인스턴스 유형에 따라 다릅니다.
-
예측 조정 정책은 네트워크 인 또는 네트워크 아웃에 근거하여 하지만, 각 Auto Scaling 인스턴스의 네트워크 대역폭 처리량은 인스턴스 유형에 따라 다릅니다. 예컨대, M5 및 M5n 인스턴스 유형은 비슷하지만 M5n 인스턴스 유형은 네트워크 처리량이 상당히 높습니다.
-
지원되는 지역
미국 동부(버지니아 북부)
미국 동부(오하이오)
미국 서부(캘리포니아 북부)
미국 서부(오레곤)
아프리카(케이프타운)
아시아 태평양(홍콩)
아시아 태평양(자카르타)
아시아 태평양(뭄바이)
아시아 태평양(오사카)
아시아 태평양(서울)
아시아 태평양(싱가포르)
아시아 태평양(시드니)
아시아 태평양(도쿄)
캐나다(중부)
중국(베이징)
중국(닝샤)
유럽(프랑크푸르트)
유럽(아일랜드)
유럽(런던)
유럽(밀라노)
유럽(파리)
유럽(스톡홀름)
중동(바레인)
중동(UAE)
남아메리카(상파울루)
AWS GovCloud(미국 동부)
AWS GovCloud(미국 서부)