기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
예측 조정의 작동 방식
이 항목에서는 예측 규모 조정 작동 방식을 설명하고 예측 규모 조정 정책을 만들 때 고려해야 할 사항을 설명합니다.
작동 방식
예측 규모 조정을 사용하려면 모니터링 및 분석할 CloudWatch 지표를 지정하는 예측 규모 조정 정책을 생성하십시오. 예측 척도를 통해 미래 값을 예측하려면 이 지표에 최소 24시간 분량의 데이터가 있어야 합니다.
정책을 생성한 후 예측 스케일링은 패턴을 식별하기 위해 최대 지난 14일까지의 지표 데이터를 분석하기 시작합니다. 이 분석을 사용하여 향후 48시간 동안의 용량 요구 사항에 대한 시간별 예측을 생성합니다. 예측은 최신 CloudWatch 데이터를 사용하여 6시간마다 업데이트됩니다. 새로운 데이터가 들어오면 예측 스케일링을 통해 미래 예측의 정확도를 지속적으로 개선할 수 있습니다.
예측 스케일링을 처음 활성화하면 예측 전용 모드로 실행됩니다. 이 모드에서는 용량 예측을 생성하지만 이러한 예측을 기반으로 Auto Scaling 그룹을 실제로 확장하지는 않습니다. 이를 통해 예측의 정확성과 적합성을 평가할 수 있습니다. GetPredictiveScalingForecast
API작업 또는 를 사용하여 예측 데이터를 볼 수 있습니다. AWS Management Console
예측 데이터를 검토하고 해당 데이터를 기반으로 조정을 시작하기로 결정한 후에는 조정 정책을 예측 및 규모 조정 모드로 전환하십시오. 이 모드에서는:
-
예측에 따르면 부하가 증가할 것으로 예상되면 Amazon EC2 Auto Scaling은 규모를 축소하여 용량을 늘립니다.
-
예측에서 부하 감소가 예상되더라도 용량을 줄일 수 있을 정도로 규모를 축소하지는 않을 것입니다. 더 이상 필요하지 않은 용량을 제거하려면 동적 조정 정책을 생성해야 합니다.
기본적으로 Amazon EC2 Auto Scaling은 각 시간이 시작될 때 해당 시간의 예측을 기반으로 Auto Scaling 그룹을 조정합니다. 선택적으로 PutScalingPolicy
API 작업의 SchedulingBufferTime
속성을 사용하거나 의 사전 시작 인스턴스 설정을 사용하여 더 빠른 시작 시간을 지정할 수 있습니다. AWS Management Console이로 인해 Amazon EC2 Auto Scaling은 예측된 수요보다 먼저 새 인스턴스를 시작하여 부팅할 시간을 주고 트래픽을 처리할 준비를 갖추게 됩니다.
예상 수요보다 먼저 새 인스턴스를 시작하도록 지원하려면 Auto Scaling 그룹의 기본 인스턴스 워밍업을 활성화하는 것이 좋습니다. 이는 동적 규모 조정 정책에 따라 용량을 줄여야 한다고 명시되어 있더라도 확장 활동 이후 Amazon EC2 Auto Scaling에서 규모를 축소하지 않는 기간을 지정합니다. 이렇게 하면 새로 시작된 인스턴스가 확장 작업을 고려하기 전에 증가된 트래픽을 처리하기 시작할 충분한 시간을 확보할 수 있습니다. 자세한 내용은 Auto Scaling 그룹의 기본 인스턴스 워밍업 설정 단원을 참조하십시오.
최대 용량 제한
Auto Scaling 그룹에는 그룹에 대해 시작할 수 있는 최대 EC2 인스턴스 수를 제한하는 최대 용량 설정이 있습니다. 기본적으로 조정 정책이 설정된 경우 최대 용량보다 용량을 늘릴 수 없습니다.
또는 예측 용량이 Auto Scaling 그룹의 최대 용량에 근접하거나 초과할 경우 그룹의 최대 용량이 자동으로 증가하도록 허용할 수 있습니다. 이 동작을 활성화하려면 작업의 MaxCapacityBreachBehavior
및 MaxCapacityBuffer
속성을 사용하거나 의 최대 용량 동작 설정을 사용하십시오 AWS Management Console. PutScalingPolicy
API
주의
최대 용량을 자동으로 늘리도록 허용할 때는 주의해야 합니다. 증가된 최대 용량을 모니터링 및 관리하지 않으면 의도한 것보다 많은 인스턴스가 시작될 수 있습니다. 증가된 최대 용량은 수동으로 업데이트하기 전까지 Auto Scaling 그룹의 새로운 정상 최대 용량이 됩니다. 최대 용량은 원래 최대 용량으로 자동으로 다시 감소하지 않습니다.
고려 사항
-
예측 스케일 아웃이 워크로드에 적합한지 확인합니다. 워크로드가 특정 요일이나 시간에 반복되는 로드 패턴을 나타내는 경우, 예측 조정에 적합합니다. 이를 확인하려면 예상 전용 모드에서 예측적 조정 정책을 구성한 다음 콘솔의 권장 사항을 참조하세요. Amazon EC2 Auto Scaling은 잠재적 정책 성능에 대한 관찰을 기반으로 권장 사항을 제공합니다. 예측적 조정이 애플리케이션 크기를 능동적으로 조정하도록 하기 전에 예측과 권장 사항을 평가합니다.
-
예측 조정이 예상을 시작하려면 최소 24시간 동안의 기록 데이터가 필요합니다. 그러나 기록 데이터가 2주 전체에 걸쳐 있는 경우, 예측이 더 정확합니다. 새 Auto Scaling 그룹을 생성하고 이전 그룹을 삭제하여 애플리케이션을 업데이트하는 경우, 예측 조정에서 예상 생성을 다시 시작하기 전에 새 Auto Scaling 그룹에는 24시간 동안의 기록 로드 데이터가 필요합니다. 사용자 지정 지표를 사용하여 이전 Auto Scaling 그룹과 새 Auto Scaling 그룹의 지표를 집계할 수 있습니다. 그렇지 않으면 더욱 정확한 예측을 위해 며칠을 기다려야 할 수 있습니다.
-
애플리케이션의 전체 부하를 정확히 나타내며 확장해야 하는 애플리케이션 측면에서 가장 중요한 측면을 나타내는 부하 지표를 선택하십시오.
-
동적 스케일링과 예측 스케일링을 사용하면 트래픽이 적은 기간에는 규모를 조정하고 트래픽이 예상보다 많을 때는 규모를 축소하여 애플리케이션의 수요 곡선을 면밀히 추적할 수 있습니다. 여러 조정 정책이 활성화된 경우, 각 정책에서는 원하는 용량을 독립적으로 결정하며 원하는 용량이 최대값으로 설정됩니다. 예컨대, 대상 추적 조정 정책에서 대상 사용률을 유지하기 위해 인스턴스 10개가 필요하고, 예측 조정 정책에서 대상 사용률을 유지하기 위해 인스턴스 8개가 필요한 경우, 그룹의 원하는 용량은 10으로 설정됩니다. 동적 규모 조정을 처음 사용하는 경우 대상 추적 조정 정책을 사용하는 것이 좋습니다. 자세한 내용은 Amazon EC2 Auto Scaling을 위한 동적 스케일링 단원을 참조하십시오.
-
예측 조정의 핵심적인 가정은 Auto Scaling 그룹이 동질적이며 모든 인스턴스의 용량이 동일하다는 것입니다. 그룹에 속하지 않는 경우, 예측 용량이 정확하지 않을 수 있습니다. 따라서 용량이 동일하지 않은 다양한 유형의 인스턴스가 프로비저닝될 수 있으므로 혼합 인스턴스 그룹에 대한 예측 조정 정책을 만들 때는 주의해야 합니다. 다음은 예측 용량이 부정확할 수 있는 몇 가지 예입니다.
-
예측 조정 정책은 CPU 사용률을 기반으로 하지만, 각 Auto Scaling 인스턴스의 vCPUs 수는 인스턴스 유형에 따라 다릅니다.
-
예측 조정 정책은 네트워크 인 또는 네트워크 아웃에 근거하여 하지만, 각 Auto Scaling 인스턴스의 네트워크 대역폭 처리량은 인스턴스 유형에 따라 다릅니다. 예컨대, M5 및 M5n 인스턴스 유형은 비슷하지만 M5n 인스턴스 유형은 네트워크 처리량이 상당히 높습니다.
-
지원되는 지역
미국 동부(버지니아 북부)
미국 동부(오하이오)
미국 서부(캘리포니아 북부)
미국 서부(오레곤)
아프리카(케이프타운)
아시아 태평양(홍콩)
아시아 태평양(자카르타)
아시아 태평양(뭄바이)
아시아 태평양(오사카)
아시아 태평양(서울)
아시아 태평양(싱가포르)
아시아 태평양(시드니)
아시아 태평양(도쿄)
캐나다(중부)
중국(베이징)
중국(닝샤)
유럽(프랑크푸르트)
유럽(아일랜드)
유럽(런던)
유럽(밀라노)
유럽(파리)
유럽(스톡홀름)
중동(바레인)
중동 () UAE
남아메리카(상파울루)
AWS GovCloud (미국 동부)
AWS GovCloud (미국 서부)