Amazon EC2 Auto Scaling의 비정상 인스턴스 문제 해결 - Amazon EC2 Auto Scaling

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon EC2 Auto Scaling의 비정상 인스턴스 문제 해결

다음은 Amazon EC2 Auto Scaling, 잠재적인 원인 및 문제 해결을 위해 수행할 수 있는 단계에서 반환되는 오류 메시지입니다.

오류 메시지를 검색하려면 상태 확인 불합격 이유 확인를 참조하세요.

EC2 인스턴스 건전성 체크 불합격에 대한 응답으로 인스턴스가 서비스 중단됨

문제: Auto Scaling 인스턴스가 Amazon EC2 건전성 체크를 통과하지 못합니다.

원인 1: Amazon EC2가 Auto Scaling 그룹의 인스턴스를 손상된 것으로 간주하는 문제가 있는 경우, Amazon EC2 Auto Scaling은 해당 인스턴스를 상태 확인의 일부로 자동으로 교체합니다.

해결 방법 1: 인스턴스 상태 확인에 실패하는 경우에는 일반적으로 애플리케이션에서 더 이상 문제가 발생하지 않을 때까지 인스턴스 구성을 변경하여 문제를 직접 해결해야 합니다. 이 문제를 해결하려면 다음 단계에 따릅니다.

  1. Auto Scaling 그룹의 일부가 아닌 Amazon EC2 인스턴스를 수동으로 생성하고 문제를 조사합니다. 손상된 인스턴스 조사에 대한 일반적인 도움말은 Amazon EC2 사용 설명서상태 확인에 실패한 인스턴스 문제 해결Amazon EC2 사용 설명서Windows 인스턴스 문제 해결을 참조하세요.

  2. 인스턴스가 성공적으로 시작되고 정상임을 확인한 후 오류가 없는 새로운 인스턴스 구성을 Auto Scaling 그룹에 배치합니다.

  3. 생성한 인스턴스를 삭제해 자신의 AWS 계정에 요금이 계속해서 부과되는 것을 피할 수 있습니다.

인스턴스가 해지되거나 중지되었음을 나타내는 EC2 건전성 체크에 대한 응답으로 인스턴스가 서비스 중단되었습니다.

문제: 중지, 재부팅 또는 해지된 Auto Scaling 인스턴스가 교체됩니다.

원인 1: 사용자가 수동으로 인스턴스를 중지, 재부팅 또는 해지했습니다.

해결 방법 1: Auto Scaling 그룹에서 인스턴스를 중단 또는 재부팅해야 하는 경우, 먼저 인스턴스를 대기 모드로 설정하는 것이 좋습니다. 자세한 내용은 Auto Scaling 그룹에서 일시적으로 인스턴스 제거 섹션을 참조하세요.

원인 2: 스팟 가격이 최고가보다 높거나 용량을 더 이상 사용할 수 없기 때문에 Amazon EC2 스팟 서비스가 인스턴스를 중단하면 Amazon EC2 Auto Scaling이 스팟 인스턴스를 교체하려고 시도합니다.

솔루션 2: 특정 시점에 요청을 이행하기 위해 스팟 인스턴스가 존재한다고 보장할 수 없습니다. 그러나 다음과 같은 방법을 시도할 수 있습니다.

  • 더 높은 스팟 최고가(온디맨드 가격일 수 있음)를 사용합니다. 최고 가격을 높게 설정하면 Amazon EC2 스팟 서비스가 필요한 용량을 시작하고 유지할 수 있는 더 나은 기회가 제공됩니다.

  • 여러 가용 영역에서 여러 인스턴스 유형을 실행하여 인스턴스를 시작할 수 있는 다양한 용량 풀의 수를 늘립니다. 자세한 내용은 여러 인스턴스 유형 및 구매 옵션이 포함된 Auto Scaling 그룹 섹션을 참조하세요.

  • 여러 인스턴스 유형을 사용하는 경우, 용량 재조정 기능을 사용하도록 설정하는 것이 좋습니다. 이는 실행 중인 인스턴스가 해지되기 전에 Amazon EC2 스팟 서비스에서 새 스팟 인스턴스를 시작하도록 하려는 경우에 유용합니다. 자세한 내용은 용량 재조정을 사용하여 Amazon EC2 스팟 중단 처리 섹션을 참조하세요.

원인 3: 용량 블록을 사용하면 Amazon EC2가 용량 블록 종료 시간 30분 전에 아직 실행 중인 모든 인스턴스를 종료합니다. 갑작스러운 종료로 인해 Auto Scaling 그룹은 용량 블록이 종료되더라도 원하는 용량을 유지하기 위해 새 인스턴스를 시작하려고 시도합니다.

해결 방법 3: 이 문제를 해결하려면 다음과 같이 실행합니다.

  • Auto Scaling 그룹의 원하는 용량을 줄여 새 인스턴스를 시작하지 못하게 합니다. 자세한 내용은 Amazon EC2 Auto Scaling 섹션을 참조하세요.

  • 이 오류가 자주 발생하지 않도록 용량 블록 종료 시간 30분 전에 Auto Scaling 그룹에서 스케일 인해야 합니다. 수명 주기 후크가 용량 블록 종료 시간 30분 전에 완료되었는지 확인합니다. 자세한 내용은 사용 Capacity Blocks 기계 학습 워크로드용 섹션을 참조하세요.

ELB 시스템 건전성 체크 불합격에 대한 응답으로 인스턴스가 서비스 중단되었습니다.

문제: Auto Scaling 인스턴스가 EC2 건전성 체크를 통과할 수 있습니다. 그러나 해당 인스턴스가 Auto Scaling 그룹이 등록된 대상 그룹 또는 Classic Load Balancers에 대한 Elastic Load Balancing 건전성 체크에는 실패할 수 있습니다.

원인 1: Auto Scaling 그룹이 Elastic Load Balancing에서 제공하는 상태 확인을 사용하는 경우, Amazon EC2 Auto Scaling은 EC2 상태 확인과 Elastic Load Balancing 상태 확인의 결과를 점검하여 인스턴스의 상태를 판단합니다. 로드 밸런서는 각 인스턴스에 요청을 보내고 올바른 응답을 기다리거나 인스턴스와 연결을 설정하여 건전성 체크를 수행합니다. 인스턴스에서 실행 중인 애플리케이션에는 로드 밸런서가 인스턴스를 서비스에서 제외시키는 것을 고려하게 하는 문제가 있기 때문에 인스턴스가 Elastic Load Balancing 건전성 체크에 실패할 수 있습니다.

솔루션 1: Elastic Load Balancing 건전성 체크를 통과하려면:

  • 대상 그룹의 건전성 체크 설정이 올바르게 구성되었는지 확인합니다. 대상 그룹당 로드 밸런서의 건전성 체크 설정을 정의합니다. 자세한 내용은 대상 상태 확인 구성 섹션을 참조하세요.

  • 로드 밸런서에 필요한 성공 코드를 기록해 두고 성공 시 이들 코드를 반환하도록 애플리케이션이 올바르게 구성되어 있는지 확인합니다.

  • 로드 밸런서 및 Auto Scaling 그룹의 보안 그룹이 올바르게 구성되었는지 확인합니다.

  • 로드 밸런서가 Auto Scaling 그룹과 동일한 가용 영역에서 구성되어 있는지 확인합니다.

솔루션 2: Elastic Load Balancing 건전성 체크를 비활성화하도록 Auto Scaling 그룹을 업데이트합니다. 이러한 상태 확인을 비활성화하는 방법에 대한 지침은 Elastic Load Balancing 로드 밸런서를 Auto Scaling 그룹에 연결 섹션을 참조하세요.

원인 2: 건전성 체크 유예 기간과 인스턴스 시작 시간 간에 불일치가 있습니다.

해결 방법 3: Auto Scaling 그룹에 대한 상태 확인 유예 기간을 편집합니다. Elastic Load Balancing Balancing에서 새로 시작된 인스턴스를 정상으로 간주하기 전에 필요한 연속 상태 확인 성공 횟수를 지원할 수 있도록 유예 기간을 충분히 길게 설정합니다. 자세한 내용은 Auto Scaling 그룹의 상태 확인 유예 기간 설정 섹션을 참조하세요.

추가 리소스

다른 문제가 있는 경우 다음 AWS re:Post 문서에서 추가 문제 해결 도움말을 참조하세요.