기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
AWS Batch의 Amazon EC2 스팟 모범 사례 사용
Amazon Elastic Compute Cloud(EC2) 스팟 인스턴스를 선택하면 워크플로를 최적화하여 비용을 절감할 수 있으며, 때로는 크게 절감할 수 있습니다. 자세한 내용은 Amazon EC2 Spot 보안 모범 사례를 참조하세요.
워크플로를 최적화하여 비용을 절감하려면 다음과 같은 AWS Batch에 대한 Amazon EC2 스팟 모범 사례를 참조하세요.
-
SPOT_CAPACITY_OPTIMIZED
할당 전략을 선택합니다 - AWS Batch는 가장 깊은 Amazon EC2 스팟 용량 풀에서 Amazon EC2 인스턴스를 선택합니다. 중단이 걱정된다면 이 방법을 선택하는 것이 좋습니다. 자세한 내용은 AWS Batch에 대한 인스턴스 유형 할당 전략 단원을 참조하십시오. -
인스턴스 유형을 다양화합니다 - 인스턴스 유형을 다양화하려면 호환되는 크기와 패밀리를 고려한 다음 AWS Batch가 가격이나 가용성에 따라 선택할 수 있도록 합니다. 예를 들어,
c5.24xlarge
를c5.12xlarge
또는c5a
,c5n
,c5d
,m5
,m5d
패밀리의 대안으로 고려할 수 있습니다. 자세한 내용은 인스턴스 유형 및 가용 영역에 대한 유연성 유지를 참고하세요 -
작업 런타임 또는 체크포인트를 줄입니다 - Amazon EC2 스팟 인스턴스를 사용할 때 중단이 발생하지 않도록 1시간 이상 걸리는 작업은 실행하지 않는 것이 좋습니다. 작업을 30분 이하로 구성된 더 작은 부분으로 나누거나 체크포인트를 지정하면 중단 가능성을 크게 줄일 수 있습니다.
-
자동 재시도를 사용합니다 - AWS Batch 작업 중단을 방지하려면 작업에 자동 재시도를 설정합니다. 0이 아닌 종료 코드가 반환되거나, 서비스 오류가 발생하거나, 인스턴스 재확보가 발생하는 등의 이유로 배치 작업이 중단될 수 있습니다. 자동 재시도는 최대 10회까지 설정할 수 있습니다. 시작하려면 최소 1~3회의 자동 재시도를 설정하는 것이 좋습니다. Amazon EC2 스팟 중단 추적에 대한 자세한 내용은 스팟 중단 대시보드
를 참조하세요. AWS Batch의 경우 재시도 파라미터를 설정하면 작업이 작업 대기열의 맨 앞에 배치됩니다. 즉, 작업에 우선 순위가 부여됩니다. 작업 정의를 생성하거나 AWS CLI에서 작업을 제출할 때 재시도 전략을 구성할 수 있습니다. 자세한 내용은 작업 이벤트를 참조하세요
$
aws batch submit-job --job-name MyJob \ --job-queue MyJQ \ --job-definition MyJD \ --retry-strategy attempts=2
-
사용자 지정 재시도를 사용합니다 - 특정 애플리케이션 종료 코드 또는 인스턴스 재확보에 대한 작업 재시도 전략을 구성할 수 있습니다. 다음 예제에서는 호스트가 장애를 일으킨 경우 작업을 최대 5회까지 재시도할 수 있습니다. 하지만 다른 이유로 작업이 실패하면 작업이 종료되고 상태가
FAILED
로 설정됩니다."retryStrategy": { "attempts": 5, "evaluateOnExit": [{ "onStatusReason" :"Host EC2*", "action": "RETRY" },{ "onReason" : "*" "action": "EXIT" }] }
-
스팟 중단 대시보드를 사용합니다 - 스팟 중단 대시보드를 사용하여 스팟 중단을 추적할 수 있습니다. 애플리케이션은 재확보된 Amazon EC2 스팟 인스턴스와 해당 스팟 인스턴스가 속한 가용 영역에 대한 지표를 제공합니다. 자세한 정보는 스팟 인스턴스 중단
을 참조하세요.