기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon Elastic Compute Cloud(EC2) 스팟 인스턴스를 선택하면 워크플로를 최적화하여 비용을 절감할 수 있으며, 때로는 크게 절감할 수 있습니다. 자세한 내용은 Amazon EC2 Spot 보안 모범 사례를 참조하세요.
워크플로를 최적화하여 비용을 절감하려면 다음과 같은 AWS Batch에 대한 Amazon EC2 스팟 모범 사례를 참조하세요.
-
SPOT_CAPACITY_OPTIMIZED
할당 전략을 선택합니다 - AWS Batch는 가장 깊은 Amazon EC2 스팟 용량 풀에서 Amazon EC2 인스턴스를 선택합니다. 중단이 걱정된다면 이 방법을 선택하는 것이 좋습니다. 자세한 내용은 AWS Batch에 대한 인스턴스 유형 할당 전략 단원을 참조하십시오. -
인스턴스 유형을 다양화합니다 - 인스턴스 유형을 다양화하려면 호환되는 크기와 패밀리를 고려한 다음 AWS Batch가 가격이나 가용성에 따라 선택할 수 있도록 합니다. 예를 들어,
c5.24xlarge
를c5.12xlarge
또는c5a
,c5n
,c5d
,m5
,m5d
패밀리의 대안으로 고려할 수 있습니다. 자세한 내용은 인스턴스 유형 및 가용 영역에 대한 유연성 유지를 참고하세요 -
작업 런타임 또는 체크포인트를 줄입니다 - Amazon EC2 스팟 인스턴스를 사용할 때 중단이 발생하지 않도록 1시간 이상 걸리는 작업은 실행하지 않는 것이 좋습니다. 작업을 30분 이하로 구성된 더 작은 부분으로 나누거나 체크포인트를 지정하면 중단 가능성을 크게 줄일 수 있습니다.
-
자동 재시도를 사용합니다 - AWS Batch 작업 중단을 방지하려면 작업에 자동 재시도를 설정합니다. 0이 아닌 종료 코드가 반환되거나, 서비스 오류가 발생하거나, 인스턴스 재확보가 발생하는 등의 이유로 배치 작업이 중단될 수 있습니다. 자동 재시도는 최대 10회까지 설정할 수 있습니다. 시작하려면 최소 1~3회의 자동 재시도를 설정하는 것이 좋습니다. Amazon EC2 스팟 중단 추적에 대한 자세한 내용은 스팟 중단 대시보드
를 참조하세요. AWS Batch의 경우 재시도 파라미터를 설정하면 작업이 작업 대기열의 맨 앞에 배치됩니다. 즉, 작업에 우선 순위가 부여됩니다. 작업 정의를 생성하거나 AWS CLI에서 작업을 제출할 때 재시도 전략을 구성할 수 있습니다. 자세한 내용은 작업 이벤트를 참조하세요
$
aws batch submit-job --job-name MyJob \ --job-queue MyJQ \ --job-definition MyJD \ --retry-strategy attempts=2
-
사용자 지정 재시도를 사용합니다 - 특정 애플리케이션 종료 코드 또는 인스턴스 재확보에 대한 작업 재시도 전략을 구성할 수 있습니다. 다음 예제에서는 호스트가 장애를 일으킨 경우 작업을 최대 5회까지 재시도할 수 있습니다. 하지만 다른 이유로 작업이 실패하면 작업이 종료되고 상태가
FAILED
로 설정됩니다."retryStrategy": { "attempts": 5, "evaluateOnExit": [{ "onStatusReason" :"Host EC2*", "action": "RETRY" },{ "onReason" : "*" "action": "EXIT" }] }
-
스팟 중단 대시보드를 사용합니다 - 스팟 중단 대시보드를 사용하여 스팟 중단을 추적할 수 있습니다. 애플리케이션은 재확보된 Amazon EC2 스팟 인스턴스와 해당 스팟 인스턴스가 속한 가용 영역에 대한 지표를 제공합니다. 자세한 정보는 스팟 인스턴스 중단
을 참조하세요.