MNP 작업의 작업 수명 주기
다중 노드 병렬 작업을 제출하면 작업이 SUBMITTED
상태가 됩니다. 그런 다음 작업은 모든 작업 종속성이 완료될 때까지 대기합니다. 또한 작업이 RUNNABLE
상태로 전환합니다. 마지막으로 AWS Batch(은)는 작업을 실행하는 데 필요한 인스턴스 용량을 프로비저닝하고 이러한 인스턴스를 시작합니다.
각 다중 노드 병렬 작업에는 기본 노드가 포함되어 있습니다. 기본 노드는 AWS Batch(이)가 제출된 다중 노드 작업의 결과를 확인하기 위해 모니터링하는 단일 하위 태스크입니다. 기본 노드가 처음에 시작되고 STARTING
상태로 이동합니다. attemptDurationSeconds
파라미터에 지정된 제한 시간 값은 노드가 아닌 전체 작업에 적용됩니다.
기본 노드가 RUNNING
상태에 도달하면(노드의 컨테이너가 실행된 후) 하위 노드가 시작되고 하위 노드도 STARTING
상태로 이동합니다. 하위 노드는 임의의 순서로 나타납니다. 하위 노드가 시작되는 시간이나 순서는 보장할 수 없습니다. 작업의 모든 노드가 RUNNING
상태인지 확인하려면(노드 컨테이너가 실행된 후) 애플리케이션 코드가 AWS Batch API를 쿼리하여 기본 노드 및 하위 노드 정보를 가져올 수 있습니다. 또는 애플리케이션 코드가 모든 노드가 온라인 상태가 될 때까지 기다린 후 분산 처리 태스크를 시작할 수도 있습니다. 기본 노드의 프라이빗 IP 주소를 각 하위 노드에서 AWS_BATCH_JOB_MAIN_NODE_PRIVATE_IPV4_ADDRESS
환경 변수로 사용할 수 있습니다. 애플리케이션 코드는 이 정보를 사용하여 각 태스크 간에 데이터를 조정하고 통신할 수 있습니다.
개별 노드가 종료되면 종료 코드에 따라 SUCCEEDED
또는 FAILED
(으)로 이동합니다. 기본 노드가 종료되면 작업이 완료된 것으로 간주되고 모든 하위 노드가 중지됩니다. 하위 노드가 정지되면 AWS Batch(은)는 작업의 다른 노드에 대해 어떠한 작업도 수행하지 않습니다. 감소된 수의 노드로 작업을 계속하지 않으려는 경우 이러한 요인을 애플리케이션 코드에 반영해야 합니다. 이렇게 하면 작업이 종료되거나 취소됩니다.