네트워크 문제 해결 - AWS ParallelCluster

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

네트워크 문제 해결

이 섹션에서는 네트워크 문제가 발생할 때, 특히 단일 퍼블릭 서브넷 문제의 클러스터를 처리할 때의 문제 해결 팁을 제공합니다.

단일 퍼블릭 서브넷 안의 클러스터 문제

컴퓨팅 노드 중 하나에서 cloud-init-output.log를 확인하세요. 노드가 끼어 있음을 나타내는 다음과 같은 것을 발견한 경우 Slurm 초기화는 DynamoDB VPC 엔드포인트가 누락되었기 때문일 가능성이 높습니다. DynamoDB 엔드포인트를 추가합니다. 자세한 내용은 AWS ParallelCluster 인터넷에 액세스할 수 없는 단일 서브넷 항목을 참조하세요.

ruby_block[retrieve compute node info] action run[2022-03-11T17:47:11+00:00] INFO: Processing ruby_block[retrieve compute node info] action run (aws-parallelcluster-slurm::init line 31)