Amazon EC2에서 Elastic Fabric Adapter 모니터링 - Amazon Elastic Compute Cloud

Amazon EC2에서 Elastic Fabric Adapter 모니터링

다음 기능을 사용해 Elastic Fabric Adapter(EFA)의 성능을 모니터링할 수 있습니다.

Amazon EC2 인스턴스의 EFA 드라이버 메트릭

Elastic Fabric Adapter(EFA) 드라이버는 EFA 인터페이스가 연결된 인스턴스의 여러 메트릭을 게시합니다. 이러한 지표를 사용하여 애플리케이션 성능 문제를 해결하고, 워크로드에 적합한 클러스터 크기를 선택하며, 조정 작업을 사전 예방적으로 계획하고, 애플리케이션을 벤치마킹하여 인스턴스의 가용 EFA 성능을 최대화할지 여부를 결정할 수 있습니다.

사용 가능한 EFA 드라이버 메트릭

EFA 드라이버는 인스턴스에 다음과 같은 지표를 실시간으로 게시합니다. 인스턴스 시작 또는 마지막 드라이버 재설정 이후 연결된 EFA 디바이스에서 전송, 수신 또는 삭제된 오류 및 패킷 또는 바이트의 누적 수를 제공합니다.

지표 설명
tx_bytes

전송된 바이트 수입니다.

단위: 바이트

rx_bytes

수신한 바이트 수입니다.

단위: 바이트

tx_pkts

전송된 패킷 수입니다.

단위: 수

rx_pkts

수신된 패킷 수입니다.

단위: 수

rx_drops

수신 후 삭제된 패킷 수입니다.

단위: 수

send_bytes

전송 작업을 사용하여 전송된 바이트 수입니다.

단위: 바이트

recv_bytes

전송 작업을 사용하여 수신된 바이트 수입니다.

단위: 바이트

send_wrs

전송 작업을 사용하여 전송된 패킷 수입니다.

단위: 수

recv_wrs

전송 작업을 사용하여 수신된 패킷 수입니다.

단위: 수

rdma_write_wrs

완료된 rdma 쓰기 작업 수입니다.

단위: 수

rdma_read_wrs

완료된 rdma 읽기 작업 수입니다.

단위: 수

rdma_write_bytes

rdma 쓰기 작업 수를 사용하여 다른 인스턴스에 의해 기록된 바이트 수입니다.

단위: 바이트

rdma_read_bytes

rdma 읽기 작업 수를 사용하여 수신된 바이트 수입니다.

단위: 바이트

rdma_write_wr_err

로컬 또는 원격 오류가 발생한 rdma 쓰기 작업 수입니다.

단위: 수

rdma_read_wr_err

로컬 또는 원격 오류가 발생한 rdma 읽기 작업 수입니다.

단위: 수

rdma_read_resp_bytes

rdma 읽기 작업 수에 대한 응답으로 전송된 바이트 수입니다.

단위: 바이트

rdma_write_recv_bytes

rdma 쓰기 작업을 사용하여 수신된 바이트 수입니다.

단위: 바이트

인스턴스의 EFA 드라이버 메트릭을 검색합니다.

rdma-tool 명령줄 도구를 사용하여 다음과 같이 인스턴스에 연결된 모든 EFA 인터페이스의 메트릭을 검색할 수 있습니다.

$ rdma -p statistic show link rdmap0s31/1 tx_bytes 0 tx_pkts 0 rx_bytes 0 rx_pkts 0 rx_drops 0 send_bytes 0 send_wrs 0 recv_bytes 0 recv_wrs 0 rdma_read_wrs 0 rdma_read_bytes 0 rdma_read_wr_err 0 rdma_read_resp_bytes 0 rdma_write_wrs 0 rdma_write_bytes 0 rdma_write_wr_err 0

또는 다음 명령을 사용하여 sys 파일에서 인스턴스에 연결된 각 EFA 인터페이스의 메트릭을 검색할 수 있습니다.

$ more /sys/class/infiniband/device_number/ports/port_number/hw_counters/* | cat

$ more /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/* | cat :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/lifespan :::::::::::::: 12 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_resp_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_drops :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_pkts :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_pkts :::::::::::::: 0

Amazon VPC 흐름 로그

Amazon VPC 플로우 로그를 생성하여 EFA로 들어오고 나가는 트래픽에 대한 세부 정보를 캡처할 수 있습니다. 플로우 로그 데이터를 Amazon CloudWatch Logs 및 Amazon S3로 게시할 수 있습니다. 플로우 로그를 생성한 다음 선택된 대상의 데이터를 가져와 확인할 수 있습니다. 자세한 내용은 Amazon VPC 사용 설명서의 VPC 흐름 로그를 참조하세요.

탄력적 네트워크 인터페이스에 플로우 로그를 생성한 것과 동일한 방법으로 EFA에 플로우 로그를 생성할 수 있습니다. 자세한 내용은 Amazon VPC 사용 설명서플로우 로그 생성을 참조하세요.

다음 예제에서와 같이 플로우 로그 항목에서 EFA 트래픽은 MAC 주소 유형인 srcAddressdestAddress으로 식별됩니다.

version accountId eniId srcAddress destAddress sourcePort destPort protocol packets bytes start end action log-status 2 3794735123 eni-10000001 01:23:45:67:89:ab 05:23:45:67:89:ab - - - 9 5689 1521232534 1524512343 ACCEPT OK

Amazon CloudWatch

Amazon EKS 클러스터에서 EFA를 사용하는 경우 CloudWatch 컨테이너 인사이트를 사용하여 EFA를 모니터링할 수 있습니다. 자세한 정보는 Amazon CloudWatch 사용 설명서Amazon EKS 및 Kubernetes Container Insights 지표를 참조하세요.