Monitorar um Elastic Fabric Adapter no Amazon EC2
É possível usar os seguintes recursos para monitorar a performance dos seus Elastic Fabric Adapters.
Tópicos
Métricas do driver do EFA para uma instância do Amazon EC2
O driver Elastic Fabric Adapter (EFA) publica várias métricas das instâncias que têm interfaces EFA anexadas. É possível usar essas métricas para solucionar problemas de performance da aplicação, escolher o tamanho certo do cluster para uma workload, planejar atividades de dimensionamento proativamente e comparar aplicações para determinar se eles maximizam a performance do EFA disponível em uma instância.
Métricas de driver do EFA disponíveis
O driver EFA publica as seguintes métricas para a instância em tempo real. Elas fornecem o número cumulativo de erros e pacotes ou bytes enviados, recebidos ou descartados pelos dispositivos EFA conectados desde a inicialização da instância ou a última redefinição do driver.
Métrica | Descrição |
---|---|
tx_bytes |
O número de bytes transmitidos. Unidade: bytes |
rx_bytes |
O número de bytes recebidos. Unidade: bytes |
tx_pkts |
O número de pacotes transmitidos. Unidade: contagem |
rx_pkts |
O número de pacotes recebidos. Unidade: contagem |
rx_drops |
O número total de pacotes recebidos e depois descartados. Unidade: contagem |
send_bytes |
O número de bytes enviados usando operações de envio. Unidade: bytes |
recv_bytes |
O número de bytes recebidos pelas operações de envio. Unidade: bytes |
send_wrs |
O número de pacotes enviados usando operações de envio. Unidade: contagem |
recv_wrs |
O número de pacotes recebidos pelas operações de envio. Unidade: contagem |
rdma_write_wrs |
O número de operações de gravação de rdma concluídas. Unidade: contagem |
rdma_read_wrs |
O número de operações de leitura de rdma concluídas. Unidade: contagem |
rdma_write_bytes |
O número de bytes gravados nele por outras instâncias usando operações de gravação de rdma. Unidade: bytes |
rdma_read_bytes |
O número de bytes recebidos usando operações de leitura de rdma. Unidade: bytes |
rdma_write_wr_err |
O número de operações de gravação de rdma que tiveram erros locais ou remotos. Unidade: contagem |
rdma_read_wr_err |
O número de operações de leitura de rdma que tiveram erros locais ou remotos. Unidade: contagem |
rdma_read_resp_bytes |
O número de bytes enviados em resposta às operações de leitura de rdma. Unidade: bytes |
rdma_write_recv_bytes |
O número de bytes recebidos pelas operações de gravação de rdma. Unidade: bytes |
Recupere as métricas do driver EFA para sua instância
É possível usar a ferramenta de linha de comando rdma-tool
$
rdma -p statistic show
link rdmap0s31/1 tx_bytes 0 tx_pkts 0 rx_bytes 0 rx_pkts 0 rx_drops 0 send_bytes 0 send_wrs 0 recv_bytes 0 recv_wrs 0 rdma_read_wrs 0 rdma_read_bytes 0 rdma_read_wr_err 0 rdma_read_resp_bytes 0 rdma_write_wrs 0 rdma_write_bytes 0 rdma_write_wr_err 0
Você também pode recuperar as métricas de cada interface do EFA anexada a uma instância dos arquivos sys usando o comando a seguir.
$
more /sys/class/infiniband/device_number
/ports/port_number
/hw_counters/* | cat
Por exemplo
$
more /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/* | cat
:::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/lifespan :::::::::::::: 12 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_resp_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_drops :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_pkts :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_pkts :::::::::::::: 0
Logs de fluxo do Amazon VPC
É possível criar um log de fluxo da Amazon VPC para capturar informações sobre o tráfego de entrada e saída de um EFA. Os dados de log de fluxo podem ser publicados no Amazon CloudWatch Logs e no Amazon S3. Após criar um log de fluxo, será possível recuperar e visualizar seus dados no destino selecionado. Para obter mais informações, consulte Logs de fluxo da VPC no Guia do usuário da Amazon VPC.
Você cria um log de fluxo para um EFA da mesma forma como cria um log de fluxo para uma interface de rede elástica. Para mais informações, consulte Criar um log de fluxo no Guia do usuário da Amazon VPC.
Nas entradas do log de fluxo, o tráfego do EFA é identificado por srcAddress
e destAddress
, ambos formatados como endereços MAC, conforme mostrado no exemplo a seguir.
version accountId eniId srcAddress destAddress sourcePort destPort protocol packets bytes start end action log-status
2 3794735123 eni-10000001 01:23:45:67:89:ab 05:23:45:67:89:ab - - - 9 5689 1521232534 1524512343 ACCEPT OK
Amazon CloudWatch
Se você estiver usando o EFA em um cluster do Amazon EKS, poderá monitorar seus EFAs usando o CloudWatch Container Insights. Para obter mais informações, consulte Métricas do Amazon EKS e Kubernetes Container Insights no Guia do usuário do Amazon CloudWatch.