Supervisión de sistemas FSx de ONTAP archivos mediante Harvest y Grafana - FSx para ONTAP

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Supervisión de sistemas FSx de ONTAP archivos mediante Harvest y Grafana

NetApp Harvest es una herramienta de código abierto para recopilar métricas de rendimiento y capacidad de ONTAP los sistemas, y es compatible con FSxONTAP. Puede usar Harvest con Grafana como una solución de supervisión de código abierto.

Introducción a Harvest y Grafana

La siguiente sección detalla cómo puede configurar Harvest y Grafana FSx para medir el rendimiento del sistema de ONTAP archivos y la utilización de la capacidad de almacenamiento.

Puedes monitorizar tu sistema de NetApp ONTAP archivos FSx de Amazon mediante Harvest y Grafana. NetApp Harvest monitorea los centros de ONTAP datos recopilando métricas de rendimiento, capacidad y hardware de FSx los sistemas de ONTAP archivos. Grafana proporciona un panel de control en el que se pueden mostrar las métricas recopiladas de Harvest.

Paneles de Harvest compatibles

Amazon FSx for NetApp ONTAP expone un conjunto de métricas diferente al de las instalaciones NetApp ONTAP locales. Por lo tanto, actualmente solo se admite el uso con for de fsx los siguientes paneles de out-of-the-box Harvest etiquetados con. FSx ONTAP Es posible que a algunos de los paneles de estos paneles les falte información que no es compatible.

  • ONTAP: Conformidad

  • ONTAP: Instantáneas de protección de datos

  • ONTAP: Seguridad

  • ONTAP: SVM

  • ONTAP: Volumen

AWS CloudFormation plantilla

Para empezar, puedes implementar una AWS CloudFormation plantilla que lance automáticamente una EC2 instancia de Amazon que ejecute Harvest y Grafana. Como entrada a la AWS CloudFormation plantilla, especificas el fsxadmin usuario y el punto de conexión de FSx administración de Amazon para el sistema de archivos que se añadirán como parte de esta implementación. Una vez completada la implementación, puede iniciar sesión en el panel de control de Grafana para monitorear su sistema de archivos.

Esta solución se utiliza AWS CloudFormation para automatizar el despliegue de las soluciones Harvest y Grafana. La plantilla crea una instancia de Amazon EC2 Linux e instala el software Harvest y Grafana. Para usar esta solución, descargue la plantilla fsx-ontap-harvest-grafana.template. AWS CloudFormation

nota

La implementación de esta solución implica la facturación de los servicios asociados AWS . Para más información, consulte las páginas de precios de estos servicios.

Tipos de EC2 instancias de Amazon

Al configurar la plantilla, debes proporcionar el tipo de EC2 instancia de Amazon. NetAppLa recomendación para el tamaño de la instancia depende del número de sistemas de archivos que monitorices y del número de métricas que decidas recopilar. Con la configuración predeterminada, por cada 10 sistemas de archivos que supervise, NetApp recomienda:

  • CPU: 2 núcleos

  • Memoria: 1 GB

  • Disco: 500 MB (utilizado principalmente por archivos de registro)

A continuación, se muestran algunos ejemplos de configuraciones y el tipo de instancia t3 que puede elegir.

Sistemas de archivos CPU Disk Tipo de instancia

Menos de 10

2 núcleos

500 MB

t3.micro

De 10 a 40

4 núcleos

1000 MEGABYTE

t3.xlarge

40+

8 núcleos

2000 MB

t3.2xlarge

Para obtener más información sobre los tipos de EC2 instancias de Amazon, consulta las instancias de uso general en la Guía del EC2 usuario de Amazon.

Reglas de puertos de instancias

Al configurar la EC2 instancia de Amazon, asegúrese de que los puertos 3000 y 9090 estén abiertos para el tráfico entrante del grupo de seguridad en el que se encuentra la instancia de Amazon EC2 Harvest y Grafana. Como la instancia que se lanza se conecta a un punto finalHTTPS, necesita resolver el punto final, que necesita el puerto 53TCP/. UDP DNS Además, para llegar al punto final, necesita el puerto 443 HTTPS y TCP el acceso a Internet.

Procedimiento de implementación

El siguiente procedimiento configura e implementa la solución Harvest/Grafana. Tarda aproximadamente cinco minutos en implementarse. Antes de empezar, debe tener un FSx sistema de ONTAP archivos que se ejecute en una Amazon Virtual Private Cloud (AmazonVPC) en su AWS cuenta y la información de los parámetros de la plantilla que se indica a continuación. Para obtener más información sobre la creación de un sistema de archivos, consulte Creación de sistemas de archivos.

Cómo iniciar la pila de soluciones Harvest/Grafana
  1. Descarga la fsx-ontap-harvest-grafanaplantilla AWS CloudFormation .template. Para obtener más información sobre la creación de una AWS CloudFormation pila, consulte Creación de una pila en la AWS CloudFormation consola en la Guía del AWS CloudFormation usuario.

    nota

    De forma predeterminada, esta plantilla se lanza en la AWS región EE.UU. Este (Norte de Virginia). Debe lanzar esta solución en un Región de AWS lugar donde Amazon FSx esté disponible. Para obtener más información, consulta los FSxpuntos de conexión y las cuotas de Amazon en.Referencia general de AWS

  2. En Parámetros, revise los parámetros de la plantilla y modifíquelos para adaptarlos a las necesidades del sistema de archivos. Esta solución utiliza los siguientes valores predeterminados.

    Parámetro Predeterminado/a Descripción
    InstanceType t3.micro

    El tipo de EC2 instancia de Amazon. A continuación se muestran los tipos de instancias t3.

    • t3.micro

    • t3.small

    • t3.medium

    • t3.large

    • t3.xlarge

    • t3.2xlarge

    Para ver la lista completa de los valores de tipo de EC2 instancia de Amazon permitidos para este parámetro, consulta fsx-ontap-harvest-grafana .template.

    KeyPair Sin valor predeterminado El par de claves que se utiliza para acceder a la EC2 instancia de Amazon.
    SecurityGroup Sin valor predeterminado El ID del grupo de seguridad de la instancia de Harvest/Grafana. Corrobore que los puertos de entrada 3000 y 9090, además de los puertos 53 y 443, estén abiertos desde los clientes que desea usar para acceder al panel de control de Grafana.
    Tipo de subred Sin valor predeterminado Especifique el tipo de subred, ya sea public o private. Utiliza una subred public para los recursos que deban conectarse a Internet y una subred privada para los recursos que no vayan a conectarse a Internet. Para obtener más información, consulte Tipos de subredes en la Guía del VPC usuario de Amazon.
    Subred Sin valor predeterminado Especifica la misma subred que tu Amazon FSx para la subred preferida del sistema de NetApp ONTAP archivos. Puedes encontrar el ID de subred preferido del sistema de archivos en la FSx consola de Amazon, en la pestaña Red y seguridad de la FSx página de detalles del sistema de ONTAP archivos
    LatestLinuxAmiId /aws/service/ami-amazon-linux-latest/amzn2-ami-hvm-x86_64-gp2 La última versión de Amazon Linux 2 AMI en un momento dado Región de AWS.
    FSxEndPoint Sin valor predeterminado La dirección IP del punto de conexión de administración del sistema de archivos. Puedes encontrar la dirección IP del punto final de administración del sistema de archivos en la FSx consola de Amazon, en la pestaña Administración de la página FSx de detalles del sistema de ONTAP archivos.
    SecretName Sin valor predeterminado AWS Secrets Manager nombre secreto que contiene la contraseña del fsxadmin usuario del sistema de archivos. Es la contraseña que proporcionó al crear el sistema de archivos.
  3. Elija Next (Siguiente).

  4. En Opciones, elija Siguiente.

  5. En la página Revisar, revise y confirme la configuración. Debe seleccionar la casilla de verificación para confirmar que la plantilla crea IAM recursos.

  6. Elija Crear para implementar la pila.

Puede ver el estado de la pila en la AWS CloudFormation consola, en la columna Estado. Deberías ver el estado CREATE_ COMPLETE en unos cinco minutos.

Iniciar sesión en Grafana

Una vez finalizada la implementación, usa tu navegador para iniciar sesión en el panel de control de Grafana en la IP y el puerto 3000 de la instancia de AmazonEC2:

http://EC2_instance_IP:3000

Cuando se le solicite, utilice el nombre de usuario (admin) y la contraseña (pass) predeterminados de Grafana. Le recomendamos que cambie la contraseña en cuanto inicie sesión.

Para obtener más información, consulta la página de NetApp Harvest en GitHub.

Solución de problemas de Harvest y Grafana

Si te falta algún dato mencionado en los paneles de Harvest y Grafana o tienes problemas para configurar Harvest y Grafana FSx con, consulta los siguientes temas ONTAP para encontrar una posible solución.

SVMy los paneles de volumen están en blanco

Si la AWS CloudFormation pila se implementó correctamente y puede ponerse en contacto con Grafana, pero los paneles de control SVM y de volumen están en blanco, utilice el siguiente procedimiento para solucionar los problemas de su entorno. Necesitarás SSH acceder a la EC2 instancia de Amazon en la que están desplegados Harvest y Grafana.

  1. SSHen la EC2 instancia de Amazon en la que se ejecutan sus clientes de Harvest y Grafana.

    [~]$ ssh ec2-user@ec2_ip_address
  2. Use el siguiente comando para abrir el archivo harvest.yml y haga lo siguiente

    • Compruebe que se haya creado una entrada para su, FSx por ONTAP ejemplo, comoCluster-2.

    • Compruebe que las entradas de nombre de usuario y contraseña coincidan con las credenciales de fsxadmin.

    [ec2-user@ip-ec2_ip_address ~]$ sudo cat /home/ec2-user/harvest_install/harvest/harvest.yml
  3. Si el campo de contraseña está en blanco, abra el archivo en un editor y actualícelo con la contraseña de fsxadmin, de la siguiente manera:

    [ec2-user@ip-ec2_ip_address ~]$ sudo vi /home/ec2-user/harvest_install/harvest/harvest.yml
  4. Corrobore que las credenciales de usuario fsxadmin se almacenen en Secrets Manager con el siguiente formato para futuras implementaciones y sustituya fsxadmin_password por su contraseña.

    {"username" : "fsxadmin", "password" : "fsxadmin_password"}

CloudFormation la pila se revierte después del tiempo de espera

Si no puede implementar la CloudFormation pila correctamente y se está revirtiendo con errores, utilice el siguiente procedimiento para resolver el problema. Necesitará SSH acceder a la EC2 instancia implementada por la CloudFormation pila.

  1. Vuelva a implementar la CloudFormation pila y asegúrese de que la reversión automática esté desactivada.

  2. SSHen la EC2 instancia de Amazon en la que se ejecutan sus clientes de Harvest y Grafana.

    [~]$ ssh ec2-user@ec2_ip_address
  3. Compruebe que los contenedores de Docker se hayan iniciado correctamente mediante el siguiente comando.

    [ec2-user@ip-ec2_ip_address ~]$ sudo docker ps

    En la respuesta, debería ver cinco contenedores de la siguiente manera:

    CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 6b9b3f2085ef rahulguptajss/harvest "bin/poller --config…" 8 minutes ago Restarting (1) 20 seconds ago harvest_cluster-2 3cf3e3623fde rahulguptajss/harvest "bin/poller --config…" 8 minutes ago Up About a minute harvest_cluster-1 708f3b7ef6f8 grafana/grafana "/run.sh" 8 minutes ago Up 8 minutes 0.0.0.0:3000->3000/tcp harvest_grafana 0febee61cab7 prom/alertmanager "/bin/alertmanager -…" 8 minutes ago Up 8 minutes 0.0.0.0:9093->9093/tcp harvest_prometheus_alertmanager 1706d8cd5a0c prom/prometheus "/bin/prometheus --c…" 8 minutes ago Up 8 minutes 0.0.0.0:9090->9090/tcp harvest_prometheus
  4. Si los contenedores de Docker no se están ejecutando, compruebe si hay errores en el archivo /var/log/cloud-init-output.log de la siguiente manera.

    [ec2-user@ip-ec2_ip_address ~]$ sudo cat /var/log/cloud-init-output.log PLAY [Manage Harvest] ********************************************************** TASK [Gathering Facts] ********************************************************* ok: [localhost] TASK [Verify images] *********************************************************** failed: [localhost] (item=prom/prometheus) => {"ansible_loop_var": "item", "changed": false, "item": "prom/prometheus", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetError(104, 'Co nnection reset by peer'))"} failed: [localhost] (item=prom/alertmanager) => {"ansible_loop_var": "item", "changed": false, "item": "prom/alertmanage r", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetError(104, 'Connection reset by peer'))"} failed: [localhost] (item=rahulguptajss/harvest) => {"ansible_loop_var": "item", "changed": false, "item": "rahulguptajs s/harvest", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetEr ror(104, 'Connection reset by peer'))"} failed: [localhost] (item=grafana/grafana) => {"ansible_loop_var": "item", "changed": false, "item": "grafana/grafana", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetError(104, 'Co nnection reset by peer'))"} PLAY RECAP ********************************************************************* localhost : ok=1 changed=0 unreachable=0 failed=1 skipped=0 rescued=0 ignored=0
  5. Si hay errores, ejecute los siguientes comandos para implementar los contenedores de Harvest y Grafana.

    [ec2-user@ip-ec2_ip_address ~]$ sudo su [ec2-user@ip-ec2_ip_address ~]$ cd /home/ec2-user/harvest_install [ec2-user@ip-ec2_ip_address ~]$ /usr/local/bin/ansible-playbook manage_harvest.yml [ec2-user@ip-ec2_ip_address ~]$ /usr/local/bin/ansible-playbook manage_harvest.yml --tags api
  6. Valide que los contenedores se hayan iniciado correctamente sudo docker ps ejecutándolos y conectándolos a Harvest y GrafanaURL.