Surveillance des systèmes de fichiers FSx pour ONTAP à l'aide de Harvest et Grafana - FSx pour ONTAP

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Surveillance des systèmes de fichiers FSx pour ONTAP à l'aide de Harvest et Grafana

NetApp Harvest est un outil open source permettant de recueillir des mesures de performance et de capacité à partir des systèmes ONTAP. Il est compatible avec FSx for ONTAP. Vous pouvez utiliser Harvest avec Grafana pour une solution de surveillance open source.

Commencer à utiliser Harvest et Grafana

La section suivante explique comment configurer Harvest et Grafana pour mesurer les performances et l'utilisation de la capacité de stockage de votre système de fichiers FSx for ONTAP.

Vous pouvez surveiller votre système de fichiers Amazon FSx for NetApp ONTAP à l'aide de Harvest et Grafana. NetApp Harvest surveille les centres de données ONTAP en collectant des indicateurs de performance, de capacité et de matériel à partir de FSx pour les systèmes de fichiers ONTAP. Grafana fournit un tableau de bord où les métriques de récolte collectées peuvent être affichées.

Tableaux de bord Harvest pris en charge

Amazon FSx for NetApp ONTAP présente un ensemble de mesures différent de celui d'ONTAP sur site. NetApp Par conséquent, seuls les tableaux de bord out-of-the-box Harvest suivants marqués avec le tag fsx sont actuellement pris en charge pour une utilisation avec FSx for ONTAP. Certains panneaux de ces tableaux de bord peuvent ne pas contenir des informations qui ne sont pas prises en charge.

  • ONTAP : Conformité

  • ONTAP : Instantanés de protection des données

  • ONTAP : Sécurité

  • POINT DE CONTACT : SVM

  • ONTAP : Volume

AWS CloudFormation modèle

Pour commencer, vous pouvez déployer un AWS CloudFormation modèle qui lance automatiquement une instance Amazon EC2 exécutant Harvest et Grafana. En entrée du AWS CloudFormation modèle, vous spécifiez l'fsxadminutilisateur et le point de terminaison de gestion Amazon FSx pour le système de fichiers qui sera ajouté dans le cadre de ce déploiement. Une fois le déploiement terminé, vous pouvez vous connecter au tableau de bord Grafana pour surveiller votre système de fichiers.

Cette solution permet AWS CloudFormation d'automatiser le déploiement de la solution Harvest et Grafana. Le modèle crée une instance Linux Amazon EC2 et installe les logiciels Harvest et Grafana. Pour utiliser cette solution, téléchargez le modèle AWS CloudFormation fsx-ontap-harvest-grafana.template.

Note

La mise en œuvre de cette solution entraîne la facturation des AWS services associés. Pour plus d'informations, consultez les pages de détail des tarifs de ces services.

Types d'instances Amazon EC2

Lors de la configuration du modèle, vous indiquez le type d'instance Amazon EC2. NetAppLa recommandation concernant la taille de l'instance dépend du nombre de systèmes de fichiers que vous surveillez et du nombre de métriques que vous choisissez de collecter. Avec la configuration par défaut, pour chaque 10 systèmes de fichiers que vous surveillez, NetApp recommande :

  • Processeur : 2 cœurs

  • Mémoire : 1 Go

  • Disque : 500 Mo (principalement utilisé par les fichiers journaux)

Voici quelques exemples de configurations et le type d't3instance que vous pouvez choisir.

Systèmes de fichiers CPU Disk Type d’instance

Moins de 10 ans

2 noyaux

500 Mo

t3.micro

10 à 40

4 cœurs

1000 MO

t3.xlarge

40 ans et plus

8 noyaux

2000 MO

t3.2xlarge

Pour plus d'informations sur les types d'instances Amazon EC2, consultez la section Instances à usage général dans le guide de l'utilisateur Amazon EC2.

Règles relatives aux ports d'instance

Lorsque vous configurez votre instance Amazon EC2, assurez-vous que les ports 3000 et 9090 sont ouverts au trafic entrant pour le groupe de sécurité auquel appartient l'instance Amazon EC2 Harvest et Grafana. Étant donné que l'instance lancée se connecte à un point de terminaison via HTTPS, elle doit résoudre le point de terminaison, qui a besoin du port 53 TCP/UDP pour le DNS. De plus, pour atteindre le point de terminaison, il a besoin du port 443 TCP pour HTTPS et Internet Access.

Procédure de déploiement

La procédure suivante configure et déploie la solution Harvest/Grafana. Le déploiement prend environ cinq minutes. Avant de commencer, vous devez disposer d'un système de fichiers FSx for ONTAP exécuté dans un Amazon Virtual Private Cloud (Amazon VPC) sur votre AWS compte, ainsi que des informations sur les paramètres du modèle répertoriées ci-dessous. Pour plus d'informations sur la création d'un système de fichiers, consultezCréation de FSx pour les systèmes de fichiers ONTAP.

Pour lancer la suite de solutions Harvest/Grafana
  1. Téléchargez le modèle AWS CloudFormation fsx-ontap-harvest-grafana.template. Pour plus d'informations sur la création d'une AWS CloudFormation pile, consultez la section Création d'une pile sur la AWS CloudFormation console dans le Guide de AWS CloudFormation l'utilisateur.

    Note

    Par défaut, ce modèle est lancé dans la AWS région USA Est (Virginie du Nord). Vous devez lancer cette solution Région AWS là où Amazon FSx est disponible. Pour plus d'informations, consultez la section Points de terminaison et quotas Amazon FSx dans le.Références générales AWS

  2. Pour les paramètres, passez en revue les paramètres du modèle et modifiez-les en fonction des besoins de votre système de fichiers. Cette solution utilise les valeurs par défaut suivantes.

    Paramètre Par défaut Description
    InstanceType t3.micro

    Type d'instance Amazon EC2. Voici les types d't3instances.

    • t3.micro

    • t3.small

    • t3.medium

    • t3.large

    • t3.xlarge

    • t3.2xlarge

    Pour obtenir la liste complète des valeurs de type d'instance Amazon EC2 autorisées pour ce paramètre, consultez le fsx-ontap-harvest-grafana fichier .template.

    KeyPair Aucune valeur par défaut La paire de clés utilisée pour accéder à l'instance Amazon EC2.
    SecurityGroup Aucune valeur par défaut L'ID du groupe de sécurité pour l'instance Harvest/Grafana. Assurez-vous que les ports entrants 3000 et 9090, en plus des ports 53 et 443, sont ouverts depuis les clients que vous souhaitez utiliser pour accéder à votre tableau de bord Grafana.
    Type de sous-réseau Aucune valeur par défaut Spécifiez le type de sous-réseau, public soitprivate. Utilisez un public sous-réseau pour les ressources qui doivent être connectées à Internet et un sous-réseau privé pour les ressources qui ne seront pas connectées à Internet. Pour plus d'informations, consultez la section Types de sous-réseaux dans le guide de l'utilisateur Amazon VPC.
    Sous-réseau Aucune valeur par défaut Spécifiez le même sous-réseau que le sous-réseau préféré de votre système de fichiers Amazon FSx NetApp for ONTAP. Vous pouvez trouver l'ID de sous-réseau préféré du système de fichiers dans la console Amazon FSx, dans l'onglet Réseau et sécurité de la page de détails du système de fichiers FSx for ONTAP
    LatestLinuxAmiId /aws/service/ami-amazon-linux-latest/amzn2-ami-hvm-x86_64-gp2 La dernière version de l'AMI Amazon Linux 2 est une donnée Région AWS.
    SxEndPoint F Aucune valeur par défaut Adresse IP du point de terminaison de gestion du système de fichiers. Vous trouverez l'adresse IP du point de terminaison de gestion du système de fichiers dans la console Amazon FSx, dans l'onglet Administration de la page de détails du système de fichiers FSx for ONTAP.
    SecretName Aucune valeur par défaut AWS Secrets Manager nom secret contenant le mot de passe de l'fsxadminutilisateur du système de fichiers. Il s'agit du mot de passe que vous avez fourni lors de la création du système de fichiers.
  3. Choisissez Suivant.

  4. Pour Options, choisissez Next.

  5. Pour la révision, vérifiez et confirmez les paramètres. Vous devez cocher la case reconnaissant que le modèle crée des ressources IAM.

  6. Choisissez Créer pour déployer la pile.

Vous pouvez consulter l'état de la pile dans la AWS CloudFormation console dans la colonne État. Vous devriez voir le statut CREATE_COMPLETE dans environ cinq minutes.

Connexion à Grafana

Une fois le déploiement terminé, utilisez votre navigateur pour vous connecter au tableau de bord Grafana à l'adresse IP et au port 3000 de l'instance Amazon EC2 :

http://EC2_instance_IP:3000

Lorsque vous y êtes invité, utilisez le nom d'utilisateur par défaut (admin) et le mot de passe (pass) de Grafana. Nous vous recommandons de modifier votre mot de passe dès que vous vous connectez.

Pour plus d'informations, consultez la page NetApp Récolte sur GitHub.

Résolution des problèmes liés à Harvest et Grafana

Si vous rencontrez des données manquantes mentionnées dans les tableaux de bord Harvest et Grafana ou si vous rencontrez des difficultés pour configurer Harvest et Grafana avec FSx pour ONTAP, consultez les rubriques suivantes pour trouver une solution potentielle.

Les tableaux de bord des SVM et des volumes sont vides

Si la AWS CloudFormation pile a été déployée avec succès et peut contacter Grafana mais que les tableaux de bord de la SVM et des volumes sont vides, suivez la procédure ci-dessous pour dépanner votre environnement. Vous aurez besoin d'un accès SSH à l'instance Amazon EC2 sur laquelle Harvest and Grafana est déployé.

  1. Connectez-vous par SSH à l'instance Amazon EC2 sur laquelle vos clients Harvest et Grafana s'exécutent.

    [~]$ ssh ec2-user@ec2_ip_address
  2. Utilisez la commande suivante pour ouvrir le harvest.yml fichier et :

    • Vérifiez qu'une entrée a été créée pour votre instance FSx for ONTAP en tant que. Cluster-2

    • Vérifiez que les entrées du nom d'utilisateur et du mot de passe correspondent à vos fsxadmin informations d'identification.

    [ec2-user@ip-ec2_ip_address ~]$ sudo cat /home/ec2-user/harvest_install/harvest/harvest.yml
  3. Si le champ du mot de passe est vide, ouvrez le fichier dans un éditeur et mettez-le à jour avec le fsxadmin mot de passe, comme suit :

    [ec2-user@ip-ec2_ip_address ~]$ sudo vi /home/ec2-user/harvest_install/harvest/harvest.yml
  4. Assurez-vous que les informations fsxadmin d'identification de l'utilisateur sont stockées dans Secrets Manager au format suivant pour tout futur déploiement, en les fsxadmin_password remplaçant par votre mot de passe.

    {"username" : "fsxadmin", "password" : "fsxadmin_password"}

CloudFormation pile annulée après expiration du délai

Si vous ne parvenez pas à déployer la CloudFormation pile avec succès et qu'elle est annulée avec des erreurs, suivez la procédure ci-dessous pour résoudre le problème. Vous aurez besoin d'un accès SSH à l'instance EC2 déployée par la CloudFormation pile.

  1. Redéployez la CloudFormation pile en vous assurant que la restauration automatique est désactivée.

  2. Connectez-vous par SSH à l'instance Amazon EC2 sur laquelle vos clients Harvest et Grafana s'exécutent.

    [~]$ ssh ec2-user@ec2_ip_address
  3. Vérifiez que les conteneurs docker ont bien été démarrés à l'aide de la commande suivante.

    [ec2-user@ip-ec2_ip_address ~]$ sudo docker ps

    Dans la réponse, vous devriez voir cinq conteneurs comme suit :

    CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 6b9b3f2085ef rahulguptajss/harvest "bin/poller --config…" 8 minutes ago Restarting (1) 20 seconds ago harvest_cluster-2 3cf3e3623fde rahulguptajss/harvest "bin/poller --config…" 8 minutes ago Up About a minute harvest_cluster-1 708f3b7ef6f8 grafana/grafana "/run.sh" 8 minutes ago Up 8 minutes 0.0.0.0:3000->3000/tcp harvest_grafana 0febee61cab7 prom/alertmanager "/bin/alertmanager -…" 8 minutes ago Up 8 minutes 0.0.0.0:9093->9093/tcp harvest_prometheus_alertmanager 1706d8cd5a0c prom/prometheus "/bin/prometheus --c…" 8 minutes ago Up 8 minutes 0.0.0.0:9090->9090/tcp harvest_prometheus
  4. Si les conteneurs docker ne sont pas en cours d'exécution, vérifiez les défaillances dans le /var/log/cloud-init-output.log fichier comme suit.

    [ec2-user@ip-ec2_ip_address ~]$ sudo cat /var/log/cloud-init-output.log PLAY [Manage Harvest] ********************************************************** TASK [Gathering Facts] ********************************************************* ok: [localhost] TASK [Verify images] *********************************************************** failed: [localhost] (item=prom/prometheus) => {"ansible_loop_var": "item", "changed": false, "item": "prom/prometheus", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetError(104, 'Co nnection reset by peer'))"} failed: [localhost] (item=prom/alertmanager) => {"ansible_loop_var": "item", "changed": false, "item": "prom/alertmanage r", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetError(104, 'Connection reset by peer'))"} failed: [localhost] (item=rahulguptajss/harvest) => {"ansible_loop_var": "item", "changed": false, "item": "rahulguptajs s/harvest", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetEr ror(104, 'Connection reset by peer'))"} failed: [localhost] (item=grafana/grafana) => {"ansible_loop_var": "item", "changed": false, "item": "grafana/grafana", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetError(104, 'Co nnection reset by peer'))"} PLAY RECAP ********************************************************************* localhost : ok=1 changed=0 unreachable=0 failed=1 skipped=0 rescued=0 ignored=0
  5. En cas d'échec, exécutez les commandes suivantes pour déployer les conteneurs Harvest et Grafana.

    [ec2-user@ip-ec2_ip_address ~]$ sudo su [ec2-user@ip-ec2_ip_address ~]$ cd /home/ec2-user/harvest_install [ec2-user@ip-ec2_ip_address ~]$ /usr/local/bin/ansible-playbook manage_harvest.yml [ec2-user@ip-ec2_ip_address ~]$ /usr/local/bin/ansible-playbook manage_harvest.yml --tags api
  6. Validez les conteneurs démarrés avec succès en exécutant sudo docker ps et en vous connectant à votre URL Harvest et Grafana.