Überwachung von FSx für ONTAP-Dateisysteme mit Harvest und Grafana - FSx für ONTAP

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überwachung von FSx für ONTAP-Dateisysteme mit Harvest und Grafana

NetApp Harvest ist ein Open-Source-Tool zum Sammeln von Leistungs- und Kapazitätsmetriken von ONTAP-Systemen und ist mit FSx for ONTAP kompatibel. Sie können Harvest mit Grafana für eine Open-Source-Monitoring-Lösung verwenden.

Erste Schritte mit Harvest und Grafana

Im folgenden Abschnitt wird beschrieben, wie Sie Harvest und Grafana einrichten und konfigurieren können, um die Leistung und Speicherkapazitätsauslastung Ihres FSx for ONTAP-Dateisystems zu messen.

Sie können Ihr Amazon FSx for NetApp ONTAP-Dateisystem mithilfe von Harvest und Grafana überwachen. NetApp Harvest überwacht ONTAP-Rechenzentren, indem es Leistungs-, Kapazitäts- und Hardwaremetriken von FSx für ONTAP-Dateisysteme sammelt. Grafana bietet ein Dashboard, in dem die gesammelten Harvest-Metriken angezeigt werden können.

Unterstützte Harvest-Dashboards

Amazon FSx for NetApp ONTAP stellt einen anderen Satz von Metriken zur Verfügung als On-Premises-ONTAP. NetApp Aus diesem Grund fsx werden derzeit nur die folgenden out-of-the-box Harvest-Dashboards, die mit gekennzeichnet sind, für die Verwendung mit FSx for ONTAP unterstützt. In einigen der Panels in diesen Dashboards fehlen möglicherweise Informationen, die nicht unterstützt werden.

  • ONTAP: Einhaltung der Vorschriften

  • ONTAP: Schnappschüsse zum Datenschutz

  • ONTAP: Sicherheit

  • ONTAP: SVM

  • ONTAP: Lautstärke

AWS CloudFormation Vorlage

Zu Beginn können Sie eine AWS CloudFormation Vorlage bereitstellen, die automatisch eine Amazon EC2 EC2-Instance startet, auf der Harvest und Grafana ausgeführt werden. Als Eingabe für die AWS CloudFormation Vorlage geben Sie den fsxadmin Benutzer und den Amazon FSx-Management-Endpunkt für das Dateisystem an, das als Teil dieser Bereitstellung hinzugefügt wird. Nach Abschluss der Bereitstellung können Sie sich im Grafana-Dashboard anmelden, um Ihr Dateisystem zu überwachen.

Diese Lösung automatisiert AWS CloudFormation die Bereitstellung der Harvest- und Grafana-Lösung. Die Vorlage erstellt eine Amazon EC2 EC2-Linux-Instance und installiert die Harvest- und Grafana-Software. Um diese Lösung zu verwenden, laden Sie die Vorlage AWS CloudFormation fsx-ontap-harvest-grafana.template herunter.

Anmerkung

Die Implementierung dieser Lösung erfordert die Abrechnung der zugehörigen Dienste. AWS Weitere Informationen finden Sie auf den Seiten mit den Preisdetails für diese Dienste.

Amazon EC2-Instance-Typen

Bei der Konfiguration der Vorlage geben Sie den Amazon EC2 EC2-Instance-Typ an. NetAppDie Empfehlung für die Instance-Größe hängt davon ab, wie viele Dateisysteme Sie überwachen und wie viele Metriken Sie sammeln möchten. In der Standardkonfiguration wird für jeweils 10 Dateisysteme, die Sie überwachen, Folgendes NetApp empfohlen:

  • CPU: 2 Kerne

  • Arbeitsspeicher: 1 GB

  • Festplatte: 500 MB (wird hauptsächlich von Protokolldateien verwendet)

Im Folgenden finden Sie einige Beispielkonfigurationen und den t3 Instanztyp, den Sie wählen könnten.

Dateisysteme CPU Festplatte Instance-Typ

Unter 10

2 Kerne

500 MB

t3.micro

10—40

4 Kerne

1000 MB

t3.xlarge

40+

8 Kerne

2000 MB

t3.2xlarge

Weitere Informationen zu Amazon EC2 EC2-Instance-Typen finden Sie unter General Purpose Instances im Amazon EC2 EC2-Benutzerhandbuch.

Regeln für den Instance-Port

Wenn Sie Ihre Amazon EC2-Instance einrichten, stellen Sie sicher, dass die Ports 3000 und 9090 für eingehenden Datenverkehr für die Sicherheitsgruppe geöffnet sind, in der sich die Amazon EC2 Harvest- und Grafana-Instance befindet. Da die gestartete Instance über HTTPS eine Verbindung zu einem Endpunkt herstellt, muss sie den Endpunkt auflösen, der Port 53 TCP/UDP für DNS benötigt. Um den Endpunkt zu erreichen, benötigt sie außerdem Port 443 TCP für HTTPS und Internetzugang.

Verfahren zur Bereitstellung

Mit dem folgenden Verfahren wird die Harvest/Grafana-Lösung konfiguriert und bereitgestellt. Die Bereitstellung dauert etwa fünf Minuten. Bevor Sie beginnen, benötigen Sie ein FSx for ONTAP-Dateisystem, das in einer Amazon Virtual Private Cloud (Amazon VPC) läuft, in Ihrem AWS Konto und die unten aufgeführten Parameterinformationen für die Vorlage. Weitere Informationen zum Erstellen eines Dateisystems finden Sie unter. FSx für ONTAP-Dateisysteme erstellen

Um den Harvest/Grafana-Lösungspack zu starten
  1. Laden Sie die Vorlage fsx-ontap-harvest-grafana.template herunter. AWS CloudFormation Weitere Informationen zum Erstellen eines Stacks finden Sie im Benutzerhandbuch unter Erstellen eines AWS CloudFormation Stacks auf der Konsole. AWS CloudFormation AWS CloudFormation

    Anmerkung

    Standardmäßig wird diese Vorlage in der AWS Region USA Ost (Nord-Virginia) gestartet. Sie müssen diese Lösung an einem Ort starten AWS-Region , an dem Amazon FSx verfügbar ist. Weitere Informationen finden Sie unter Amazon FSx-Endpunkte und Kontingente in der.Allgemeine AWS-Referenz

  2. Überprüfen Sie unter Parameter die Parameter für die Vorlage und ändern Sie sie an die Anforderungen Ihres Dateisystems. Diese Lösung verwendet die folgenden Standardwerte.

    Parameter Standard Beschreibung
    InstanceType t3.micro

    Der Amazon EC2 EC2-Instance-Typ. Im Folgenden sind die t3 Instance-Typen aufgeführt.

    • t3.micro

    • t3.small

    • t3.medium

    • t3.large

    • t3.xlarge

    • t3.2xlarge

    Die vollständige Liste der zulässigen Amazon EC2 EC2-Instance-Typwerte für diesen Parameter finden Sie unter fsx-ontap-harvest-grafana .template.

    KeyPair Kein Standardwert Das key pair, das für den Zugriff auf die Amazon EC2 EC2-Instance verwendet wird.
    SecurityGroup Kein Standardwert Die Sicherheitsgruppen-ID für die Harvest/Grafana-Instance. Stellen Sie sicher, dass die eingehenden Ports 3000 und 9090 sowie die Ports 53 und 443 von den Clients aus geöffnet sind, die Sie für den Zugriff auf Ihr Grafana-Dashboard verwenden möchten.
    Subnetz-Typ Kein Standardwert Geben Sie den Subnetztyp an, entweder oderpublic. private Verwenden Sie ein public Subnetz für Ressourcen, die mit dem Internet verbunden werden müssen, und ein privates Subnetz für Ressourcen, die nicht mit dem Internet verbunden werden sollen. Weitere Informationen finden Sie unter Subnetztypen im Amazon VPC-Benutzerhandbuch.
    Subnetz Kein Standardwert Geben Sie dasselbe Subnetz wie das bevorzugte Subnetz Ihres Amazon FSx for NetApp ONTAP-Dateisystems an. Sie finden die bevorzugte Subnetz-ID des Dateisystems in der Amazon FSx-Konsole auf der Registerkarte Netzwerk und Sicherheit auf der Detailseite des Dateisystems FSx for ONTAP
    LatestLinuxAmiId /aws/service/ami-amazon-linux-latest/amzn2-ami-hvm-x86_64-gp2 Die neueste Version des Amazon Linux 2 AMI in einem bestimmten Fall AWS-Region.
    SxEndF-Punkt Kein Standardwert Die IP-Adresse des Management-Endpunkts des Dateisystems. Die IP-Adresse des Verwaltungsendpunkts des Dateisystems finden Sie in der Amazon FSx-Konsole auf der Registerkarte Administration auf der Detailseite des Dateisystems FSx for ONTAP.
    SecretName Kein Standardwert AWS Secrets Manager geheimer Name, der das Passwort für den Benutzer des Dateisystems enthält. fsxadmin Dies ist das Passwort, das Sie bei der Erstellung des Dateisystems angegeben haben.
  3. Wählen Sie Weiter aus.

  4. Wählen Sie unter Optionen die Option Weiter aus.

  5. Überprüfen und bestätigen Sie die Einstellungen zur Überprüfung. Sie müssen das Kontrollkästchen aktivieren, das bestätigt, dass die Vorlage IAM-Ressourcen erstellt.

  6. Wählen Sie Create aus, um den Stack bereitzustellen.

Sie können den Status des Stacks in der AWS CloudFormation Konsole in der Spalte Status einsehen. In etwa fünf Minuten sollte der Status CREATE_COMPLETE angezeigt werden.

Bei Grafana einloggen

Melden Sie sich nach Abschluss der Bereitstellung mit Ihrem Browser beim Grafana-Dashboard an der IP und dem Port 3000 der Amazon EC2 EC2-Instance an:

http://EC2_instance_IP:3000

Wenn Sie dazu aufgefordert werden, verwenden Sie den Grafana-Standardbenutzernamen (admin) und das Passwort (pass). Wir empfehlen Ihnen, Ihr Passwort zu ändern, sobald Sie sich anmelden.

Weitere Informationen finden Sie auf der NetApp Harvest-Seite unter GitHub.

Fehlerbehebung bei Harvest und Grafana

Wenn Sie auf Daten stoßen, die in den Harvest- und Grafana-Dashboards erwähnt werden, oder wenn Sie Probleme bei der Einrichtung von Harvest und Grafana mit FSx for ONTAP haben, finden Sie in den folgenden Themen eine mögliche Lösung.

Die SVM- und Volume-Dashboards sind leer

Wenn der AWS CloudFormation Stack erfolgreich bereitgestellt wurde und Grafana kontaktiert werden kann, die SVM- und Volume-Dashboards jedoch leer sind, gehen Sie wie folgt vor, um Fehler in Ihrer Umgebung zu beheben. Sie benötigen SSH-Zugriff auf die Amazon EC2 EC2-Instance, auf der Harvest and Grafana bereitgestellt wird.

  1. Stellen Sie per SSH eine Verbindung zur Amazon EC2-Instance her, auf der Ihre Harvest- und Grafana-Clients laufen.

    [~]$ ssh ec2-user@ec2_ip_address
  2. Verwenden Sie den folgenden Befehl, um die Datei zu öffnen und: harvest.yml

    • Stellen Sie sicher, dass ein Eintrag für Ihre FSx for ONTAP-Instanz als erstellt wurde. Cluster-2

    • Stellen Sie sicher, dass die Einträge für Benutzername und Passwort mit Ihren fsxadmin Anmeldeinformationen übereinstimmen.

    [ec2-user@ip-ec2_ip_address ~]$ sudo cat /home/ec2-user/harvest_install/harvest/harvest.yml
  3. Wenn das Passwortfeld leer ist, öffnen Sie die Datei in einem Editor und aktualisieren Sie sie mit dem fsxadmin Passwort wie folgt:

    [ec2-user@ip-ec2_ip_address ~]$ sudo vi /home/ec2-user/harvest_install/harvest/harvest.yml
  4. Stellen Sie sicher, dass die fsxadmin Benutzeranmeldeinformationen für future Bereitstellungen im Secrets Manager im folgenden Format gespeichert und durch Ihr Passwort fsxadmin_password ersetzt werden.

    {"username" : "fsxadmin", "password" : "fsxadmin_password"}

CloudFormation Der Stack wurde nach dem Timeout zurückgesetzt

Wenn Sie den CloudFormation Stack nicht erfolgreich bereitstellen können und er mit Fehlern zurückgesetzt wird, gehen Sie wie folgt vor, um das Problem zu beheben. Sie benötigen SSH-Zugriff auf die vom Stack bereitgestellte EC2-Instance. CloudFormation

  1. Stellen Sie den CloudFormation Stack erneut bereit und stellen Sie sicher, dass das automatische Rollback deaktiviert ist.

  2. Stellen Sie per SSH eine Verbindung zur Amazon EC2-Instance her, auf der Ihre Harvest- und Grafana-Clients laufen.

    [~]$ ssh ec2-user@ec2_ip_address
  3. Stellen Sie mit dem folgenden Befehl sicher, dass die Docker-Container erfolgreich gestartet wurden.

    [ec2-user@ip-ec2_ip_address ~]$ sudo docker ps

    In der Antwort sollten Sie fünf Container wie folgt sehen:

    CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 6b9b3f2085ef rahulguptajss/harvest "bin/poller --config…" 8 minutes ago Restarting (1) 20 seconds ago harvest_cluster-2 3cf3e3623fde rahulguptajss/harvest "bin/poller --config…" 8 minutes ago Up About a minute harvest_cluster-1 708f3b7ef6f8 grafana/grafana "/run.sh" 8 minutes ago Up 8 minutes 0.0.0.0:3000->3000/tcp harvest_grafana 0febee61cab7 prom/alertmanager "/bin/alertmanager -…" 8 minutes ago Up 8 minutes 0.0.0.0:9093->9093/tcp harvest_prometheus_alertmanager 1706d8cd5a0c prom/prometheus "/bin/prometheus --c…" 8 minutes ago Up 8 minutes 0.0.0.0:9090->9090/tcp harvest_prometheus
  4. Wenn die Docker-Container nicht ausgeführt werden, überprüfen Sie die /var/log/cloud-init-output.log Datei wie folgt auf Fehler.

    [ec2-user@ip-ec2_ip_address ~]$ sudo cat /var/log/cloud-init-output.log PLAY [Manage Harvest] ********************************************************** TASK [Gathering Facts] ********************************************************* ok: [localhost] TASK [Verify images] *********************************************************** failed: [localhost] (item=prom/prometheus) => {"ansible_loop_var": "item", "changed": false, "item": "prom/prometheus", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetError(104, 'Co nnection reset by peer'))"} failed: [localhost] (item=prom/alertmanager) => {"ansible_loop_var": "item", "changed": false, "item": "prom/alertmanage r", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetError(104, 'Connection reset by peer'))"} failed: [localhost] (item=rahulguptajss/harvest) => {"ansible_loop_var": "item", "changed": false, "item": "rahulguptajs s/harvest", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetEr ror(104, 'Connection reset by peer'))"} failed: [localhost] (item=grafana/grafana) => {"ansible_loop_var": "item", "changed": false, "item": "grafana/grafana", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetError(104, 'Co nnection reset by peer'))"} PLAY RECAP ********************************************************************* localhost : ok=1 changed=0 unreachable=0 failed=1 skipped=0 rescued=0 ignored=0
  5. Wenn Fehler auftreten, führen Sie die folgenden Befehle aus, um die Harvest- und Grafana-Container bereitzustellen.

    [ec2-user@ip-ec2_ip_address ~]$ sudo su [ec2-user@ip-ec2_ip_address ~]$ cd /home/ec2-user/harvest_install [ec2-user@ip-ec2_ip_address ~]$ /usr/local/bin/ansible-playbook manage_harvest.yml [ec2-user@ip-ec2_ip_address ~]$ /usr/local/bin/ansible-playbook manage_harvest.yml --tags api
  6. Überprüfen Sie die erfolgreich gestarteten Container, indem Sie Ihre Harvest sudo docker ps - und Grafana-URL ausführen und eine Verbindung zu ihr herstellen.