Überwachung von FSx ONTAP Dateisystemen mit Harvest und Grafana - FSx für ONTAP

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überwachung von FSx ONTAP Dateisystemen mit Harvest und Grafana

NetApp Harvest ist ein Open-Source-Tool zum Sammeln von Leistungs- und Kapazitätskennzahlen von ONTAP Systemen und ist kompatibel mit FSx forONTAP. Sie können Harvest mit Grafana für eine Open-Source-Monitoring-Lösung verwenden.

Erste Schritte mit Harvest und Grafana

Im folgenden Abschnitt wird beschrieben, wie Sie Harvest und Grafana einrichten und konfigurieren können, um die Leistung und Speicherkapazitätsauslastung Ihres FSx ONTAP Dateisystems zu messen.

Sie können Ihr FSx NetApp ONTAP Amazon-Dateisystem mithilfe von Harvest und Grafana überwachen. NetApp Harvest überwacht ONTAP Rechenzentren, indem es Leistungs-, Kapazitäts- und Hardwaremetriken von vier FSx ONTAP Dateisystemen erfasst. Grafana bietet ein Dashboard, in dem die gesammelten Harvest-Metriken angezeigt werden können.

Unterstützte Harvest-Dashboards

Amazon FSx for NetApp ONTAP stellt einen anderen Satz von Kennzahlen zur Verfügung als NetApp ONTAP On-Premises-Lösungen. Daher werden derzeit nur die folgenden out-of-the-box Harvest-Dashboards, die mit gekennzeichnet fsx sind, für die Verwendung mit for unterstützt. FSx ONTAP In einigen Bereichen in diesen Dashboards fehlen möglicherweise Informationen, die nicht unterstützt werden.

  • ONTAP: Einhaltung der Vorschriften

  • ONTAP: Schnappschüsse zum Datenschutz

  • ONTAP: Sicherheit

  • ONTAP: SVM

  • ONTAP: Lautstärke

AWS CloudFormation Vorlage

Zu Beginn können Sie eine AWS CloudFormation Vorlage bereitstellen, die automatisch eine EC2 Amazon-Instance startet, auf der Harvest und Grafana ausgeführt werden. Als Eingabe für die AWS CloudFormation Vorlage geben Sie den fsxadmin Benutzer und den FSx Amazon-Management-Endpunkt für das Dateisystem an, das im Rahmen dieser Bereitstellung hinzugefügt wird. Nach Abschluss der Bereitstellung können Sie sich im Grafana-Dashboard anmelden, um Ihr Dateisystem zu überwachen.

Diese Lösung automatisiert AWS CloudFormation die Bereitstellung der Harvest- und Grafana-Lösung. Die Vorlage erstellt eine Amazon EC2 Linux-Instance und installiert die Harvest- und Grafana-Software. Um diese Lösung zu verwenden, laden Sie die fsx-ontap-harvest-grafanaVorlage .template AWS CloudFormation herunter.

Anmerkung

Die Implementierung dieser Lösung erfordert die Abrechnung der zugehörigen AWS Dienste. Weitere Informationen finden Sie auf den Seiten mit den Preisdetails für diese Dienste.

EC2Amazon-Instance-Typen

Bei der Konfiguration der Vorlage geben Sie den EC2 Amazon-Instance-Typ an. NetAppDie Empfehlung für die Instance-Größe hängt davon ab, wie viele Dateisysteme Sie überwachen und wie viele Messwerte Sie sammeln möchten. In der Standardkonfiguration wird für jeweils 10 Dateisysteme, die Sie überwachen, Folgendes NetApp empfohlen:

  • CPU: 2 Kerne

  • Speicher: 1 GB

  • Festplatte: 500 MB (wird hauptsächlich von Protokolldateien verwendet)

Im Folgenden finden Sie einige Beispielkonfigurationen und den t3 Instanztyp, den Sie wählen könnten.

Dateisysteme CPU Festplatte Instance-Typ

Unter 10

2 Kerne

500 MB

t3.micro

10—40

4 Kerne

1000 MB

t3.xlarge

40+

8 Kerne

2000 MB

t3.2xlarge

Weitere Informationen zu EC2 Amazon-Instance-Typen finden Sie unter General Purpose Instances im EC2Amazon-Benutzerhandbuch.

Regeln für den Instance-Port

Wenn Sie Ihre EC2 Amazon-Instance einrichten, stellen Sie sicher, dass die Ports 3000 und 9090 für eingehenden Datenverkehr für die Sicherheitsgruppe geöffnet sind, in der sich die Amazon EC2 Harvest- und Grafana-Instance befindet. Da die Instance, die gestartet wird, eine Verbindung zu einem Endpunkt herstelltHTTPS, muss sie den Endpunkt auflösen, für den Port 53TCP/benötigt wird. UDP DNS Um den Endpunkt zu erreichen, benötigt sie außerdem Port 443 TCP für HTTPS und Internetzugang.

Verfahren zur Bereitstellung

Mit dem folgenden Verfahren wird die Harvest/Grafana-Lösung konfiguriert und bereitgestellt. Die Bereitstellung dauert etwa fünf Minuten. Bevor Sie beginnen, müssen Sie in Ihrem AWS Konto ein FSx ONTAP for-Dateisystem haben, das in einer Amazon Virtual Private Cloud (AmazonVPC) ausgeführt wird, und die unten aufgeführten Parameterinformationen für die Vorlage. Weitere Informationen zum Erstellen eines Dateisystems finden Sie unterDateisysteme erstellen.

Um den Harvest/Grafana-Lösungspack zu starten
  1. Laden Sie die Vorlage „.template“ herunter. fsx-ontap-harvest-grafana AWS CloudFormation Weitere Informationen zum Erstellen eines AWS CloudFormation Stacks finden Sie im AWS CloudFormation Benutzerhandbuch unter Erstellen eines Stacks auf der AWS CloudFormation Konsole.

    Anmerkung

    Standardmäßig wird diese Vorlage in der AWS Region USA Ost (Nord-Virginia) gestartet. Sie müssen diese Lösung an einem Ort starten AWS-Region , an dem Amazon verfügbar FSx ist. Weitere Informationen finden Sie unter FSxAmazon-Endpunkte und Kontingente in der Allgemeine AWS-Referenz.

  2. Überprüfen Sie unter Parameter die Parameter für die Vorlage und ändern Sie sie an die Anforderungen Ihres Dateisystems. Diese Lösung verwendet die folgenden Standardwerte.

    Parameter Standard Beschreibung
    InstanceType t3.micro

    Der EC2 Amazon-Instance-Typ. Im Folgenden sind die t3 Instance-Typen aufgeführt.

    • t3.micro

    • t3.small

    • t3.medium

    • t3.large

    • t3.xlarge

    • t3.2xlarge

    Die vollständige Liste der zulässigen EC2 Amazon-Instance-Typwerte für diesen Parameter finden Sie unter fsx-ontap-harvest-grafana .template.

    KeyPair Kein Standardwert Das key pair, das für den Zugriff auf die EC2 Amazon-Instance verwendet wird.
    SecurityGroup Kein Standardwert Die Sicherheitsgruppen-ID für die Harvest/Grafana-Instance. Stellen Sie sicher, dass die eingehenden Ports 3000 und 9090 sowie die Ports 53 und 443 von den Clients aus geöffnet sind, die Sie für den Zugriff auf Ihr Grafana-Dashboard verwenden möchten.
    Subnetz-Typ Kein Standardwert Geben Sie den Subnetztyp an, entweder oderpublic. private Verwenden Sie ein public Subnetz für Ressourcen, die mit dem Internet verbunden werden müssen, und ein privates Subnetz für Ressourcen, die nicht mit dem Internet verbunden werden sollen. Weitere Informationen finden Sie unter Subnetztypen im VPCAmazon-Benutzerhandbuch.
    Subnetz Kein Standardwert Geben Sie dasselbe Subnetz wie das bevorzugte Subnetz Ihres Amazon FSx for NetApp ONTAP Dateisystems an. Sie finden die bevorzugte Subnetz-ID des Dateisystems in der FSx Amazon-Konsole auf der Registerkarte Netzwerk und Sicherheit auf der Seite mit FSx den ONTAP Dateisystemdetails
    LatestLinuxAmiId /aws/service/ami-amazon-linux-latest/amzn2-ami-hvm-x86_64-gp2 Die neueste Version von Amazon Linux 2 AMI ist gegeben AWS-Region.
    FSxEndPoint Kein Standardwert Die IP-Adresse des Management-Endpunkts des Dateisystems. Die IP-Adresse des Verwaltungsendpunkts des Dateisystems finden Sie in der FSx Amazon-Konsole auf der Registerkarte Administration auf der Seite mit FSx den ONTAP Dateisystemdetails.
    SecretName Kein Standardwert AWS Secrets Manager geheimer Name, der das Passwort für den fsxadmin Benutzer des Dateisystems enthält. Dies ist das Passwort, das Sie bei der Erstellung des Dateisystems angegeben haben.
  3. Wählen Sie Weiter.

  4. Wählen Sie unter Optionen die Option Weiter aus.

  5. Überprüfen und bestätigen Sie die Einstellungen zur Überprüfung. Sie müssen das Kontrollkästchen aktivieren, um zu bestätigen, dass die Vorlage IAM Ressourcen erstellt.

  6. Wählen Sie Create aus, um den Stack bereitzustellen.

Sie können den Status des Stacks in der AWS CloudFormation Konsole in der Spalte Status einsehen. COMPLETEIn etwa fünf Minuten sollte Ihnen der Status CREATE_ angezeigt werden.

Bei Grafana einloggen

Melden Sie sich nach Abschluss der Bereitstellung mit Ihrem Browser beim Grafana-Dashboard an der IP und dem Port 3000 der EC2 Amazon-Instance an:

http://EC2_instance_IP:3000

Wenn Sie dazu aufgefordert werden, verwenden Sie den Grafana-Standardbenutzernamen (admin) und das Passwort (pass). Wir empfehlen Ihnen, Ihr Passwort zu ändern, sobald Sie sich anmelden.

Weitere Informationen finden Sie auf der NetApp Harvest-Seite unter GitHub.

Fehlerbehebung bei Harvest und Grafana

Wenn Sie auf Daten stoßen, die in den Harvest- und Grafana-Dashboards erwähnt werden, oder wenn Sie Probleme beim Einrichten von Harvest und Grafana mit FSx for habenONTAP, finden Sie in den folgenden Themen nach einer möglichen Lösung.

SVMund die Volumen-Dashboards sind leer

Wenn der AWS CloudFormation Stack erfolgreich bereitgestellt wurde und Grafana kontaktiert werden kann, die Dashboards SVM und das Volume-Dashboard jedoch leer sind, gehen Sie wie folgt vor, um Fehler in Ihrer Umgebung zu beheben. Sie benötigen SSH Zugriff auf die EC2 Amazon-Instance, auf der Harvest and Grafana bereitgestellt wird.

  1. SSHin die EC2 Amazon-Instance, auf der Ihre Harvest- und Grafana-Clients laufen.

    [~]$ ssh ec2-user@ec2_ip_address
  2. Verwenden Sie den folgenden Befehl, um die harvest.yml Datei zu öffnen und:

    • Vergewissern Sie sich, dass ein Eintrag FSx für Ihr ONTAP Beispiel als erstellt wurdeCluster-2.

    • Stellen Sie sicher, dass die Einträge für Benutzername und Passwort mit Ihren fsxadmin Anmeldeinformationen übereinstimmen.

    [ec2-user@ip-ec2_ip_address ~]$ sudo cat /home/ec2-user/harvest_install/harvest/harvest.yml
  3. Wenn das Passwortfeld leer ist, öffnen Sie die Datei in einem Editor und aktualisieren Sie sie mit dem fsxadmin Passwort wie folgt:

    [ec2-user@ip-ec2_ip_address ~]$ sudo vi /home/ec2-user/harvest_install/harvest/harvest.yml
  4. Stellen Sie sicher, dass die fsxadmin Benutzeranmeldeinformationen für future Bereitstellungen im Secrets Manager im folgenden Format gespeichert und durch Ihr Passwort fsxadmin_password ersetzt werden.

    {"username" : "fsxadmin", "password" : "fsxadmin_password"}

CloudFormation Der Stack wurde nach dem Timeout zurückgesetzt

Wenn Sie den CloudFormation Stack nicht erfolgreich bereitstellen können und er mit Fehlern zurückgesetzt wird, gehen Sie wie folgt vor, um das Problem zu beheben. Sie benötigen SSH Zugriff auf die vom CloudFormation Stack bereitgestellte EC2 Instanz.

  1. Stellen Sie den CloudFormation Stack erneut bereit und stellen Sie sicher, dass das automatische Rollback deaktiviert ist.

  2. SSHin die EC2 Amazon-Instance, auf der Ihre Harvest- und Grafana-Clients laufen.

    [~]$ ssh ec2-user@ec2_ip_address
  3. Stellen Sie mit dem folgenden Befehl sicher, dass die Docker-Container erfolgreich gestartet wurden.

    [ec2-user@ip-ec2_ip_address ~]$ sudo docker ps

    In der Antwort sollten Sie fünf Container wie folgt sehen:

    CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 6b9b3f2085ef rahulguptajss/harvest "bin/poller --config…" 8 minutes ago Restarting (1) 20 seconds ago harvest_cluster-2 3cf3e3623fde rahulguptajss/harvest "bin/poller --config…" 8 minutes ago Up About a minute harvest_cluster-1 708f3b7ef6f8 grafana/grafana "/run.sh" 8 minutes ago Up 8 minutes 0.0.0.0:3000->3000/tcp harvest_grafana 0febee61cab7 prom/alertmanager "/bin/alertmanager -…" 8 minutes ago Up 8 minutes 0.0.0.0:9093->9093/tcp harvest_prometheus_alertmanager 1706d8cd5a0c prom/prometheus "/bin/prometheus --c…" 8 minutes ago Up 8 minutes 0.0.0.0:9090->9090/tcp harvest_prometheus
  4. Wenn die Docker-Container nicht ausgeführt werden, überprüfen Sie die /var/log/cloud-init-output.log Datei wie folgt auf Fehler.

    [ec2-user@ip-ec2_ip_address ~]$ sudo cat /var/log/cloud-init-output.log PLAY [Manage Harvest] ********************************************************** TASK [Gathering Facts] ********************************************************* ok: [localhost] TASK [Verify images] *********************************************************** failed: [localhost] (item=prom/prometheus) => {"ansible_loop_var": "item", "changed": false, "item": "prom/prometheus", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetError(104, 'Co nnection reset by peer'))"} failed: [localhost] (item=prom/alertmanager) => {"ansible_loop_var": "item", "changed": false, "item": "prom/alertmanage r", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetError(104, 'Connection reset by peer'))"} failed: [localhost] (item=rahulguptajss/harvest) => {"ansible_loop_var": "item", "changed": false, "item": "rahulguptajs s/harvest", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetEr ror(104, 'Connection reset by peer'))"} failed: [localhost] (item=grafana/grafana) => {"ansible_loop_var": "item", "changed": false, "item": "grafana/grafana", "msg": "Error connecting: Error while fetching server API version: ('Connection aborted.', ConnectionResetError(104, 'Co nnection reset by peer'))"} PLAY RECAP ********************************************************************* localhost : ok=1 changed=0 unreachable=0 failed=1 skipped=0 rescued=0 ignored=0
  5. Wenn Fehler auftreten, führen Sie die folgenden Befehle aus, um die Harvest- und Grafana-Container bereitzustellen.

    [ec2-user@ip-ec2_ip_address ~]$ sudo su [ec2-user@ip-ec2_ip_address ~]$ cd /home/ec2-user/harvest_install [ec2-user@ip-ec2_ip_address ~]$ /usr/local/bin/ansible-playbook manage_harvest.yml [ec2-user@ip-ec2_ip_address ~]$ /usr/local/bin/ansible-playbook manage_harvest.yml --tags api
  6. Überprüfen Sie die erfolgreich gestarteten Container, indem Sie Harvest sudo docker ps und Grafana URL ausführen und eine Verbindung zu ihnen herstellen.