OPS04-BP02 Implementieren Sie Anwendungstelemetrie - Säule „Betriebliche Exzellenz“

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

OPS04-BP02 Implementieren Sie Anwendungstelemetrie

Anwendungstelemetrie dient als Grundlage für die Beobachtbarkeit Ihres Workloads. Die ausgegebene Telemetrie muss unbedingt umsetzbare Erkenntnisse zum Status Ihrer Anwendung und zum Erreichen sowohl technischer als auch geschäftlicher Ergebnisse liefern. Von der Problembehebung über die Messung der Auswirkungen einer neuen Funktion bis hin zur Sicherstellung der Abstimmung mit den wichtigsten Unternehmensleistungsindikatoren (KPIs) — die Anwendungstelemetrie gibt Aufschluss darüber, wie Sie Ihre Workloads aufbauen, betreiben und weiterentwickeln.

Metriken, Protokolle und Traces bilden die drei wichtigsten Säulen der Beobachtbarkeit. Sie dienen als Diagnosetools, die den Status Ihrer Anwendung beschreiben. Im Laufe der Zeit helfen sie bei der Erstellung von Baselines und der Identifizierung von Anomalien. Um jedoch sicherzustellen, dass die Überwachungsaktivitäten und die Geschäftsziele aufeinander abgestimmt sind, ist es von entscheidender Bedeutung, diese zu definieren und zu überwachen. KPIs Unternehmen machen es KPIs oft einfacher, Probleme zu identifizieren als nur technische Kennzahlen.

Andere Telemetriearten, wie die Überwachung realer Benutzer (RUM) und synthetische Transaktionen, ergänzen diese primären Datenquellen. RUMbietet Einblicke in Benutzerinteraktionen in Echtzeit, während synthetische Transaktionen potenzielles Benutzerverhalten simulieren und so helfen, Engpässe zu erkennen, bevor echte Benutzer darauf stoßen.

Gewünschtes Ergebnis: Sie erzielen umsetzbare Erkenntnisse zur Leistung Ihres Workloads. Diese Erkenntnisse ermöglichen es Ihnen, proaktive Entscheidungen zur Leistungsoptimierung zu treffen, eine höhere Workload-Stabilität zu erreichen, CI/CD-Prozesse zu rationalisieren und Ressourcen effektiv zu nutzen.

Typische Anti-Muster:

  • Unvollständige Beobachtbarkeit: Wenn die Beobachtbarkeit nicht auf jeder Ebene der Workload berücksichtigt wird, führt dies zu blinden Flecken, die wichtige Erkenntnisse über Systemleistung und Verhalten verschleiern können.

  • Fragmentierte Datenansicht: Wenn Daten über mehrere Tools und Systeme verteilt sind, wird es schwierig, einen ganzheitlichen Überblick über den Zustand und die Leistung Ihrer Workloads zu behalten.

  • Von Benutzern gemeldete Probleme: Ein Zeichen dafür, dass eine proaktive Problemerkennung durch Telemetrie und KPI Unternehmensüberwachung fehlt.

Vorteile der Nutzung dieser bewährten Methode:

  • Fundierte Entscheidungsfindung: Mit Erkenntnissen aus Telemetrie und Unternehmen können Sie KPIs datengestützte Entscheidungen treffen.

  • Verbesserte betriebliche Effizienz: Datengesteuerte Ressourcennutzung führt zu Kosteneffektivität.

  • Verbesserte Workload-Stabilität: Schnellere Erkennung und Lösung von Problemen führt zu einer verbesserten Verfügbarkeit.

  • Optimierte CI/CD-Prozesse: Erkenntnisse aus Telemetriedaten erleichtern die Verfeinerung von Prozessen und sichern die Codebereitstellung.

Risikostufe, wenn diese bewährte Methode nicht eingeführt wird: Hoch

Implementierungsleitfaden

Verwenden Sie AWS Dienste wie Amazon CloudWatch und, um Anwendungstelemetrie für Ihren Workload zu implementieren. AWS X-Ray Amazon CloudWatch bietet eine umfassende Suite von Überwachungstools, mit denen Sie Ihre Ressourcen und Anwendungen in AWS und vor Ort überwachen können. Der Service erfasst, verfolgt und analysiert Metriken, konsolidiert und überwacht Protokolldaten und reagiert auf Änderungen in Ihren Ressourcen, wodurch Sie besser verstehen, wie Ihre Workload funktioniert. Gleichzeitig AWS X-Ray können Sie Ihre Anwendungen verfolgen, analysieren und debuggen, sodass Sie ein tiefes Verständnis des Verhaltens Ihrer Workloads erhalten. Mit Funktionen wie Service Maps, Latenzverteilungen und Trace-Zeitplänen AWS X-Ray bietet es Einblicke in die Leistung Ihres Workloads und die Engpässe, die sich darauf auswirken.

Implementierungsschritte

  1. Identifizieren, welche Daten erfasst werden sollen: Ermitteln Sie die wichtigsten Metriken, Protokolle und Traces, die aussagekräftige Erkenntnisse zu Zustand, Leistung und Verhalten Ihres Workloads bieten.

  2. Stellen Sie den CloudWatchAgenten bereit: Der CloudWatch Agent spielt eine wichtige Rolle bei der Beschaffung von System- und Anwendungsmetriken und Protokollen von Ihrem Workload und der zugrunde liegenden Infrastruktur. Der CloudWatch Agent kann auch verwendet werden, um Spuren zu sammeln OpenTelemetry oder zu röntgen und sie an X-Ray zu senden.

  3. Implementieren Sie die Anomalieerkennung für Protokolle und Metriken: Verwenden Sie die Erkennung von CloudWatch Protokollanomalien und die Erkennung von CloudWatchMetrikanomalien, um ungewöhnliche Aktivitäten im Betrieb Ihrer Anwendung automatisch zu identifizieren. Diese Tools verwenden Machine-Learning-Algorithmen, um Anomalien zu erkennen und sie zu melden. Dadurch werden Ihre Überwachungsfunktionen verbessert und die Reaktionszeit bei potenziellen Störungen oder Sicherheitsbedrohungen verkürzt. Richten Sie diese Features ein, um den Zustand und die Sicherheit von Anwendungen proaktiv zu verwalten.

  4. Schützen Sie sensible Protokolldaten: Verwenden Sie den Datenschutz von Amazon CloudWatch Logs, um vertrauliche Informationen in Ihren Protokollen zu maskieren. Dieses Feature trägt zur Wahrung von Datenschutz und Compliance bei, indem sensible Daten automatisch erkannt und maskiert werden, bevor auf sie zugegriffen wird. Implementieren Sie Datenmaskierung, um sensible Daten wie personenbezogene Daten sicher zu handhaben und zu schützen (PII).

  5. Definieren und überwachen Sie Ihr GeschäftKPIs: Legen Sie benutzerdefinierte Kennzahlen fest, die auf Ihre Geschäftsergebnisse abgestimmt sind.

  6. Instrumentieren Sie Ihre Anwendung mit AWS X-Ray: Neben der Bereitstellung des CloudWatch Agenten ist es wichtig, dass Ihre Anwendung so konfiguriert ist, dass sie Trace-Daten aussendet. Dieser Prozess kann weitere Erkenntnisse zum Verhalten und zur Leistung Ihrer Workload liefern.

  7. Standardisierung der Datenerfassung in Ihrer gesamten Anwendung: Standardisieren Sie die Datenerfassungspraktiken für Ihre gesamte Anwendung. Einheitlichkeit hilft bei der Korrelation und Analyse von Daten und liefert einen umfassenden Überblick über das Verhalten Ihrer Anwendung.

  8. Implementieren Sie kontenübergreifende Beobachtbarkeit: Verbessern Sie die Effizienz der Überwachung über mehrere Konten hinweg AWS-Konten mit der CloudWatch kontenübergreifenden Observability von Amazon. Mit dieser Funktion können Sie Metriken, Protokolle und Alarme von verschiedenen Konten in einer einzigen Ansicht konsolidieren, was die Verwaltung vereinfacht und die Reaktionszeiten bei identifizierten Problemen in der gesamten Unternehmensumgebung verbessert. AWS

  9. Daten analysieren und entsprechend handeln: Sobald die Datenerfassung und Normalisierung abgeschlossen sind, können Sie Amazon CloudWatch für die Analyse von Kennzahlen und Protokollen sowie für die Trace-Analyse verwenden. AWS X-Ray Eine solche Analyse kann wichtige Erkenntnisse über den Zustand, die Leistung und das Verhalten Ihrer Workload liefern und so Ihren Entscheidungsprozess beeinflussen.

Aufwand für den Implementierungsplan: Hoch

Ressourcen

Zugehörige bewährte Methoden:

Zugehörige Dokumente:

Zugehörige Videos:

Zugehörige Beispiele: