OPS04-BP05 Mettre en œuvre le traçage distribué - AWS Framework Well-Architected

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

OPS04-BP05 Mettre en œuvre le traçage distribué

Le suivi distribué permet de surveiller et de visualiser les requêtes lorsqu’elles traversent les différents composants d’un système distribué. En capturant les données de suivi provenant de plusieurs sources et en les analysant dans une vue unifiée, les équipes peuvent mieux comprendre le flux des requêtes, les endroits où les goulots d’étranglement ont lieu et les domaines dans lesquels les efforts d’optimisation doivent se concentrer.

Résultat escompté : bénéficiez d’une vue globale des requêtes circulant dans votre système distribué, ce qui permet un débogage précis, des performances optimisées et une meilleure expérience utilisateur.

Anti-modèles courants :

  • Instrumentation incohérente : les services d’un système distribué ne sont pas tous instrumentés pour le suivi.

  • Ignorer la latence : se concentrer uniquement sur les erreurs et ne pas tenir compte de la latence ou de la dégradation progressive des performances.

Avantages liés au respect de cette bonne pratique :

  • Vue d’ensemble complète du système : visualisation du parcours complet des requêtes, de l’entrée à la sortie.

  • Débogage amélioré : identification rapide des défaillances ou des problèmes de performance.

  • Expérience utilisateur améliorée : surveillance et optimisation basées sur des données sur les utilisateurs réels, afin de garantir que le système répond aux exigences du monde réel.

Niveau d’exposition au risque si cette bonne pratique n’est pas respectée : élevé

Directives d’implémentation

Commencez par identifier tous les éléments de votre charge de travail qui nécessitent de l’instrumentation. Une fois que tous les composants sont pris en compte, utilisez des outils tels que AWS X-Ray et OpenTelemetry pour collecter des données de trace à des fins d'analyse avec des outils tels que X-Ray et Amazon CloudWatch ServiceLens Map. Participez à des évaluations régulières avec les développeurs et complétez ces discussions avec des outils tels qu'Amazon DevOps Guru, X-Ray Analytics et X-Ray Insights pour vous aider à découvrir des résultats plus approfondis. Définissez des alertes à partir des données de suivi pour envoyer une notification lorsque les résultats, tels que décrits dans le plan de surveillance de la charge de travail, sont menacés.

Étapes d’implémentation

Pour mettre en œuvre efficacement le suivi distribué :

  1. Adoption de AWS X-Ray : intégrez X-Ray à votre application pour mieux comprendre son comportement, interpréter ses performances et identifier les goulots d’étranglement. Utilisez X-Ray Insights pour l’analyse automatique des données de suivi.

  2. Instrumentez vos services : vérifiez que chaque service, qu'il s'agisse d'une AWS Lambdafonction ou d'une EC2instance, envoie des données de suivi. Plus vous instrumentez de services, plus la end-to-end vue est claire.

  3. Intégrez la surveillance des utilisateurs CloudWatch réels et la surveillance synthétique : intégrez la surveillance des utilisateurs réels (RUM) et la surveillance synthétique avec X-Ray. Cela permet de capturer des expériences utilisateur réelles et de simuler les interactions des utilisateurs afin d’identifier les problèmes potentiels.

  4. Utiliser l'CloudWatch agent : l'agent peut envoyer des traces à partir de X-Ray ou OpenTelemetry pour améliorer la profondeur des informations obtenues.

  5. Utilisez Amazon DevOps Guru : DevOps Guru utilise les données de X-Ray CloudWatch, AWS Config, et AWS CloudTrail pour fournir des recommandations exploitables.

  6. Analyse des traces : passez régulièrement en revue les données de suivi pour identifier les tendances, les anomalies ou les goulots d’étranglement susceptibles d’avoir un impact sur les performances de votre application.

  7. Configurez des alertes : configurez les alarmes en fonction CloudWatchde modèles inhabituels ou de latences prolongées, ce qui permet de résoudre les problèmes de manière proactive.

  8. Amélioration continue : revoyez votre stratégie de suivi au fur et à mesure que des services sont ajoutés ou modifiés afin de capturer tous les points de données pertinents.

Niveau d’effort du plan d’implémentation : moyen

Ressources

Bonnes pratiques associées :

Documents connexes :

Vidéos connexes :

Exemples connexes :