Directives d’implémentation Étapes d’implémentation Ressources

REL06-BP07 Surveillez le end-to-end suivi des demandes via votre système

Suivez les demandes au fur et à mesure qu’elles sont traitées dans les composants du service afin que les équipes produits puissent plus facilement analyser et résoudre les problèmes et améliorer les performances.

Résultat escompté : les charges de travail dotées d'un suivi complet de tous les composants sont faciles à déboguer, ce qui améliore le temps moyen de résolution (MTTR) des erreurs et la latence en simplifiant la découverte des causes premières. End-to-endle suivi réduit le temps nécessaire pour découvrir les composants concernés et analyser en détail les causes profondes des erreurs ou des temps de latence.

Anti-modèles courants :

Le traçage est utilisé pour certains composants, mais pas pour tous. Par exemple, sans suivi, les AWS Lambdaéquipes risquent de ne pas comprendre clairement la latence causée par les démarrages à froid dans le cadre d'une charge de travail exigeante.
Les canaris synthétiques ou la surveillance par utilisateur réel (RUM) ne sont pas configurés avec le traçage. Sans canarisRUM, la télémétrie des interactions avec le client est omise de l'analyse des traces, ce qui donne un profil de performance incomplet.
Les charges de travail hybrides incluent à la fois des outils de suivi natifs du cloud et des outils tiers, mais aucune mesure n’a été prise pour intégrer pleinement une solution de traçage unique. Sur la base de la solution de suivi choisie, le suivi natif du cloud SDKs doit être utilisé pour instrumenter des composants qui ne sont pas natifs du cloud ou des outils tiers doivent être configurés pour ingérer la télémétrie de suivi native du cloud.

Avantages du respect de cette bonne pratique : lorsque les équipes de développement sont alertées de problèmes, elles peuvent obtenir une image complète des interactions entre les composants du système, y compris la corrélation composant par composant avec la journalisation, les performances et les défaillances. Dans la mesure où le traçage permet d’identifier visuellement les causes profondes, vous passez moins de temps à les étudier. Les équipes qui comprennent en détail les interactions entre les composants prennent de meilleures décisions plus rapidement lors de la résolution des problèmes. L’analyse des traces des systèmes permet d’améliorer la prise de décisions, par exemple quand il convient d’invoquer le basculement de reprise après sinistre (DR) ou de choisir le meilleur endroit pour mettre en œuvre des stratégies d’autoréparation, ce qui permet d’améliorer la satisfaction des clients envers vos services.

Niveau d’exposition au risque si cette bonne pratique n’est pas respectée : moyen

Directives d’implémentation

Les équipes qui exploitent des applications distribuées peuvent utiliser des outils de traçage pour établir un identifiant de corrélation, collecter des traces de demandes et créer des cartes de service pour les composants connectés. Tous les composants de l’application doivent être inclus dans les traces des demandes, notamment les clients de service, les passerelles d’intergiciels et les bus d’événements, les composants de calcul et le stockage, y compris les magasins de clés-valeurs et les bases de données. Intégrez des canaris synthétiques et une surveillance des utilisateurs réels dans votre configuration de end-to-end suivi afin de mesurer les interactions avec les clients distants et la latence afin d'évaluer avec précision les performances de vos systèmes par rapport à vos accords de niveau de service et à vos objectifs.

Vous pouvez utiliser AWS X-Rayles services d'instrumentation Amazon CloudWatch Application Monitoring pour fournir une vue complète des demandes au fur et à mesure qu'elles transitent par votre application. X-Ray collecte la télémétrie des applications et vous permet de la visualiser et de la filtrer en fonction des charges utiles, des fonctions, des traces, des servicesAPIs, et peut être activée pour les composants du système sans code ou à faible code. CloudWatch la surveillance des applications inclut ServiceLens l'intégration de vos traces aux métriques, aux journaux et aux alarmes. CloudWatch la surveillance des applications inclut également des produits synthétiques pour surveiller vos terminauxAPIs, ainsi que la surveillance des utilisateurs réels pour instrumenter vos clients d'applications Web.

Étapes d’implémentation

AWS X-Ray À utiliser sur tous les services natifs pris en charge tels qu'Amazon S3 et Amazon API Gateway. AWS Lambda Ces AWS services permettent à X-Ray de changer de configuration en utilisant l'infrastructure sous forme de code AWS SDKs, ou le. AWS Management Console
Applications instrumentales AWS Distro pour Open Telemetry et X-Ray ou agents de collecte tiers.
Consultez le Guide du développeur AWS X-Ray pour une implémentation spécifique au langage de programmation. Ces sections de documentation expliquent comment instrumenter les HTTP demandes, SQL les requêtes et les autres processus spécifiques à votre langage de programmation d'applications.
Utilisez le suivi X-Ray pour Amazon CloudWatch Synthetic Canaries et Amazon CloudWatch RUM afin d'analyser le chemin des demandes de votre client utilisateur final via votre AWS infrastructure en aval.
Configurez CloudWatch les métriques et les alarmes en fonction de l'état des ressources et de la télémétrie Canary afin que les équipes soient rapidement alertées des problèmes, puis puissent étudier en profondeur les traces et les cartes des services avec. ServiceLens
Activez l’intégration de X-Ray pour les outils de suivi tiers tels que Datadog, New Relic ou Dynatrace si vous utilisez des outils tiers pour votre solution de suivi principale.

Ressources

Bonnes pratiques associées :

Documents connexes :

Exemples connexes :

Un atelier sur l’observabilité

Vidéos connexes :

Outils associés :

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

REL06-BP06 Réaliser des révisions régulièrement

Concevoir votre charge de travail de sorte qu’elle s’adapte aux changements de demande