Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Cadre d’analyse de résilience
John Formento, Bruno Emer, Steven Hooper, Jason Barto et Michael Haken, Amazon Web Services ()AWS
Septembre 2023 (historique du document)
Des normes et des processus cohérents et reproductibles jouent un rôle important dans l'amélioration continue. Cela vaut également pour la résilience des systèmes distribués. L'objectif de ce guide est de présenter un cadre d'analyse de résilience qui fournit un moyen cohérent d'analyser les modes de défaillance et leur impact potentiel sur vos charges de travail. L'utilisation de ce cadre tout au long du cycle de vie de votre charge de travail, de la conception à l'exploitation, vous permet d'améliorer en permanence la résilience de vos charges de travail face à un plus large éventail de modes de défaillance potentiels de manière cohérente et reproductible. Cela permet de garantir que vous atteignez vos objectifs de résilience et que vous conservez les propriétés de résilience souhaitées pour vos charges de travail.
Ce framework a été développé grâce à l'expérience des équipes de terrain chargées de l'architecture des solutions AWS dans le cadre de leur travail avec des clients de tous les secteurs. Il cible les constructeurs qui peuvent avoir de nombreux titres de poste, notamment les chefs de produit, les développeurs de logiciels, les ingénieurs systèmes, les équipes opérationnelles et les architectes. Ce sont les personnes qui connaissent le mieux le système, le service ou le produit analysé. L'utilisation du cadre dans le cadre d'exercices continus peut vous aider à réaliser des progrès progressifs et à atteindre vos objectifs de résilience à long terme.
L'objectif du cadre est d'identifier les modes de défaillance potentiels et les contrôles préventifs et correctifs que vous pouvez utiliser pour atténuer leur impact. Même si les défaillances se produisent dans des composants qui ne sont pas directement sous votre contrôle, comme l'augmentation des taux d'erreur dans une dépendance, vous devez réfléchir à l'impact que ces défaillances peuvent avoir sur votre charge de travail et à la manière de concevoir cette charge de travail pour répondre à ces défaillances. En fin de compte, vous devez vous concentrer sur les défaillances auxquelles vous pouvez répondre en utilisant des mesures d'atténuation que vous pouvez contrôler.
Ce guide décrit le cadre, puis explique comment identifier et documenter une charge de travail, comment appliquer le cadre à cette charge de travail et comment évaluer les stratégies d'atténuation pour les défaillances potentielles que vous trouvez.
Table des matières