Gestion des défaillances - Reliability Pillar

Gestion des défaillances

Des pannes finiront toujours par arriver : des routeurs aux disques durs, des systèmes d’exploitation aux unités de mémoire corrompant des paquets TCP, des erreurs transitoires aux pannes permanentes. C’est inéluctable, que vous utilisiez du matériel de la plus haute qualité ou les composants les moins chers - Werner Vogels, Directeur technique – Amazon.com

Les pannes des composants matériels de bas niveau doivent être traitées au quotidien dans un centre de données sur site. En revanche, dans le cloud, vous devriez être à l’abri de la plupart de ces types de défaillances. Par exemple, les volumes Amazon EBS sont placés dans une zone de disponibilité spécifique où ils sont automatiquement répliqués pour vous protéger de la défaillance d’un seul composant. Tous les volumes EBS sont conçus pour offrir une disponibilité de 99,999 %. Les objets Amazon S3 sont stockés dans au moins trois zones de disponibilité offrant une durabilité des objets de 99,999999999 % sur une année donnée. Quel que soit votre fournisseur de cloud, des défaillances peuvent avoir un impact sur votre charge de travail. Vous devez donc prendre des mesures pour mettre en œuvre la résilience si voulez que votre charge de travail soit fiable.

Pour appliquer les bonnes pratiques présentées ici, vous devez vous assurer que les personnes qui conçoivent, implémentent et exécutent vos charges de travail connaissent les objectifs commerciaux et de fiabilité requis pour y parvenir. Elles doivent maîtriser ces exigences de fiabilité et être formées pour y répondre.

Les sections suivantes expliquent les bonnes pratiques de gestion des pannes afin de prévenir tout impact sur votre charge de travail.