PERF02-BP05 Mettre à l’échelle vos ressources de calcul de manière dynamique

Utilisez l’élasticité du cloud pour mettre à l’échelle vos ressources de calcul de manière dynamique afin de répondre à vos besoins et d’éviter de surprovisionner ou de sous-provisionner la capacité de votre charge de travail.

Anti-modèles courants :

Vous réagissez aux alertes en augmentant manuellement la capacité.
Vous utilisez les mêmes recommandations de dimensionnement (généralement, infrastructure statique) que sur site.
Vous conservez une capacité accrue après un événement de mise à l’échelle au lieu de la réduire.

Avantages liés au respect de cette bonne pratique : en configurant et en testant l’élasticité des ressources de calcul, vous pouvez économiser de l’argent, maintenir les points de référence des performances et améliorer la fiabilité en fonction de l’évolution du trafic.

Niveau d’exposition au risque si cette bonne pratique n’est pas respectée : élevé

Directives d’implémentation

AWS apporte la flexibilité nécessaire pour mettre à l’échelle vos ressources de manière dynamique grâce à divers mécanismes de mise à l’échelle afin de répondre à l’évolution de la demande. Combinée aux métriques liées au calcul, la mise à l’échelle dynamique permet aux charges de travail de réagir automatiquement aux changements et d’utiliser l’ensemble optimal de ressources de calcul pour atteindre son objectif.

Vous pouvez utiliser plusieurs approches pour rapprocher l’offre de ressources de la demande.

Approche de suivi des objectifs : surveillez votre métrique de capacité de mise à l’échelle et augmentez ou réduisez automatiquement votre capacité selon vos besoins.
Mise à l’échelle prédictive : mettez à l’échelle en prévision des tendances quotidiennes et hebdomadaires.
Approche basée sur le calendrier : définissez votre propre calendrier de mise à l’échelle en fonction de changements de charge prévisibles.
Mise à l’échelle des services : choisissez des services (sans serveur, par exemple) conçus pour se mettre à l’échelle automatiquement.

Vous devez vous assurer que les déploiements de charge de travail peuvent gérer les événements de mise à l’échelle ascendante et descendante.

Étapes d’implémentation

Les instances de calcul, les conteneurs et les fonctions fournissent des mécanismes d’élasticité, soit en combinaison avec l’autoscaling, soit en tant que fonctionnalité du service. Voici des exemples de mécanismes d’autoscaling :

Mécanisme d’autoscaling	Où utiliser
Amazon EC2 Auto Scaling	Permet de s’assurer que vous disposez du nombre adéquat d’instances Amazon EC2 pour gérer la charge de votre application.
Application Autoscaling	Pour mettre à l’échelle automatiquement les ressources pour des services AWS individuels au-delà d’Amazon EC2, tels que les fonctions AWS Lambda ou les services Amazon Elastic Container Service (Amazon ECS).
Outil Cluster Autoscaler/Karpenter de Kubernetes	Pour mettre à l’échelle automatiquement les clusters Kubernetes.

La mise à l’échelle est souvent abordée pour les services de calcul, tels que les instances Amazon EC2 ou les fonctions AWS Lambda. Assurez-vous également de prendre en compte la configuration des services non liés au calcul tels que AWS Glue pour répondre à la demande.
Vérifiez que les métriques de mise à l’échelle correspondent aux caractéristiques de la charge de travail en cours de déploiement. Si vous déployez une application de transcodage vidéo, une utilisation de 100 % du processeur est attendue. N’en faites pas votre métrique principale. Utilisez plutôt la profondeur de la file d’attente des tâches de transcodage. Le cas échéant, vous pouvez utiliser une métrique personnalisée pour votre politique de dimensionnement. Pour choisir les bonnes métriques, tenez compte des conseils suivants pour Amazon EC2 :
- La métrique doit être une métrique d’utilisation valide et décrire à quel point l’instance est occupée.
- La valeur de métrique doit augmenter ou diminuer en proportion du nombre d’instances présentes dans le groupe Auto Scaling.
Assurez-vous d’utiliser une mise à l’échelle dynamique plutôt qu’une mise à l’échelle manuelle pour votre groupe Auto Scaling. Nous vous recommandons également d’utiliser des politiques de dimensionnement pour le suivi des cibles dans votre dimensionnement dynamique.
Vérifiez que les déploiements de charges de travail peuvent gérer les deux événements de mise à l’échelle (augmentation et diminution des charges de travail). Par exemple, vous pouvez utiliser l’historique des activités pour vérifier une activité de mise à l’échelle dans un groupe Auto Scaling.
Évaluez votre charge de travail pour les modèles prédictifs et mettez-la à l’échelle de manière proactive pour anticiper les changements prévisibles et prévus de la demande. Avec la mise à l’échelle prédictive, vous pouvez supprimer le besoin de surprovisionner de la capacité. Pour en savoir plus, reportez-vous à Mise à l’échelle prédictive avec Amazon EC2 Auto Scaling.

Ressources

Documents connexes :

Vidéos connexes :

Exemples connexes :

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

PERF02-BP04 Configurer et dimensionner correctement les ressources de calcul

PERF02-BP06 Utiliser des accélérateurs de calcul matériels optimisés