Politiques Auto Scaling - Amazon ElastiCache

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Politiques Auto Scaling

Une politique de mise à l'échelle comporte les éléments suivants :

  • Une métrique cible : métrique utilisée par Valkey et Redis OSS Auto Scaling ElastiCache pour déterminer quand et dans quelle CloudWatch mesure il convient de procéder à une mise à l'échelle.

  • Capacités maximale et minimale – Le nombre minimal et maximal de partitions ou de réplicas à utiliser pour la mise à l'échelle.

    Important

    Lors de la création d'une politique de dimensionnement automatique, si la capacité actuelle est supérieure à la capacité maximale configurée, nous le faisons MaxCapacity lors scaleIn de la création de la politique. De même, si la capacité actuelle est inférieure à la capacité minimale configurée, nous scaleOut passons au MinCapacity.

  • Un temps de stabilisation – La durée, en secondes, entre la fin d'une activité de mise à l'échelle horizontale montante ou descendante et le début d'une autre activité de mise à l'échelle horizontale.

  • Un rôle lié à un service : un rôle AWS Identity and Access Management (IAM) lié à un service spécifique AWS . Un rôle lié à un service inclut toutes les autorisations dont le service a besoin pour appeler d'autres AWS services en votre nom. ElastiCache Auto Scaling génère automatiquement ce AWSServiceRoleForApplicationAutoScaling_ElastiCacheRG rôle pour vous.

  • Activer ou désactiver les activités de dimensionnement en charge – Capacité d'activer ou désactiver les activités de dimensionnement en charge pour une politique.

Métrique cible pour Auto Scaling

Dans ce type de stratégie, une métrique prédéfinie ou personnalisée et une valeur cible pour la métrique sont spécifiées dans une configuration de politique de dimensionnement du suivi des cibles. ElastiCache for Valkey et Redis OSS Auto Scaling crée et gère les CloudWatch alarmes qui déclenchent la politique de dimensionnement et calcule l'ajustement de mise à l'échelle en fonction de la métrique et de la valeur cible. La politique de dimensionnement ajoute ou supprime shards/replicas as required to keep the metric at, or close to, the specified target value. In addition to keeping the metric close to the target value, a target-tracking scaling policy also adjusts to fluctuations in the metric due to a changing workload. Such a policy also minimizes rapid fluctuations in the number of available shards/replicas pour votre cluster.

Par exemple, examinons une politique de mise à l'échelle qui utilise la métrique prédéfinie d'utilisation moyenne de ElastiCachePrimaryEngineCPUUtilization. Une telle politique peut maintenir le CPU taux d'utilisation à un pourcentage d'utilisation spécifié ou proche de celui-ci, tel que 70 %.

Note

Pour chaque cluster, vous ne pouvez créer qu'une seule politique Auto Scaling pour chaque métrique cible.

Capacité minimale et maximale

Partitions

Vous pouvez spécifier le nombre maximum de partitions pouvant être redimensionnées ElastiCache pour le dimensionnement automatique de Valkey et Redis. OSS Cette valeur doit être comprise entre 1 et 250, inclus. Vous pouvez également spécifier le nombre minimum de partitions à gérer par le biais de la mise à l'échelle automatique. Cette valeur doit être au moins égale à 1, et égale ou inférieure à la valeur spécifiée pour le maximum de partitions, soit 250.

Réplicas

Vous pouvez spécifier le nombre maximum de répliques à gérer ElastiCache pour le dimensionnement OSS automatique de Valkey et Redis. Cette valeur doit être inférieure ou égale à 5. Vous pouvez également spécifier le nombre minimum de répliques à gérer par le biais de l'autoscaling. Cette valeur doit être au moins égale à 1, et égale ou inférieure à la valeur spécifiée pour le maximum de réplicas, soit 5.

Pour déterminer le nombre minimal et le nombre maximal de partitions/réplicas dont vous avez besoin pour un trafic classique, testez votre configuration de Auto Scaling avec le débit attendu de trafic pour votre modèle.

Note

ElastiCache les politiques de dimensionnement automatique augmentent la capacité du cluster jusqu'à ce qu'il atteigne la taille maximale que vous avez définie ou jusqu'à ce que des limites de service s'appliquent. Pour demander une augmentation de cette limite, veuillez consulter AWS Service Limits et sélectionnez le type de limite Nœuds par cluster par type d'instance.

Important

Dimensionnement en l'absence de trafic. Si le trafic d'une variante devient nul, il est ElastiCache automatiquement ajusté au nombre minimum d'instances spécifié.

Temps de stabilisation

Vous pouvez affiner la réactivité d'une politique de suivi de cible et d'échelonnement en ajoutant des temps de stabilisation qui affectent le dimensionnement de votre cluster. Un temps de stabilisation bloque les demandes de montée ou de diminution en charge ultérieures jusqu'à l'expiration de la période. Cela ralentit les suppressions de shards/replicas in your ElastiCache for Valkey and Redis OSS cluster for scale-in requests, and the creation of shards/replicas demandes de scale-out. Vous pouvez spécifier les temps de stabilisation suivants :

  • Une activité de scale-in réduit le nombre de partitions/répliques dans votre cluster. Un temps de stabilisation de diminution en charge spécifie la durée, en secondes, devant s'écouler entre la fin d'une activité de diminution et le début d'une autre.

  • Une activité de scale-out augmente le nombre de partitions/répliques dans votre cluster. Un temps de stabilisation de montée en charge spécifie la durée, en secondes, devant s'écouler entre la fin d'une activité de montée en charge et le début d'une autre.

Lorsqu'aucun temps de stabilisation de diminution ou de montée en charge n'est pas spécifié, la valeur par défaut est 600 secondes pour l'augmentation et de 900 secondes pour la diminution.

Activation ou désactivation d'activités de diminution en charge

Vous pouvez activer ou désactiver des activités de diminution en charge pour une politique. L'activation des activités d'extension permet de supprimer la politique de dimensionnement. shards/replicas. When scale-in activities are enabled, the scale-in cooldown period in the scaling policy applies to scale-in activities. Disabling scale-in activities prevents the scaling policy from deleting shards/replicas

Note

Les activités de scale-out sont toujours activées afin que la politique de dimensionnement puisse créer des ElastiCache partitions ou des répliques selon les besoins.