COST09-BP02 Implémenter un tampon ou un accélérateur pour gérer la demande - Cost Optimization Pillar

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

COST09-BP02 Implémenter un tampon ou un accélérateur pour gérer la demande

La mise en mémoire tampon et la limitation modifient la charge de travail en atténuant les pics éventuels. Mettez en œuvre une limitation lorsque vos clients effectuent de nouveaux essais. Mettez en œuvre une mémoire tampon pour stocker la demande et reporter le traitement. Veillez à ce que vos limitations et mémoires tampons soient conçues de manière à ce que les clients reçoivent une réponse dans les délais requis.

Niveau d’exposition au risque si cette bonne pratique n’est pas respectée : moyen

Directives d’implémentation

Dans le cloud computing, la mise en place d’une réserve ou d’une limitation est cruciale pour gérer la demande et réduire la capacité allouée requise pour votre charge de travail. Pour des performances optimales, il est essentiel d’évaluer la demande totale, y compris les pics, le taux de variation des demandes et le temps de réponse nécessaire. Lorsque les clients ont la possibilité de renvoyer leurs demandes, il devient pratique d’appliquer la limitation. À l’inverse, pour les clients qui ne disposent pas de fonctionnalités de nouvelle tentative, l’approche idéale consiste à mettre en œuvre une mémoire tampon. Ces mémoires tampons rationalisent l’afflux de demandes et optimisent l’interaction des applications avec des vitesses opérationnelles variées.

Courbe de demande avec deux pics distincts nécessitant une capacité allouée élevée

Courbe de demande avec deux pics distincts nécessitant une capacité allouée élevée

Prenons l’exemple d’une charge de travail dont la courbe de demande est représentée dans l’image précédente. Cette charge de travail a deux pics, et pour gérer ces pics, la capacité des ressources comme indiqué par la ligne orange est allouée. Les ressources et l’énergie utilisées pour cette charge de travail ne sont pas indiquées par la zone sous la courbe de la demande, mais par la zone sous la ligne de la capacité allouée, car cette dernière est nécessaire pour gérer ces deux pics. L’aplatissement de la courbe de demande de la charge de travail peut vous aider à réduire la capacité allouée pour une charge de travail et à réduire son impact environnemental. Pour atténuer le pic, envisagez de mettre en œuvre une limitation ou une mise en mémoire tampon.

Pour mieux les comprendre, examinons les notions de limitation et de mise en mémoire tampon.

Limitation : si la source de la demande a la capacité de réessayer, alors vous pouvez mettre en place une limitation. La limitation indique à la source qu’elle doit réessayer ultérieurement si elle ne peut répondre à la demande actuellement. La source attend un certain temps, puis relance la demande. L’implémentation de la limitation a l’avantage de limiter la quantité maximale de ressources et les coûts maximaux de la charge de travail. Dans AWS, vous pouvez utiliser Amazon API Gateway pour implémenter la régulation.

Basée sur la mémoire tampon : une approche basée sur la mémoire tampon utilise des producteurs (composants qui envoient des messages à la file d’attente), des consommateurs (composants qui reçoivent des messages de la file d’attente) et une file d’attente (qui contient les messages) pour stocker les messages. Les messages sont lus par les consommateurs et traités, ce qui permet aux messages de fonctionner au rythme qui répond aux besoins commerciaux des consommateurs. À l’aide d’une mémoire tampon, les messages des producteurs sont hébergés dans des files d’attente ou des flux, prêts à être consultés par les consommateurs en fonction de leurs besoins opérationnels.

Dans AWS, vous pouvez choisir parmi plusieurs services pour implémenter une approche de mise en mémoire tampon. Amazon Simple Queue Service (AmazonSQS) est un service géré qui fournit des files d'attente permettant à un seul consommateur de lire des messages individuels. Amazon Kinesis fournit un flux de données qui permet à de nombreux consommateurs de lire les mêmes messages.

La mise en mémoire tampon et la limitation peuvent atténuer les pics éventuels en modifiant la sollicitation de votre charge de travail. Utilisez la limitation lorsque les clients retentent des actions, et la mise en mémoire tampon pour conserver la demande et la traiter ultérieurement. Si vous utilisez une mise en mémoire tampon, créez votre charge de travail de manière à ce qu’elle réponde à la demande dans les délais requis et assurez-vous que vous êtes en mesure de traiter les demandes de travail en double. Analysez la demande globale, le taux de variation et le temps de réponse requis pour dimensionner correctement la limitation ou le tampon nécessaire.

Étapes d’implémentation

  • Analyse des demandes des clients : analysez les demandes des clients afin de déterminer s’ils sont capables d’effectuer de nouveaux essais. Pour les clients qui ne peuvent pas effectuer de nouveaux essais, des mémoires tampon doivent être mises en œuvre. Analysez la demande globale, le taux de variation et le temps de réponse requis pour déterminer la taille de limitation ou de mémoire tampon nécessaire.

  • Implémentation d’une mémoire tampon ou d’une limitation : implémentez une mémoire tampon ou une limitation dans la charge de travail. Une file d'attente telle qu'Amazon Simple Queue Service (AmazonSQS) peut fournir une mémoire tampon aux composants de votre charge de travail. Amazon API Gateway peut fournir une régulation pour les composants de votre charge de travail.

Ressources

Bonnes pratiques associées :

Documents connexes :

Vidéos connexes :

Exemples connexes :