Service Quotas d'Amazon Managed Service for Prometheus - Amazon Managed Service for Prometheus

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Service Quotas d'Amazon Managed Service for Prometheus

Les deux sections suivantes décrivent les quotas et limites associés à Amazon Managed Service for Prometheus.

Quotas de service

Amazon Managed Service for Prometheus comporte les quotas suivants. Amazon Managed Service for Prometheus fournit des statistiques d'utilisation pour surveiller l'CloudWatch utilisation des ressources de Prometheus. À l'aide de la fonction d'alarme des métriques d' CloudWatch utilisation, vous pouvez surveiller les ressources et l'utilisation de Prometheus afin d'éviter les erreurs de limite.

À mesure que vos projets et espaces de travail se développent, les quotas les plus courants que vous devrez peut-être surveiller ou pour lesquels vous devrez demander une augmentation sont les suivants : séries actives par espace de travail, taux d'ingestion par espace de travail et taille de rafale d'ingestion par espace de travail.

Vous pouvez demander une augmentation pour tous les quotas ajustables en sélectionnant le lien dans la colonne Ajustable ou en demandant une augmentation de quota.

La limite de séries actives par espace de travail s'applique dynamiquement. Pour de plus amples informations, veuillez consulter Série active par défaut. Le taux d'ingestion par espace de travail et la taille de la rafale d'ingestion par espace de travail contrôlent ensemble la rapidité avec laquelle vous pouvez ingérer des données dans votre espace de travail. Pour plus d’informations, consultez Régulation de l'ingestion.

Note

Sauf indication contraire, ces quotas s'entendent par espace de travail.

Nom Par défaut Ajustable Description
Métriques actives avec métadonnées par espace de travail Chaque région prise en charge : 20 000 Non Nombre de métriques actives uniques avec métadonnées par espace de travail.
Séries actives par espace de travail Chaque région prise en charge : 10 000 000 par 2 heures Oui Nombre de séries actives uniques par espace de travail. Une série est active si un échantillon a été signalé au cours des 2 dernières heures. La capacité de 2 à 10 milliards est automatiquement ajustée en fonction des 30 dernières minutes d'utilisation.
Taille du groupe d'agrégation d'alertes dans le fichier de définition du gestionnaire d'alertes Chaque Région prise en charge : 1 000 Oui Taille maximale d'un groupe d'agrégation d'alertes dans le fichier de définition du gestionnaire d'alertes. Chaque combinaison de valeurs d'étiquette group_by crée un groupe d'agrégation.
Taille du fichier de définition du gestionnaire d'alertes Chaque Région prise en charge : 1 mégaoctet Non Taille maximale du fichier de définition d'un gestionnaire d'alertes.
Taille de la charge utile des alertes dans Alert Manager Chaque région prise en charge : 20 Mo Non La taille maximale de la charge utile de toutes les alertes Alert Manager par espace de travail. La taille de l'alerte dépend des étiquettes et des annotations.
Alertes dans le gestionnaire d'alertes Chaque Région prise en charge : 1 000 Oui Nombre maximal d'alertes Alert Manager simultanées par espace de travail.
Clusters de suivi de la haute disponibilité Chaque région prise en charge : 500 Non Nombre maximal de clusters que le dispositif de suivi de la haute disponibilité suivra pour les échantillons ingérés par espace de travail.
Taille de la rafale d'ingestion par espace de travail Chaque région prise en charge : 1 000 000 Oui Nombre maximal d'échantillons pouvant être ingérés par espace de travail en une rafale par seconde.
Taux d'ingestion par espace de travail Chaque région prise en charge : 170 000 Oui Taux d'ingestion d'échantillons de métriques par espace de travail et par seconde.
Règles d'inhibition dans le fichier de définition du gestionnaire d'alertes Chaque Région prise en charge : 100 Oui Nombre maximal de règles d'inhibition dans le fichier de définition du gestionnaire d'alertes.
Taille de l'étiquette Chaque région prise en charge : 7 Ko Non Taille combinée maximale de toutes les étiquettes et valeurs d'étiquette acceptées pour une série.
Étiquettes par série de métriques Chaque région prise en charge : 70 Oui Nombre d'étiquettes par série de métriques.
Longueur des métadonnées Chaque région prise en charge : 1 Ko Non Longueur maximale acceptée pour les métadonnées de métriques. Les métadonnées font référence au nom de la métrique, à HELP et à UNIT.
Métadonnées par métrique Chaque région prise en charge : 10 Non Nombre de métadonnées par métrique.
Nœuds dans l'arborescence de routage du gestionnaire d'alertes Chaque Région prise en charge : 100 Oui Nombre maximal de nœuds dans l'arborescence de routage du gestionnaire d'alertes.
Nombre d'opérations d'API en transactions par seconde Par région prise en charge : 10 Oui Nombre maximal d'opérations d'API par seconde et par région. Cela inclut les API CRUD d'espace de travail, les API de balisage, les API CRUD d'espace de noms de groupes de règles et les API CRUD de définition de gestionnaire d'alertes.
Octets de requête pour les requêtes instantanées Chaque Région prise en charge : 5 giga-octets Non Nombre maximal d'octets pouvant être scannés par une seule requête instantanée.
Octets de requête pour les requêtes de plage Chaque Région prise en charge : 5 giga-octets Non Nombre maximal d'octets pouvant être analysés par intervalle de 24 heures dans une seule requête de plage.
Blocs de requête récupérés Chaque région prise en charge : 20 000 000 Non Nombre maximal de blocs pouvant être analysés au cours d'une seule requête.
Exemples de requête Chaque région prise en charge : 50 000 000 Non Nombre maximal d'échantillons pouvant être analysés au cours d'une seule requête.
Série de requêtes récupérée Chaque région prise en charge : 12 000 000 Non Nombre maximal de séries pouvant être analysées au cours d'une seule requête.
Plage de temps de requête en jours Chaque région prise en charge : 32 Non Plage de temps maximale de toute requête ProMQL.
Taille des demandes Chaque Région prise en charge : 1 mégaoctet Non Taille maximale d'une demande pour l'ingestion ou la requête.
Durée de conservation des données ingérées en jours Chaque région prise en charge : 150 Oui Nombre de jours de conservation des données dans un espace de travail. Les données plus anciennes sont supprimées. Vous pouvez demander des modifications de quota pour augmenter ou diminuer cette valeur.
Intervalle d'évaluation des règles Chaque région prise en charge : 30 secondes Oui Intervalle minimal d'évaluation des règles d'un groupe de règles par espace de travail.
Taille du fichier de définition de l'espace de noms de groupes de règles Chaque Région prise en charge : 1 mégaoctet Non Taille maximale d'un fichier de définition d'espace de noms de groupes de règles.
Règles par espace de travail Chaque région prise en charge : 2 000 Oui Nombre maximal de règles par espace de travail.
Modèles dans le fichier de définition du gestionnaire d'alertes Chaque Région prise en charge : 100 Oui Nombre maximal de modèles dans le fichier de définition du gestionnaire d'alertes.
Espaces de travail par région et par compte Chaque région prise en charge : 25 Oui Nombre maximal d'espaces de travail par région.

Série active par défaut

Amazon Managed Service for Prometheus vous permet d'utiliser par défaut jusqu'à votre quota de séries temporelles actives.

Les espaces de travail Amazon Managed Service for Prometheus s'adaptent automatiquement à votre volume d'ingestion. À mesure que votre utilisation augmente, Amazon Managed Service for Prometheus augmente automatiquement la capacité de vos séries temporelles afin de doubler votre utilisation de base, jusqu'au quota par défaut. Par exemple, si votre série temporelle active moyenne au cours des 30 dernières minutes est de 3,5 millions, vous pouvez utiliser jusqu'à 7 millions de séries temporelles sans limitation.

Si vous avez besoin de plus du double de votre niveau de référence précédent, Amazon Managed Service for Prometheus alloue automatiquement une plus grande capacité à mesure que votre volume d'ingestion augmente, afin de garantir que votre charge de travail ne soit pas limitée de manière prolongée, dans les limites de votre quota. Cette limitation peut cependant se produire si vous dépassez le double de votre niveau de référence précédent au cours des 30 dernières minutes. Pour éviter toute limitation, Amazon Managed Service for Prometheus recommande d'augmenter progressivement l'ingestion lorsque vous augmentez de plus du double votre série temporelle active précédente.

Note

La capacité minimale des séries temporelles actives est de 2 millions, il n'y a pas de limitation lorsque vous avez moins de 2 millions de séries.

Pour dépasser votre quota par défaut, vous pouvez demander une augmentation de quota.

Régulation de l'ingestion

Amazon Managed Service for Prometheus limite l'ingestion pour chaque espace de travail, en fonction de vos limites actuelles. Cela permet de maintenir les performances de l'espace de travail. Si vous dépassez la limite, vous le verrez DiscardedSamples dans CloudWatch les statistiques (avec la rate_limited raison). Vous pouvez utiliser Amazon CloudWatch pour surveiller votre ingestion et créer une alarme afin de vous avertir lorsque vous êtes sur le point d'atteindre les limites de limitation. Pour de plus amples informations, veuillez consulter CloudWatch métriques.

Amazon Managed Service for Prometheus utilise l'algorithme Token Bucket pour implémenter la régulation de l'ingestion. Avec cet algorithme, votre compte dispose d'un compartiment contenant un nombre spécifique de jetons. Le nombre de jetons contenus dans le bucket représente votre limite d'ingestion à chaque seconde.

Chaque échantillon de données ingéré supprime un jeton du compartiment. Si la taille de votre bucket (taille de rafale d'ingestion par espace de travail) est de 1 000 000, votre espace de travail peut ingérer un million d'échantillons de données en une seconde. S'il dépasse un million d'échantillons à ingérer, il sera limité et aucun autre enregistrement ne sera ingéré. Les échantillons de données supplémentaires seront supprimés.

Le seau se recharge automatiquement à un débit défini. Si le compartiment est inférieur à sa capacité maximale, un nombre défini de jetons y est ajouté chaque seconde jusqu'à ce qu'il atteigne sa capacité maximale. Si le seau est plein à l'arrivée des jetons de recharge, ils sont jetés. Le bucket ne peut pas contenir plus de jetons que son maximum. Le taux de recharge pour l'ingestion des échantillons est défini par la limite du taux d'ingestion par espace de travail. Si votre taux d'ingestion par espace de travail est fixé à 170 000, le taux de recharge du bucket est de 170 000 jetons par seconde.

Si votre espace de travail ingère 1 000 000 d'échantillons de données par seconde, votre bucket est immédiatement réduit à zéro jeton. Le seau est ensuite rempli de 170 000 jetons par seconde, jusqu'à ce qu'il atteigne sa capacité maximale de 1 000 000 de jetons. S'il n'y a plus d'ingestion, le seau précédemment vide retrouvera sa capacité maximale en 6 secondes.

Note

L'ingestion se produit dans le cadre de demandes groupées. Si vous avez 100 jetons disponibles et que vous envoyez une demande contenant 101 échantillons, l'ensemble de la demande est rejetée. Amazon Managed Service for Prometheus n'accepte pas partiellement les demandes. Si vous rédigez un collecteur, vous pouvez gérer les nouvelles tentatives (avec des lots plus petits ou après un certain temps écoulé).

Il n'est pas nécessaire d'attendre que le compartiment soit plein pour que votre espace de travail puisse ingérer d'autres échantillons de données. Vous pouvez utiliser des jetons au fur et à mesure qu'ils sont ajoutés au bucket. Si vous utilisez immédiatement les jetons de recharge, le seau n'atteint pas sa capacité maximale. Par exemple, si vous épuisez le compartiment, vous pouvez continuer à ingérer 170 000 échantillons de données par seconde. Le seau ne peut être rempli à sa capacité maximale que si vous ingérez moins de 170 000 échantillons de données par seconde.

Limites supplémentaires relatives aux données ingérées

Amazon Managed Service for Prometheus impose également les exigences supplémentaires suivantes pour les données ingérées dans l'espace de travail. Ces exigences ne sont pas ajustables.

  • L'ingestion d'échantillons de métriques datant de plus d'une heure est refusée.

  • Chaque échantillon et chaque métadonnée doivent avoir un nom de métrique.