As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
As duas seções a seguir descrevem as cotas e os limites associados ao Amazon Managed Service for Prometheus.
Cotas de serviço
O Amazon Managed Service for Prometheus tem as cotas a seguir. O Amazon Managed Service for Prometheus vende métricas de uso para monitorar o CloudWatch uso dos recursos do Prometheus. Usando o recurso de alarme de métricas de CloudWatch uso, você pode monitorar os recursos e o uso do Prometheus para evitar erros de limite.
À medida que seus projetos e espaços de trabalho crescem, as cotas mais comuns que você pode precisar monitorar ou solicitar um aumento são: séries ativas por espaço de trabalho, taxa de ingestão por espaço de trabalho e tamanho de intermitência de ingestão por espaço de trabalho.
Para todas as cotas ajustáveis, você pode solicitar um aumento de cota selecionando o link na coluna Ajustável ou solicitando um aumento de cota
O limite da série ativa por espaço de trabalho é aplicado dinamicamente. Para obter mais informações, consulte Série ativa padrão. Juntos, a taxa de ingestão por espaço de trabalho e o tamanho da intermitência de ingestão por espaço de trabalho controlam a rapidez com que você pode ingerir dados em seu espaço de trabalho. Para obter mais informações, consulte Controle de utilização da ingestão.
nota
Salvo indicação em contrário, essas cotas são por espaço de trabalho.
Name | Padrão | Ajustável | Descrição |
---|---|---|---|
Métricas ativas com metadados por espaço de trabalho | Cada região com suporte: 20.000 | Não | O número de métricas ativas exclusivas com metadados por espaço de trabalho. Observação: se o limite for atingido, a amostra da métrica será registrada, mas os metadados acima do limite serão descartados. |
Série ativa por espaço de trabalho | Cada região com suporte: 10.000.000 por 2 horas | Sim |
O número de séries ativas exclusivas por espaço de trabalho. Uma série está ativa se uma amostra tiver sido relatada nas últimas 2 horas. A capacidade de 2M a 10M é ajustada automaticamente com base nos últimos 30 minutos de uso. |
Tamanho do grupo de agregação de alertas no arquivo de definição do gerenciador de alertas | Cada região com suporte: 1.000 | Sim |
Tamanho máximo do grupo de agregação de alertas no arquivo de definição do gerenciador de alertas. Cada combinação de valores de rótulo de group_by cria um grupo de agregação. |
Tamanho do arquivo de definição do gerenciador de alertas | Cada região com suporte: 1 megabyte | Não | Tamanho máximo de um arquivo de definição do gerenciador de alertas. |
Tamanho da carga útil do alerta no gerenciador de alertas | Cada região com suporte: 20 megabytes | Não | O tamanho máximo da carga útil do alerta de todos os alertas do gerenciador de alertas por espaço de trabalho. O tamanho do alerta depende dos rótulos e das anotações. |
Alertas no gerenciador de alertas | Cada região com suporte: 1.000 | Sim |
O número máximo de alertas simultâneos do gerenciador de alertas por espaço de trabalho. |
Clusters de rastreadores HA | Cada região com suporte: 500 | Não | O número máximo de clusters que o rastreador HA rastreará para amostras ingeridas por espaço de trabalho. |
Tamanho do pico de ingestão por espaço de trabalho | Cada região com suporte: 1.000.000 | Sim |
O número máximo de amostras que poderiam ser ingeridas por espaço de trabalho em uma sequência por segundo. |
Taxa de ingestão por espaço de trabalho | Cada região com suporte: 170.000 | Sim |
Taxa métrica de ingestão de amostras por espaço de trabalho por segundo. |
Regras de inibição no arquivo de definição do gerenciador de alertas | Cada região com suporte: 100 | Sim |
Número máximo de regras de inibição no arquivo de definição do gerenciador de alertas. |
Tamanho do label | Cada região com suporte: 7 kilobytes | Não | O tamanho máximo combinado de todos os rótulos e valores de rótulos aceitos para uma série. |
Rótulos por série métrica | Cada região com suporte: 70 | Sim |
Número de rótulos por série métrica. |
Tamanho dos metadados | Cada região com suporte: 1 kilobyte | Não | O tamanho máximo aceito para metadados métricos. Os metadados são referentes a nome da métrica, tipo, unidade e texto de ajuda. |
Metadados por métrica | Cada região com suporte: 10 | Não | O número de metadados por métrica. |
Nós na árvore de roteamento do gerenciador de alertas | Cada região com suporte: 100 | Sim |
O número máximo de nós na árvore de roteamento do gerenciador de alertas. |
Número de operações de API por região em transações por segundo | Cada região com suporte: 10 | Sim |
O número máximo de operações da API que é possível fazer por segundo por região. Isso inclui CRUD do espaço de trabalho APIs, marcação APIs, espaço de nomes CRUD de grupos de regras e CRUD APIs de definição do gerenciador de alertas. APIs |
Número GetLabels e operações GetSeries de GetMetricMetadata API por espaço de trabalho em transações por segundo | Cada região com suporte: 10 | Não | O número máximo de operações de GetSeries API GetMetricMetadata compatíveis com o Prometheus por segundo por espaço de trabalho. GetLabels |
Número de operações de QueryMetrics API por espaço de trabalho em transações por segundo | Cada região com suporte: 300 | Não | O número máximo de operações de API QueryMetrics compatíveis com o Prometheus por segundo por espaço de trabalho. |
Número de operações de RemoteWrite API por espaço de trabalho em transações por segundo | Cada região com suporte: 3.000 | Não | O número máximo de operações de API RemoteWrite compatíveis com o Prometheus por segundo por espaço de trabalho. |
O número de outras operações de API compatíveis com o Prometheus por espaço de trabalho em transações por segundo | Cada região compatível: 100 | Não | O número máximo de operações de API por segundo por espaço de trabalho para todos os outros compatíveis com o Prometheus APIs , incluindo, ListAlerts etc. ListRules |
Bytes de consulta para consultas instantâneas | Cada região com suporte: 5 gigabytes | Não | 750 MB podem ser verificados por uma única consulta instantânea. |
Bytes de consulta para consultas de intervalo | Cada região compatível: 5 gigabytes | Não | O máximo de bytes que podem ser verificados por intervalo de 24 horas em uma única consulta de intervalo. |
Blocos de consulta obtidos | Cada região com suporte: 20.000.000 | Não | O número máximo de blocos que podem ser escaneados durante uma única consulta. |
Consultas de exemplo | Cada região com suporte: 50.000.000 | Não | O número máximo de blocos que podem ser escaneados durante uma única consulta. |
Série de consultas obtida | Cada região com suporte: 12.000.000 | Não | O número máximo de séries que podem ser escaneadas durante uma única consulta. |
Intervalo de tempo de consulta em dias | Cada região com suporte: 32 | Não | O intervalo máximo de tempo de QueryMetrics GetSeries, GetLabels APIs e. |
Dimensão da solicitação | Cada região com suporte: 1 megabyte | Não | O tamanho máximo da solicitação para ingestão ou consulta. |
Tempo de retenção dos dados ingeridos em dias | Cada região com suporte: 150 | Sim |
O número de dias que os dados em um espaço de trabalho são retidos. Dados mais antigos do que isso são excluídos. Você pode solicitar alterações na cota para aumentar ou diminuir esse valor. |
Intervalo de avaliação da regra | Cada região com suporte: 30 por segundo | Sim |
Intervalo mínimo de avaliação da regra. |
Tamanho do arquivo de definição do namespace do grupo de regras | Cada região com suporte: 1 megabyte | Não | O tamanho máximo de um arquivo de definição de namespace de grupo de regras. |
Regras por espaço de trabalho | Cada região com suporte: 2.000 | Sim |
O número máximo de regras por WorkSpace. |
Modelos no arquivo de definição do gerenciador de alertas | Cada região com suporte: 100 | Sim |
O número máximo de modelos no arquivo de definição do gerenciador de alertas. |
Espaços de trabalho por região por conta | Cada região com suporte: 25 | Sim |
O número máximo de tags por espaços de trabalho. |
Série ativa padrão
O Amazon Managed Service for Prometheus permite que você use até sua cota de séries temporais ativas por padrão.
Os espaços de trabalho do Amazon Managed Service for Prometheus se adaptam automaticamente ao seu volume de ingestão. À medida que seu uso aumenta, o Amazon Managed Service for Prometheus aumentará automaticamente sua capacidade de séries temporais para dobrar seu uso básico até a cota padrão. Por exemplo, se sua média de séries temporais ativas nos últimos 30 minutos for 3,5 milhões, você poderá usar até 7 milhões de séries temporais sem controle de utilização.
Se você precisar de mais que o dobro de sua linha de base anterior, o Amazon Managed Service for Prometheus aloca automaticamente mais capacidade enquanto seu volume de ingestão aumenta até sua cota, para ajudar a garantir que sua workload não passe por controle de utilização constante. No entanto, pode ocorrer controle de utilização se você exceder o dobro de seu pico anterior dentro de 30 minutos. Para evitar o controle de utilização, o Amazon Managed Service for Prometheus recomenda aumentar gradualmente a ingestão quando você quiser aumentar para mais do que o dobro da série temporal ativa anterior.
nota
A capacidade mínima para séries temporais ativas é de 2 milhões; não há controle de utilização quando você tem menos de 2 milhões de séries.
Para ir além de sua cota padrão, solicite um aumento de cota.
Controle de utilização da ingestão
O Amazon Managed Service for Prometheus tem controle de utilização da ingestão em cada espaço de trabalho, com base nos seus limites atuais. Isso ajuda a manter o desempenho dos espaços de trabalho. Se você exceder o limite, você verá DiscardedSamples
nas CloudWatch métricas (com o rate_limited
motivo). Você pode usar CloudWatch a Amazon para monitorar sua ingestão e criar um alarme para avisá-lo quando você estiver perto de atingir os limites de limitação. Para obter mais informações, consulte Use CloudWatch métricas para monitorar os recursos do Amazon Managed Service for Prometheus.
O Amazon Managed Service for Prometheus usa o algoritmo do bucket de tokens
Cada amostra de dados ingerida remove um token do bucket. Se o tamanho do seu bucket (tamanho da intermitência de ingestão por espaço de trabalho) for 1.000.000, seu espaço de trabalho poderá ingerir um milhão de amostras de dados por segundo. Se ele exceder um milhão de amostras para ingestão, o controle de utilização será aplicado e nenhum outro registro será ingerido. As amostras de dados adicionais serão descartadas.
O bucket será recarregado automaticamente a uma taxa definida. Se o bucket ficar abaixo da capacidade máxima, um determinado número de tokens será adicionado novamente a ele a cada segundo até atingir sua capacidade máxima. Se o bucket estiver cheio quando os tokens de recarga forem adicionados, eles serão descartados. O bucket não pode conter mais do que seu número máximo de tokens. A taxa de recarga para amostras de ingestão é definida pelo limite da taxa de ingestão por espaço de trabalho. Se sua taxa de ingestão por espaço de trabalho estiver definida como 170.000, a taxa de recarga do bucket será de 170.000 tokens por segundo.
Se seu espaço de trabalho ingerir 1.000.000 de amostras de dados por segundo, seu bucket será imediatamente reduzido para zero token. O bucket será então recarregado com 170.000 tokens a cada segundo até atingir sua capacidade máxima de 1.000.000 tokens. Se não houver mais ingestão, o bucket anteriormente vazio retornará à sua capacidade máxima em 6 segundos.
nota
A ingestão ocorre via solicitações em lote. Se você tiver 100 tokens disponíveis e enviar uma solicitação com 101 amostras, a solicitação inteira será rejeitada. O Amazon Managed Service for Prometheus não aceita solicitações parcialmente. Se você estiver gravando um coletor, poderá gerenciar novas tentativas (com lotes menores ou após algum tempo).
Para que o bucket possa ingerir mais amostras de dados, você não precisa esperar que o bucket esteja cheio. Você pode usar tokens à medida que eles são adicionados ao bucket. Se você usar imediatamente os tokens de recarga, o bucket não atingirá sua capacidade máxima. Por exemplo, se você esgotar o bucket, poderá continuar ingerindo 170.000 amostras de dados por segundo. O bucket poderá ser recarregado até a capacidade máxima somente se você ingerir menos de 170.000 amostras de dados por segundo.
Limites adicionais para dados ingeridos
O Amazon Managed Service for Prometheus também tem os seguintes requisitos adicionais para ingestão de dados no espaço de trabalho. Eles não são ajustáveis.
-
Amostras métricas com mais de 1 hora não podem ser ingeridas.
-
Cada amostra e metadado deve ter um nome de métrica.