Service Quotas do Amazon Managed Service for Prometheus - Amazon Managed Service para Prometheus

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Service Quotas do Amazon Managed Service for Prometheus

As duas seções a seguir descrevem as cotas e os limites associados ao Amazon Managed Service for Prometheus.

Cotas de serviço

O Amazon Managed Service for Prometheus tem as cotas a seguir. O Amazon Managed Service for Prometheus vende métricas de uso para monitorar o CloudWatch uso dos recursos do Prometheus. Usando o recurso de alarme de métricas de CloudWatch uso, você pode monitorar os recursos e o uso do Prometheus para evitar erros de limite.

À medida que seus projetos e espaços de trabalho crescem, as cotas mais comuns que você pode precisar monitorar ou solicitar um aumento são: séries ativas por espaço de trabalho, taxa de ingestão por espaço de trabalho e tamanho de intermitência de ingestão por espaço de trabalho.

Para todas as cotas ajustáveis, você pode solicitar um aumento de cota selecionando o link na coluna Ajustável ou solicitando um aumento de cota.

O limite da série ativa por workspace é aplicado dinamicamente. Para obter mais informações, consulte Série ativa padrão. Juntos, a taxa de ingestão por espaço de trabalho e o tamanho da intermitência de ingestão por espaço de trabalho controlam a rapidez com que você pode ingerir dados em seu espaço de trabalho. Para ter mais informações, consulte Limitação da ingestão.

nota

Salvo indicação em contrário, essas cotas são por workspace.

Nome Padrão Ajustável Descrição
Métricas ativas com metadados por espaço de trabalho Cada região compatível: 20.000 Não O número de métricas ativas exclusivas com metadados por espaço de trabalho. Observação: se o limite for atingido, a amostra métrica será registrada, mas os metadados acima do limite serão descartados.
Série ativa por espaço de trabalho Cada região compatível: 10.000.000 por 2 horas Sim O número de séries ativas exclusivas por espaço de trabalho. Uma série está ativa se uma amostra tiver sido relatada nas últimas 2 horas. A capacidade de 2M a 10M é ajustada automaticamente com base nos últimos 30 minutos de uso.
Tamanho do grupo de agregação de alertas no arquivo de definição do gerenciador de alertas Cada região com suporte: 1.000 Sim Tamanho máximo do grupo de agregação de alertas no arquivo de definição do gerenciador de alertas. Cada combinação de valores de rótulo de group_by cria um grupo de agregação.
Tamanho do arquivo de definição do gerenciador de alertas Cada região com suporte: 1 megabyte Não Tamanho máximo de um arquivo de definição do gerenciador de alertas.
Tamanho da carga útil do alerta no Alert Manager Cada região compatível: 20 megabytes Não O tamanho máximo da carga útil de todos os alertas do Alert Manager por espaço de trabalho. O tamanho do alerta depende dos rótulos e das anotações.
Alertas no Alert Manager Cada região compatível: 1.000 Sim O número máximo de alertas simultâneos do Alert Manager por espaço de trabalho.
Clusters de rastreadores HA Cada região com suporte: 500 Não O número máximo de clusters que o rastreador HA rastreará para amostras ingeridas por espaço de trabalho.
Tamanho do pico de ingestão por espaço de trabalho Cada região compatível: 1.000.000 Sim O número máximo de amostras que poderiam ser ingeridas por espaço de trabalho em uma sequência por segundo.
Taxa de ingestão por espaço de trabalho Cada região compatível: 170.000 Sim Taxa métrica de ingestão de amostras por espaço de trabalho por segundo.
Regras de inibição no arquivo de definição do gerenciador de alertas Cada região com suporte: 100 Sim Número máximo de regras de inibição no arquivo de definição do gerenciador de alertas.
Tamanho do label Cada região compatível: 7 kilobytes Não O tamanho máximo combinado de todos os labels e valores de lables aceitos para uma série.
Lables por série métrica Cada região compatível: 70 Sim Número de lables por série métrica.
Tamanho dos metadados Cada região compatível: 1 kilobyte Não O tamanho máximo aceito para metadados métricos. Os metadados se referem ao nome, tipo, unidade e texto de ajuda da métrica.
Metadados por métrica Cada região com suporte: 10 Não O número de metadados por métrica.
Nós na árvore de roteamento do gerenciador de alertas Cada região com suporte: 100 Sim O número máximo de nós na árvore de roteamento do gerenciador de alertas.
Número de API operações por região em transações por segundo Cada região compatível: 10 Sim O número máximo de API operações por segundo por região. Isso inclui espaço de trabalho CRUDAPIs, marcaçãoAPIs, namespace de grupos de regras e definição do gerenciador de CRUD APIs alertas. CRUD APIs
Número GetLabels e GetMetricMetadata API operações por espaço de trabalho em transações por segundo GetSeries Cada região com suporte: 10 Não O número máximo de GetSeries API operações GetMetricMetadata compatíveis com o Prometheus por segundo por espaço de trabalho. GetLabels
Número de QueryMetrics API operações por espaço de trabalho em transações por segundo Cada região com suporte: 300 Não O número máximo de API operações QueryMetrics compatíveis com o Prometheus por segundo por espaço de trabalho.
Número de RemoteWrite API operações por espaço de trabalho em transações por segundo Cada região compatível: 3.000 Não O número máximo de API operações RemoteWrite compatíveis com o Prometheus por segundo por espaço de trabalho.
Número de outras API operações compatíveis com o Prometheus por espaço de trabalho em transações por segundo Cada região com suporte: 100 Não O número máximo de API operações por segundo por espaço de trabalho para todos os outros compatíveis com o PrometheusAPIs, incluindo, ListAlerts etc. ListRules
Bytes de consulta para consultas instantâneas Cada região compatível: 5 gigabytes Não 750 MB podem ser digitalizados por meio de uma única consulta instantânea.
Bytes de consulta para consultas de intervalo Cada região compatível: 5 gigabytes Não O máximo de bytes que podem ser verificados por intervalo de 24 horas em uma única consulta de intervalo.
Blocos de consulta obtidos Cada região compatível: 20.000.000 Não O número máximo de blocos que podem ser escaneados durante uma única consulta.
Consultas de exemplo Cada região compatível: 50.000.000 Não O número máximo de blocos que podem ser escaneados durante uma única consulta.
Série de consultas obtida Cada região compatível: 12.000.000 Não O número máximo de séries que podem ser escaneadas durante uma única consulta.
Intervalo de tempo de consulta em dias Cada região compatível: 32 Não O intervalo máximo de tempo de QueryMetrics GetSeries, GetLabels APIs e.
Dimensão da solicitação Cada região com suporte: 1 megabyte Não O tamanho máximo da solicitação para ingestão ou consulta.
Tempo de retenção dos dados ingeridos em dias Cada região compatível: 150 Sim O número de dias que os dados em um espaço de trabalho são retidos. Dados mais antigos do que isso são excluídos. Você pode solicitar alterações na cota para aumentar ou diminuir esse valor.
Intervalo de avaliação da regra Cada região compatível: 30 por segundo Sim Intervalo mínimo de avaliação da regra.
Tamanho do arquivo de definição do namespace do grupo de regras Cada região com suporte: 1 megabyte Não O tamanho máximo de um arquivo de definição de namespace de grupo de regras.
Regras por workspace Cada região compatível: 2.000 Sim O número máximo de regras por WorkSpace.
Modelos no arquivo de definição do gerenciador de alertas Cada região com suporte: 100 Sim O número máximo de modelos no arquivo de definição do gerenciador de alertas.
Espaços de trabalho por região por conta Cada região com suporte: 25 Sim O número máximo de tags por workspace.

Série ativa padrão

O Amazon Managed Service for Prometheus permite que você use até sua cota de séries temporais ativas por padrão.

Os workspaces do Amazon Managed Service for Prometheus se adaptam automaticamente ao seu volume de ingestão. À medida que seu uso aumenta, o Amazon Managed Service for Prometheus aumentará automaticamente sua capacidade de séries temporais para dobrar seu uso básico até a cota padrão. Por exemplo, se sua média de séries temporais ativas nos últimos 30 minutos for 3,5 milhões, você poderá usar até 7 milhões de séries temporais sem controle de utilização.

Se você precisar de mais que o dobro de sua linha de base anterior, o Amazon Managed Service for Prometheus aloca automaticamente mais capacidade enquanto seu volume de ingestão aumenta até sua cota, para ajudar a garantir que sua workload não passe por controle de utilização constante. No entanto, pode ocorrer controle de utilização se você exceder o dobro de seu pico anterior dentro de 30 minutos. Para evitar o controle de utilização, o Amazon Managed Service for Prometheus recomenda aumentar gradualmente a ingestão quando você quiser aumentar para mais do que o dobro da série temporal ativa anterior.

nota

A capacidade mínima para séries temporais ativas é de 2 milhões; não há controle de utilização quando você tem menos de 2 milhões de séries.

Para ir além de sua cota padrão, solicite um aumento de cota.

Limitação da ingestão

O Amazon Managed Service for Prometheus acelera a ingestão de cada espaço de trabalho, com base nos seus limites atuais. Isso ajuda a manter o desempenho do espaço de trabalho. Se você exceder o limite, você verá DiscardedSamples nas CloudWatch métricas (com o rate_limited motivo). Você pode usar CloudWatch a Amazon para monitorar sua ingestão e criar um alarme para avisá-lo quando você estiver perto de atingir os limites de limitação. Para obter mais informações, consulte Use CloudWatch métricas para monitorar os recursos do Amazon Managed Service for Prometheus.

O Amazon Managed Service for Prometheus usa o algoritmo de token bucket para implementar a limitação da ingestão. Com esse algoritmo, sua conta tem um bucket que contém um número específico de tokens. O número de tokens no bucket representa seu limite de ingestão a qualquer segundo.

Cada amostra de dados ingerida remove um token do bucket. Se o tamanho do seu bucket (tamanho de intermitência de ingestão por espaço de trabalho) for de 1.000.000, seu espaço de trabalho poderá ingerir um milhão de amostras de dados em um segundo. Se exceder um milhão de amostras para ingestão, ele será limitado e não ingerirá mais nenhum registro. Amostras de dados adicionais serão descartadas.

O balde é reabastecido automaticamente a uma taxa definida. Se o bucket estiver abaixo de sua capacidade máxima, um determinado número de tokens será adicionado a ele a cada segundo até atingir sua capacidade máxima. Se o balde estiver cheio quando as fichas de recarga chegarem, elas serão descartadas. O bucket não pode conter mais do que seu número máximo de tokens. A taxa de recarga para ingestão de amostras é definida pelo limite da taxa de ingestão por espaço de trabalho. Se sua taxa de ingestão por espaço de trabalho estiver definida como 170.000, a taxa de recarga do bucket será de 170.000 tokens por segundo.

Se seu espaço de trabalho ingerir 1.000.000 de amostras de dados em um segundo, seu bucket será imediatamente reduzido a zero tokens. O balde é então reabastecido com 170.000 tokens a cada segundo, até atingir sua capacidade máxima de 1.000.000 de tokens. Se não houver mais ingestão, o balde anteriormente vazio retornará à sua capacidade máxima em 6 segundos.

nota

A ingestão ocorre em solicitações em lote. Se você tiver 100 tokens disponíveis e enviar uma solicitação com 101 amostras, a solicitação inteira será rejeitada. O Amazon Managed Service para Prometheus não aceita parcialmente solicitações. Se você estiver escrevendo um coletor, poderá gerenciar novas tentativas (com lotes menores ou após algum tempo).

Você não precisa esperar que o bucket esteja cheio para que seu espaço de trabalho possa ingerir mais amostras de dados. Você pode usar tokens à medida que eles são adicionados ao bucket. Se você usar imediatamente os tokens de recarga, o balde não atingirá sua capacidade máxima. Por exemplo, se você esgotar o bucket, poderá continuar ingerindo 170.000 amostras de dados por segundo. O bucket pode ser reabastecido até a capacidade máxima somente se você ingerir menos de 170.000 amostras de dados por segundo.

Limites adicionais para dados ingeridos

O Amazon Managed Service for Prometheus também tem os seguintes requisitos adicionais para ingestão de dados no espaço de trabalho. Eles não são ajustáveis.

  • Amostras métricas com mais de 1 hora não podem ser ingeridas.

  • Cada amostra e metadado deve ter um nome de métrica.