Service Quotas do Amazon Managed Service for Prometheus

Modo de foco

Service Quotas do Amazon Managed Service for Prometheus - Amazon Managed Service para Prometheus

Cotas de serviço Limites adicionais para dados ingeridos

As duas seções a seguir descrevem as cotas e os limites associados ao Amazon Managed Service for Prometheus.

Cotas de serviço

O Amazon Managed Service for Prometheus tem as cotas a seguir. O Amazon Managed Service for Prometheus vende métricas de uso para monitorar o CloudWatch uso dos recursos do Prometheus. Usando o recurso de alarme de métricas de CloudWatch uso, você pode monitorar os recursos e o uso do Prometheus para evitar erros de limite.

À medida que seus projetos e espaços de trabalho crescem, as cotas mais comuns que você pode precisar monitorar ou solicitar um aumento são: séries ativas por espaço de trabalho, taxa de ingestão por espaço de trabalho e tamanho de intermitência de ingestão por espaço de trabalho.

Para todas as cotas ajustáveis, você pode solicitar um aumento de cota selecionando o link na coluna Ajustável ou solicitando um aumento de cota.

O limite da série ativa por espaço de trabalho é aplicado dinamicamente. Para obter mais informações, consulte Série ativa padrão. Juntos, a taxa de ingestão por espaço de trabalho e o tamanho da intermitência de ingestão por espaço de trabalho controlam a rapidez com que você pode ingerir dados em seu espaço de trabalho. Para obter mais informações, consulte Controle de utilização da ingestão.

nota

Salvo indicação em contrário, essas cotas são por espaço de trabalho.

Name	Padrão	Ajustável	Descrição
Métricas ativas com metadados por espaço de trabalho	Cada região com suporte: 20.000	Não	O número de métricas ativas exclusivas com metadados por espaço de trabalho. Observação: se o limite for atingido, a amostra da métrica será registrada, mas os metadados acima do limite serão descartados.
Série ativa por espaço de trabalho	Cada região com suporte: 10.000.000 por 2 horas	Sim	O número de séries ativas exclusivas por espaço de trabalho. Uma série está ativa se uma amostra tiver sido relatada nas últimas 2 horas. A capacidade de 2M a 10M é ajustada automaticamente com base nos últimos 30 minutos de uso.
Tamanho do grupo de agregação de alertas no arquivo de definição do gerenciador de alertas	Cada região com suporte: 1.000	Sim	Tamanho máximo do grupo de agregação de alertas no arquivo de definição do gerenciador de alertas. Cada combinação de valores de rótulo de group_by cria um grupo de agregação.
Tamanho do arquivo de definição do gerenciador de alertas	Cada região com suporte: 1 megabyte	Não	Tamanho máximo de um arquivo de definição do gerenciador de alertas.
Tamanho da carga útil do alerta no gerenciador de alertas	Cada região com suporte: 20 megabytes	Não	O tamanho máximo da carga útil do alerta de todos os alertas do gerenciador de alertas por espaço de trabalho. O tamanho do alerta depende dos rótulos e das anotações.
Alertas no gerenciador de alertas	Cada região com suporte: 1.000	Sim	O número máximo de alertas simultâneos do gerenciador de alertas por espaço de trabalho.
Clusters de rastreadores HA	Cada região com suporte: 500	Não	O número máximo de clusters que o rastreador HA rastreará para amostras ingeridas por espaço de trabalho.
Tamanho do pico de ingestão por espaço de trabalho	Cada região com suporte: 1.000.000	Sim	O número máximo de amostras que poderiam ser ingeridas por espaço de trabalho em uma sequência por segundo.
Taxa de ingestão por espaço de trabalho	Cada região com suporte: 170.000	Sim	Taxa métrica de ingestão de amostras por espaço de trabalho por segundo.
Regras de inibição no arquivo de definição do gerenciador de alertas	Cada região com suporte: 100	Sim	Número máximo de regras de inibição no arquivo de definição do gerenciador de alertas.
Tamanho do label	Cada região com suporte: 7 kilobytes	Não	O tamanho máximo combinado de todos os rótulos e valores de rótulos aceitos para uma série.
Rótulos por série métrica	Cada região com suporte: 70	Sim	Número de rótulos por série métrica.
Tamanho dos metadados	Cada região com suporte: 1 kilobyte	Não	O tamanho máximo aceito para metadados métricos. Os metadados são referentes a nome da métrica, tipo, unidade e texto de ajuda.
Metadados por métrica	Cada região com suporte: 10	Não	O número de metadados por métrica.
Nós na árvore de roteamento do gerenciador de alertas	Cada região com suporte: 100	Sim	O número máximo de nós na árvore de roteamento do gerenciador de alertas.
Número de operações de API por região em transações por segundo	Cada região com suporte: 10	Sim	O número máximo de operações da API que é possível fazer por segundo por região. Isso inclui CRUD do espaço de trabalho APIs, marcação APIs, espaço de nomes CRUD de grupos de regras e CRUD APIs de definição do gerenciador de alertas. APIs
Número GetLabels e operações GetSeries de GetMetricMetadata API por espaço de trabalho em transações por segundo	Cada região com suporte: 10	Não	O número máximo de operações de GetSeries API GetMetricMetadata compatíveis com o Prometheus por segundo por espaço de trabalho. GetLabels
Número de operações de QueryMetrics API por espaço de trabalho em transações por segundo	Cada região com suporte: 300	Não	O número máximo de operações de API QueryMetrics compatíveis com o Prometheus por segundo por espaço de trabalho.
Número de operações de RemoteWrite API por espaço de trabalho em transações por segundo	Cada região com suporte: 3.000	Não	O número máximo de operações de API RemoteWrite compatíveis com o Prometheus por segundo por espaço de trabalho.
O número de outras operações de API compatíveis com o Prometheus por espaço de trabalho em transações por segundo	Cada região compatível: 100	Não	O número máximo de operações de API por segundo por espaço de trabalho para todos os outros compatíveis com o Prometheus APIs , incluindo, ListAlerts etc. ListRules
Bytes de consulta para consultas instantâneas	Cada região com suporte: 5 gigabytes	Não	750 MB podem ser verificados por uma única consulta instantânea.
Bytes de consulta para consultas de intervalo	Cada região compatível: 5 gigabytes	Não	O máximo de bytes que podem ser verificados por intervalo de 24 horas em uma única consulta de intervalo.
Blocos de consulta obtidos	Cada região com suporte: 20.000.000	Não	O número máximo de blocos que podem ser escaneados durante uma única consulta.
Consultas de exemplo	Cada região com suporte: 50.000.000	Não	O número máximo de blocos que podem ser escaneados durante uma única consulta.
Série de consultas obtida	Cada região com suporte: 12.000.000	Não	O número máximo de séries que podem ser escaneadas durante uma única consulta.
Intervalo de tempo de consulta em dias	Cada região com suporte: 32	Não	O intervalo máximo de tempo de QueryMetrics GetSeries, GetLabels APIs e.
Dimensão da solicitação	Cada região com suporte: 1 megabyte	Não	O tamanho máximo da solicitação para ingestão ou consulta.
Tempo de retenção dos dados ingeridos em dias	Cada região com suporte: 150	Sim	O número de dias que os dados em um espaço de trabalho são retidos. Dados mais antigos do que isso são excluídos. Você pode solicitar alterações na cota para aumentar ou diminuir esse valor.
Intervalo de avaliação da regra	Cada região com suporte: 30 por segundo	Sim	Intervalo mínimo de avaliação da regra.
Tamanho do arquivo de definição do namespace do grupo de regras	Cada região com suporte: 1 megabyte	Não	O tamanho máximo de um arquivo de definição de namespace de grupo de regras.
Regras por espaço de trabalho	Cada região com suporte: 2.000	Sim	O número máximo de regras por WorkSpace.
Modelos no arquivo de definição do gerenciador de alertas	Cada região com suporte: 100	Sim	O número máximo de modelos no arquivo de definição do gerenciador de alertas.
Espaços de trabalho por região por conta	Cada região com suporte: 25	Sim	O número máximo de tags por espaços de trabalho.

Série ativa padrão

O Amazon Managed Service for Prometheus permite que você use até sua cota de séries temporais ativas por padrão.

Os espaços de trabalho do Amazon Managed Service for Prometheus se adaptam automaticamente ao seu volume de ingestão. À medida que seu uso aumenta, o Amazon Managed Service for Prometheus aumentará automaticamente sua capacidade de séries temporais para dobrar seu uso básico até a cota padrão. Por exemplo, se sua média de séries temporais ativas nos últimos 30 minutos for 3,5 milhões, você poderá usar até 7 milhões de séries temporais sem controle de utilização.

Se você precisar de mais que o dobro de sua linha de base anterior, o Amazon Managed Service for Prometheus aloca automaticamente mais capacidade enquanto seu volume de ingestão aumenta até sua cota, para ajudar a garantir que sua workload não passe por controle de utilização constante. No entanto, pode ocorrer controle de utilização se você exceder o dobro de seu pico anterior dentro de 30 minutos. Para evitar o controle de utilização, o Amazon Managed Service for Prometheus recomenda aumentar gradualmente a ingestão quando você quiser aumentar para mais do que o dobro da série temporal ativa anterior.

nota

A capacidade mínima para séries temporais ativas é de 2 milhões; não há controle de utilização quando você tem menos de 2 milhões de séries.

Para ir além de sua cota padrão, solicite um aumento de cota.

Controle de utilização da ingestão

O Amazon Managed Service for Prometheus tem controle de utilização da ingestão em cada espaço de trabalho, com base nos seus limites atuais. Isso ajuda a manter o desempenho dos espaços de trabalho. Se você exceder o limite, você verá DiscardedSamples nas CloudWatch métricas (com o rate_limited motivo). Você pode usar CloudWatch a Amazon para monitorar sua ingestão e criar um alarme para avisá-lo quando você estiver perto de atingir os limites de limitação. Para obter mais informações, consulte Use CloudWatch métricas para monitorar os recursos do Amazon Managed Service for Prometheus.

O Amazon Managed Service for Prometheus usa o algoritmo do bucket de tokens para implementar o controle de utilização da ingestão. Com esse algoritmo, sua conta tem um bucket que contém um número específico de tokens. O número de tokens no bucket representa seu limite de ingestão em qualquer segundo.

Cada amostra de dados ingerida remove um token do bucket. Se o tamanho do seu bucket (tamanho da intermitência de ingestão por espaço de trabalho) for 1.000.000, seu espaço de trabalho poderá ingerir um milhão de amostras de dados por segundo. Se ele exceder um milhão de amostras para ingestão, o controle de utilização será aplicado e nenhum outro registro será ingerido. As amostras de dados adicionais serão descartadas.

O bucket será recarregado automaticamente a uma taxa definida. Se o bucket ficar abaixo da capacidade máxima, um determinado número de tokens será adicionado novamente a ele a cada segundo até atingir sua capacidade máxima. Se o bucket estiver cheio quando os tokens de recarga forem adicionados, eles serão descartados. O bucket não pode conter mais do que seu número máximo de tokens. A taxa de recarga para amostras de ingestão é definida pelo limite da taxa de ingestão por espaço de trabalho. Se sua taxa de ingestão por espaço de trabalho estiver definida como 170.000, a taxa de recarga do bucket será de 170.000 tokens por segundo.

Se seu espaço de trabalho ingerir 1.000.000 de amostras de dados por segundo, seu bucket será imediatamente reduzido para zero token. O bucket será então recarregado com 170.000 tokens a cada segundo até atingir sua capacidade máxima de 1.000.000 tokens. Se não houver mais ingestão, o bucket anteriormente vazio retornará à sua capacidade máxima em 6 segundos.

nota

A ingestão ocorre via solicitações em lote. Se você tiver 100 tokens disponíveis e enviar uma solicitação com 101 amostras, a solicitação inteira será rejeitada. O Amazon Managed Service for Prometheus não aceita solicitações parcialmente. Se você estiver gravando um coletor, poderá gerenciar novas tentativas (com lotes menores ou após algum tempo).

Para que o bucket possa ingerir mais amostras de dados, você não precisa esperar que o bucket esteja cheio. Você pode usar tokens à medida que eles são adicionados ao bucket. Se você usar imediatamente os tokens de recarga, o bucket não atingirá sua capacidade máxima. Por exemplo, se você esgotar o bucket, poderá continuar ingerindo 170.000 amostras de dados por segundo. O bucket poderá ser recarregado até a capacidade máxima somente se você ingerir menos de 170.000 amostras de dados por segundo.

Limites adicionais para dados ingeridos

O Amazon Managed Service for Prometheus também tem os seguintes requisitos adicionais para ingestão de dados no espaço de trabalho. Eles não são ajustáveis.

Amostras métricas com mais de 1 hora não podem ser ingeridas.
Cada amostra e metadado deve ter um nome de métrica.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Remova uma tag de um namespace de grupos de regras

Referência da API

Nesta página

Selecione suas preferências de cookies

Personalizar preferências de cookies

Essenciais

Desempenho

Funcionais

Publicidade

Não foi possível salvar as preferências de cookie

Service Quotas do Amazon Managed Service for Prometheus

Cotas de serviço

nota

Série ativa padrão

nota

Controle de utilização da ingestão

nota

Limites adicionais para dados ingeridos

Nesta página

Esta página foi útil?

Próximo tópico:

Tópico anterior:

Precisa de ajuda?