Limites do AWS Data Pipeline - AWS Data Pipeline

AWS Data Pipeline não está mais disponível para novos clientes. Clientes existentes da AWS Data Pipeline pode continuar usando o serviço normalmente. Saiba mais

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Limites do AWS Data Pipeline

Para garantir que haja capacidade para todos os usuários, o AWS Data Pipeline impõe limites para os recursos que você pode alocar e a taxa na qual você pode alocar recursos.

Limites da conta

Os seguintes limites aplicam-se a uma única conta da AWS. Se precisar de capacidade adicional, você pode usar o Formulário de solicitação da Central de suporte da Amazon Web Services para aumentar sua capacidade.

Atributo Limite Ajustável
Número de pipelines 100 Sim
Número de objetos por pipeline 100 Sim
Número de instâncias ativas por objeto 5 Sim
Número de campos por objeto 50 Não
Número de UTF8 bytes por nome ou identificador 256 Não
Número de UTF8 bytes por campo 10,240 Não
Número de UTF8 bytes por objeto 15.360 (incluindo nomes de campo) Não
Índice de criação de uma instância de um objeto 1 por 5 minutos Não
Novas tentativas de uma atividade de pipeline 5 por tarefa Não
Intervalo mínimo entre novas tentativas 2 minutos Não
Intervalo máximo de programação 15 minutos Não
Número máximo de sumarizações em um único objeto 32 Não
Número máximo de instâncias do EC2 por objeto do Ec2Resource 1 Não

Limites de chamada do serviço web

O AWS Data Pipeline limita a taxa na qual você pode chamar a API de serviço web. Esses limites também se aplicam a agentes do AWS Data Pipeline que chamam a API de serviço web em seu nome, como o console, a CLI e o Task Runner.

Os seguintes limites aplicam-se a uma única conta da AWS. Isso significa que o uso total na conta, incluindo aquele por usuários do , não pode exceder esses limites.

A taxa de intermitência permite que você acumule chamadas de serviço web durante períodos de inatividade e use todas elas em um curto período. Por exemplo, CreatePipeline tem uma taxa regular de uma chamada a cada cinco segundos. Se você não chamar o serviço por 30 segundos, terá seis chamadas salvas. Em seguida, você pode chamar o serviço da web seis vezes em um segundo. Como esse preço está abaixo do limite de intermitência médio e mantém suas chamadas no limite de taxa regular, suas chamadas não são suspensas.

Se você exceder o limite de taxa e o limite de intermitência, a chamada de serviço web falha e retorna uma exceção de controle de utilização. A implementação padrão de um operador, Task Runner, tentará executar automaticamente as chamadas de API que falham com uma exceção do controle de utilização. O Task Runner tem um recuo para que as tentativas subsequentes de chamada da API ocorram em intervalos cada vez mais longos. Se você gravar um operador, recomendamos que implemente uma lógica semelhante de novas tentativas de trabalho.

Esses limites são aplicados em relação a uma conta individual da AWS.

API Limite de taxa regular Limite de intermitência
ActivatePipeline 1 chamada por segundo 100 chamadas
CreatePipeline 1 chamada por segundo 100 chamadas
DeletePipeline 1 chamada por segundo 100 chamadas
DescribeObjects 2 chamadas por segundo 100 chamadas
DescribePipelines 1 chamada por segundo 100 chamadas
GetPipelineDefinition 1 chamada por segundo 100 chamadas
PollForTask 2 chamadas por segundo 100 chamadas
ListPipelines 1 chamada por segundo 100 chamadas
PutPipelineDefinition 1 chamada por segundo 100 chamadas
QueryObjects 2 chamadas por segundo 100 chamadas
ReportTaskProgress 10 chamadas por segundo 100 chamadas
SetTaskStatus 10 chamadas por segundo 100 chamadas
SetStatus 1 chamada por segundo 100 chamadas
ReportTaskRunnerHeartbeat 1 chamada por segundo 100 chamadas
ValidatePipelineDefinition 1 chamada por segundo 100 chamadas

Considerações sobre escalabilidade

O AWS Data Pipeline pode ser dimensionado para acomodar uma grande quantidade de tarefas simultâneas, e você pode configurá-lo para criar automaticamente os recursos necessários para lidar com grandes cargas de trabalho. Esses recursos criados automaticamente são controlados por você e contam para os limites de recursos da sua conta da AWS. Por exemplo, se você configurar o AWS Data Pipeline para criar um cluster do Amazon EMR de 20 nós para processar dados, e sua conta da AWS tiver um limite de 20 instâncias do EC2, você poderá esgotar de maneira não intencional os seus recursos de alocação disponíveis. Por isso, considere essas restrições de recursos no seu projeto ou aumente os limites da sua conta.

Se precisar de capacidade adicional, você pode usar o Formulário de solicitação da Central de suporte da Amazon Web Services para aumentar sua capacidade.