# Cotas Lambda
<a name="gettingstarted-limits"></a>

**Importante**  
Novas Contas da AWS reduziram as cotas de simultaneidade e de memória. A AWS aumenta essas cotas automaticamente com base na utilização.

O AWS Lambda foi projetado para escalar rapidamente para atender à demanda, permitindo que suas funções aumentem a escala verticalmente para atender ao tráfego em sua aplicação. O Lambda foi projetado para tarefas computacionais de curta duração que não retêm nem dependem do estado entre invocações. O código pode ser executado por até 15 minutos em uma única invocação, e uma única função pode usar até 10.240 MB de memória.

É importante entender as barreiras que são implementadas para proteger sua conta e as workloads de outros clientes. O Service Quotas está disponível em todos os serviços da AWS e consistem em limites rígidos, que você não pode alterar, e limites flexíveis, para os quais você pode solicitar aumentos. Por padrão, todas as novas contas recebem um perfil de cota que permite a exploração dos serviços da AWS.

Para ver as cotas que se aplicam à sua conta, navegue até o [painel do Service Quotas](https://console.aws.amazon.com/servicequotas/home). Aqui, você pode visualizar suas cotas de serviço, solicitar um aumento de cota e visualizar a utilização atual. Nesse painel, você pode fazer uma busca detalhada por um serviço específico da AWS, como o Lambda:

![\[design de aplicações figura 1\]](http://docs.aws.amazon.com/pt_br/lambda/latest/dg/images/application-design-figure-1.png)


As seções abaixo listam cotas e limites padrão no Lambda por categoria.

**Topics**
+ [

## Computação e armazenamento
](#compute-and-storage)
+ [

## Configuração, implantação e execução de funções
](#function-configuration-deployment-and-execution)
+ [

## Solicitações da API do Lambda
](#api-requests)
+ [

## Outros serviços
](#quotas-other-services)

## Computação e armazenamento
<a name="compute-and-storage"></a>

O Lambda define cotas para a quantidade de recursos computacionais e de armazenamento que você pode usar para executar e armazenar funções. As cotas para execuções simultâneas e armazenamento são aplicadas por Região da AWS. As cotas de interface de rede elástica (ENI) se aplicam por nuvem privada virtual (VPC), qualquer que seja a região. As cotas a seguir podem ser aumentadas dos valores padrão. Para obter mais informações, consulte [Solicitar um aumento de cota no ](https://docs.aws.amazon.com/servicequotas/latest/userguide/request-quota-increase.html)Guia do usuário do Service Quotas.**.


| Recurso | Cota padrão | Pode ser aumentado até | 
| --- | --- | --- | 
|  Execuções simultâneas  |  1.000  |  Dezenas de milhares  | 
|  Armazenamento para funções carregadas (arquivos .zip) e camadas. Cada versão da função e versão da camada consome armazenamento.  Para práticas recomendadas para o gerenciamento do armazenamento do seu código, consulte [Monitoring Lambda code storage](https://serverlessland.com/content/service/lambda/guides/aws-lambda-operator-guide/code-storage) no Serverless Land.  |  75 GB  |  Terabytes  | 
|  Armazenamento para funções definidas como imagens de contêiner Essas imagens são armazenadas no Amazon ECR.  |  Consulte [Cotas de serviço do Amazon ECR](https://docs.aws.amazon.com/AmazonECR/latest/userguide/service-quotas.html).  |     | 
|  [Interfaces de rede elásticas por Virtual Private Cloud (VPC)](configuration-vpc.md)  Esta cota é compartilhada com outros serviços, como o Amazon Elastic File System (Amazon EFS). Consulte [Cotas da Amazon VPC](https://docs.aws.amazon.com/vpc/latest/userguide/amazon-vpc-limits.html).   |  500  |  Milhares  | 

Para obter detalhes sobre a simultaneidade e sobre como o Lambda dimensiona a simultaneidade da função em resposta ao tráfego, consulte [Como entender a escalabilidade da função do Lambda](lambda-concurrency.md).

## Configuração, implantação e execução de funções
<a name="function-configuration-deployment-and-execution"></a>

As cotas a seguir se aplicam à configuração de funções, às implantações e à execução. Exceto quando indicado, elas não podem ser alteradas.

**nota**  
A documentação do Lambda, as mensagens de log e o console usam a abreviatura MB (em vez de MiB) para se referir a 1.024 KB.


| Recurso | Quota | 
| --- | --- | 
|  [Alocação de memória](configuration-memory.md) da função  |  128 MB a 10.240 MB, em incrementos de 1 MB. **Observação:** o Lambda aloca capacidade da CPU na proporção da quantidade de memória configurada. É possível aumentar ou diminuir a memória e a potência da CPU alocada para a função usando a configuração **Memória (MB)**. Com 1.769 MB, uma função tem o equivalente a uma vCPU.  | 
|  Tempo limite da função  |  900 segundos (15 minutos)  | 
|  [Variáveis de ambiente](configuration-envvars.md) da função  |  4 KB, para todas as variáveis de ambiente associadas à função, em agregado  | 
|  [Política baseada em recursos](access-control-resource-based.md) da função  |  20 KB  | 
|  Função [camadas](chapter-layers.md)  |  5 camadas  | 
|  [Limite de escalabilidade de simultaneidade](scaling-behavior.md) de funções  |  Para cada função, mil ambientes de execução a cada dez segundos  | 
|  [Carga da invocação](lambda-invocation.md) (solicitação e resposta)  |  6 MB cada para solicitação e resposta (síncrona) 200 MB para cada [resposta enviada por streaming](configuration-response-streaming.md) (síncrona) 1 MB (assíncrona) 1 MB para o tamanho total combinado dos valores de linha e de cabeçalho da solicitação  | 
|  Largura de banda para [respostas enviadas por streamig](configuration-response-streaming.md)  |  Ilimitada para os primeiros 6 MB da resposta da função Para respostas maiores que 6 MB, 2 MBps para o restante da resposta  | 
|  Tamanho do[pacote de implantação (arquivo .zip)](configuration-function-zip.md)  |  50 MB (compactado, quando carregado por meio dos SDKs ou da API do Lambda). Carregue arquivos maiores com o Amazon S3. 50 MB (quando carregado pelo console do Lambda) 250 MB O tamanho máximo do conteúdo de um pacote de implantação, inclusive camadas e runtimes personalizados (descompactado).   | 
|  Tamanho das configurações de imagem de contêiner  |  16 KB  | 
|  Tamanho do pacote do código da [imagem do contêiner](images-create.md)  |  10 GB (tamanho máximo de imagem descompactada, incluindo todas as camadas)  | 
|  Eventos de teste (editor de console)  |  10  | 
|  `/tmp`Armazenamento do diretório do   |  Entre 512 MB e 10.240 MB, em incrementos de 1 MB  | 
|  Descrições do arquivo  |  1,024  As instâncias gerenciadas do Lambda utilizam um limite mais alto de descritores de arquivo, de 4.096. Para obter mais informações, consulte [Noções básicas sobre o ambiente de execução das instâncias gerenciadas do Lambda](lambda-managed-instances-execution-environment.md).   | 
|  Processos de execução/threads  |  1,024  As instâncias gerenciadas do Lambda usam o processo padrão e os limites de threads do [Bottlerocket](https://aws.amazon.com/bottlerocket/). Para obter mais informações, consulte [Noções básicas sobre o ambiente de execução das instâncias gerenciadas do Lambda](lambda-managed-instances-execution-environment.md).   | 

## Solicitações da API do Lambda
<a name="api-requests"></a>

As cotas a seguir estão associadas a solicitações de API do Lambda.


| Recurso | Quota | 
| --- | --- | 
|  Solicitações de invocação por função por região (síncronas)  |  Cada instância do ambiente de execução pode atender até dez solicitações por segundo. Em outras palavras, o limite total de invocação corresponde a dez vezes o limite de simultaneidade. Consulte [Como entender a escalabilidade da função do Lambda](lambda-concurrency.md).  | 
|  Solicitações de invocação por função por região (assíncronas)  |  Cada instância do ambiente de execução pode atender a um número ilimitado de solicitações. Em outras palavras, o limite total de invocação é baseado somente na simultaneidade disponível para a função. Consulte [Como entender a escalabilidade da função do Lambda](lambda-concurrency.md).  | 
|  Solicitações de invocação por alias ou versão de função (solicitações por segundo)  |  10 x [simultaneidade provisionada](configuration-concurrency.md) alocada  Essa cota se aplica somente às funções que usam simultaneidade provisionada.   | 
|  Solicitações da API [GetFunction](https://docs.aws.amazon.com/lambda/latest/api/API_GetFunction.html)  |  100 solicitações por segundo. Não pode ser aumentado.  | 
|  Solicitações de API [GetPolicy](https://docs.aws.amazon.com/lambda/latest/api/API_GetPolicy.html)  |  15 solicitações por segundo. Não pode ser aumentado.  | 
|  Restante das solicitações da API do ambiente de gerenciamento (exclui solicitações de invocação, GetFunction e GetPolicy)  |  15 solicitações por segundo em todas as APIs (não 15 solicitações por segundo por API). Não pode ser aumentado.  | 

## Outros serviços
<a name="quotas-other-services"></a>

Cotas para outros serviços, como o AWS Identity and Access Management (IAM), Amazon CloudFront (Lambda @Edge) e Amazon Virtual Private Cloud (Amazon VPC) podem afetar as funções do Lambda. Para obter mais informações, consulte [AWS service (Serviço da AWS) quotas](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html), na *Referência geral da Amazon Web Services*, e [Invocando o Lambda com eventos de outros serviços da AWS](lambda-services.md).

Muitas aplicações que envolvem o Lambda usam vários serviços da AWS. Como serviços diferentes apresentam cotas diferentes para vários recursos, pode ser desafiador gerenciar essas cotas em toda a aplicação. Por exemplo, o API Gateway tem um limite padrão de controle de utilização de 10.000 solicitações por segundo, enquanto o Lambda tem um limite padrão de simultaneidade de 1.000. Devido a essa incompatibilidade, é possível ter mais solicitações recebidas do API Gateway do que o Lambda é capaz de processar. É possível resolver isso solicitando um aumento do limite de concorrência do Lambda para corresponder ao nível esperado de tráfego.

O teste de carga da aplicação permite monitorar a performance da aplicação de ponta a ponta antes de implantá-la na produção. Durante um teste de carga, você pode identificar quaisquer cotas que talvez atuem como um fator limitante para os níveis de tráfego esperados e tomar as medidas necessárias.