Quote di Lambda - AWS Lambda

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Quote di Lambda

AWS Lambda è progettato per scalare rapidamente per soddisfare la domanda, permettendo alle funzioni di scalare per soddisfare il traffico dell'applicazione. Lambda è progettata per attività di elaborazione di breve durata che non mantengono o si basano sullo stato tra le chiamate. Il codice può essere eseguito per un massimo di 15 minuti in una singola chiamata e una singola funzione può utilizzare fino a 10.240 MB di memoria.

È importante comprendere le barriere messe in atto per proteggere il proprio account e i carichi di lavoro degli altri clienti. Le quote di servizio esistono in tutti i AWS servizi e consistono in limiti rigidi, che non è possibile modificare, e limiti flessibili, per i quali è possibile richiedere aumenti. Per impostazione predefinita, a tutti i nuovi account viene assegnato un profilo di quota che consente l'esplorazione dei AWS servizi.

Per visualizzare le quote applicabili al tuo account, vai al pannello di controllo di Service Quotas. Qui è possibile visualizzare le quote di servizio, richiedere un aumento delle quote e visualizzare l'utilizzo corrente. Da qui, puoi approfondire un AWS servizio specifico, come Lambda:

progettazione dell'applicazione (figura 1)
Importante

Account AWS I nuovi hanno quote di concorrenza e memoria ridotte. AWS aumenta automaticamente queste quote in base all'utilizzo.

Le seguenti sezioni elencano le quote e i limiti predefiniti in Lambda per categoria.

Calcolo e archiviazione

Lambda imposta le quote per la quantità di risorse di calcolo e storage che è possibile utilizzare per eseguire e archiviare le funzioni. Le quote per le esecuzioni e l'archiviazione simultanee sono applicate in base alla Regione AWS. Le quote dell'interfaccia di rete elastica (ENI) si applicano per ogni cloud privato virtuale (VPC), indipendentemente dalla regione. Le seguenti quote possono essere aumentate rispetto ai relativi valori predefiniti. Per ulteriori informazioni, consulta Richiesta di un aumento di quota nella Guida per l'utente delle Service Quotas.

Risorsa Quota predefinita Può essere aumentato fino a

Esecuzioni simultanee

1.000

Decine di migliaia

Storage per funzioni caricate (archivi di file .zip) e livelli. Ogni versione di funzione e di livello consuma spazio di storage.

Per le best practice da seguire per la gestione dell'archiviazione del codice, consulta Monitoraggio dell'archiviazione del codice Lambda in Serverless Land.

75 GB

Terabyte

Storage per le funzioni definite come immagini di container. Queste immagini sono archiviate in AmazonECR.

Vedi le quote ECR dei servizi Amazon.

Interfacce di rete elastiche per cloud privato virtuale () VPC

Nota

Questa quota è condivisa con altri servizi, come Amazon Elastic File System (AmazonEFS). Vedi le VPCquote Amazon.

500

Migliaia

Per ulteriori informazioni sulla simultaneità e su come Lambda ridimensiona la simultaneità della funzione in risposta al traffico, consulta Informazioni sulla scalabilità della funzione Lambda.

Configurazione, implementazione ed esecuzione della funzione

Le seguenti quote si applicano alla configurazione, all'implementazione e all'esecuzione della funzione. Fatto salvo per quanto indicato, non possono essere modificate.

Nota

La documentazione Lambda, i messaggi di log e la console utilizzano l'abbreviazione MB (anziché MiB) per fare riferimento a 1.024 KB.

Risorsa Quota

Allocazione di memoria della funzione

Da 128 MB a 10.240 MB, in incrementi di 1 MB.

Nota: Lambda alloca l'CPUalimentazione in proporzione alla quantità di memoria configurata. È possibile aumentare o diminuire la memoria e la CPU potenza allocate alla funzione utilizzando l'impostazione Memoria (MB). Con 1.769 MB, una funzione ha l'equivalente di una v. CPU

Timeout della funzione.

900 secondi (15 minuti)

Variabili di ambiente della funzione

4 KB, per tutte le variabili di ambiente associate alla funzione, in forma aggregata

Policy basata sulle risorse della funzione

20 KB

Livelli della funzione

cinque livelli

Limite di dimensionamento della simultaneità delle funzioni

Per ogni funzione, 1.000 ambienti di esecuzione ogni 10 secondi

Payload dell'invocazione (richiesta e risposta)

6 MB ciascuno per richiesta e risposta (sincrono)

20 MB per ogni risposta in streaming (sincrona. La dimensione del payload per le risposte in streaming può essere aumentata rispetto ai valori predefiniti. Contatta Support per ulteriori informazioni.)

256 KB (asincrono)

Dimensione totale combinata dei valori della riga di richiesta e dell'intestazione

Larghezza di banda per le risposte in streaming

Senza limite per i primi 6 MB di risposta della funzione

Per risposte superiori a 6 MB, 2 MBps per il resto della risposta

Dimensioni del pacchetto di implementazione (archivio di file .zip)

50 MB (zippato, se caricato tramite API Lambda SDKs o). Carica file di dimensioni maggiori con Amazon S3.

50 MB (se caricati tramite la console Lambda)

250 MB La dimensione massima del contenuto di un pacchetto di implementazione, inclusi livelli e runtime personalizzati (decompresso).

Impostazioni dell'immagine di container

16 KB

Dimensione del pacchetto del codice dell'immagine di container

10 GB (dimensione massima dell'immagine non compressa, inclusi tutti i livelli)

Eventi di test (editor della console)

10

Storage della directory /tmp

Compreso tra 512 MB e 10.240 MB in incrementi di 1 MB

Descrittori di file

1,024

Processi/thread dell'esecuzione

1,024

Richieste Lambda API

Le seguenti quote sono associate alle richieste API Lambda.

Risorsa Quota

Richieste di chiamata per funzione per regione (sincrona)

Ogni istanza del tuo ambiente di esecuzione può gestire fino a 10 richieste al secondo. In altre parole, il limite totale di chiamate è 10 volte il limite di simultaneità. Per informazioni, consulta Informazioni sulla scalabilità della funzione Lambda.

Richieste di chiamata per funzione per regione (asincrona)

Ogni istanza del tuo ambiente di esecuzione può soddisfare un numero illimitato di richieste. In altre parole, il limite totale di chiamate si basa solo sulla simultaneità disponibile per la funzione. Per informazioni, consulta Informazioni sulla scalabilità della funzione Lambda.

Richieste di invocazione per versione di funzione o alias (richieste al secondo)

10 x simultaneità fornita allocata

Nota

Questa quota si applica solo alle funzioni che utilizzano la simultaneità fornita.

GetFunctionAPIrichieste

100 richieste al secondo. Non può essere aumentato.

GetPolicyAPIrichieste

15 richieste al secondo. Non può essere aumentato.

Il resto delle API richieste del piano di controllo (escluse le chiamate e le richieste) GetFunction GetPolicy

15 richieste al secondo in totale APIs (non 15 richieste al secondo per volta). API Non può essere aumentato.

Altri servizi

Le quote per altri servizi, come AWS Identity and Access Management (IAM), Amazon CloudFront (Lambda @Edge) e Amazon Virtual Private Cloud (VPCAmazon), possono influire sulle funzioni Lambda. Per ulteriori informazioni, consulta la pagina Servizio AWS quotas nella Riferimenti generali di Amazon Web Services e la pagina Richiamare Lambda con eventi di altri servizi AWS.

Molte applicazioni che coinvolgono Lambda utilizzano più AWS servizi. Poiché servizi diversi hanno quote diverse per diverse funzionalità, può essere difficile gestire queste quote nell'intera applicazione. Ad esempio, API Gateway ha un limite di accelerazione predefinito di 10.000 richieste al secondo, mentre Lambda ha un limite di concorrenza predefinito di 1.000. A causa di questa mancata corrispondenza, è possibile che Lambda sia in grado di gestire un numero maggiore di richieste in arrivo da API Gateway. Puoi risolvere questo problema richiedendo un aumento del limite di concorrenza Lambda in modo che corrisponda al livello di traffico previsto.

Il test di carico dell'applicazione consente di monitorare le prestazioni dell'applicazione end-to-end prima della distribuzione in produzione. Durante un test di carico, è possibile identificare eventuali quote che possono fungere da fattore limitante per i livelli di traffico previsti e agire di conseguenza.