Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Quotas Lambda
AWS Lambda est conçu pour évoluer rapidement afin de répondre à la demande, ce qui permet à vos fonctions de s'adapter au trafic de votre application. Lambda est conçu pour les tâches de calcul de courte durée qui ne conservent pas ou ne dépendent pas de l'état entre les appels. Le code peut être exécuté pendant 15 minutes au cours d'un seul appel et une seule fonction peut utiliser jusqu'à 10 240 Mo de mémoire.
Il est important de comprendre les garde-fous mis en place pour protéger votre compte et la charge de travail des autres clients. Les quotas de service existent dans tous les AWS services et se composent de limites strictes, que vous ne pouvez pas modifier, et de limites souples, pour lesquelles vous pouvez demander des augmentations. Par défaut, tous les nouveaux comptes se voient attribuer un profil de quota qui permet d'explorer AWS les services.
Pour voir les quotas qui s'appliquent à votre compte, accédez au tableau de bord Service Quotas

Important
Comptes AWS Les nouveautés ont réduit la simultanéité et les quotas de mémoire. AWS augmente automatiquement ces quotas en fonction de votre utilisation.
Les sections suivantes répertorient les quotas et limites par défaut dans Lambda par catégorie.
Rubriques
calcul et stockage
Lambda définit des quotas pour les ressources de calcul et de stockage que vous pouvez utiliser afin d’exécuter et de stocker des fonctions. Les quotas d’exécutions simultanées et de stockage s’appliquent par Région AWS. Les quotas d'interface réseau élastique (ENI) s'appliquent par cloud privé virtuel (VPC), quelle que soit la région. Les quotas suivants peuvent être augmentés par rapport à leurs valeurs par défaut. Pour de plus amples informations, veuillez consulter Demande d’augmentation de quota dans le Guide de l’utilisateur Service Quotas.
Ressource | Quota par défaut | Peut être augmentée jusqu’à |
---|---|---|
Exécutions simultanées |
1 000 |
Dizaines de milliers |
Stockage pour les fonctions téléchargées (archives de fichiers .zip) et les couches. Chaque version de fonction et de couche consomme de l’espace de stockage. Pour respecter les bonnes pratiques en matière d’administration du stockage du code, veuillez consulter Surveillance du stockage de code Lambda |
75 Go |
Téra-octets |
Stockage des fonctions définies en tant qu’images de conteneur. Ces images sont stockées sur AmazonECR. |
Consultez les quotas ECR de service Amazon. |
|
Interfaces réseau élastiques par cloud privé virtuel (VPC) NoteCe quota est partagé avec d'autres services, tels qu'Amazon Elastic File System (AmazonEFS). Consultez la section VPCQuotas Amazon. |
500 |
Milliers |
Pour en savoir plus sur la simultanéité et la manière dont Lambda met à l’échelle la simultanéité de votre fonction en réponse au trafic, consultez Présentation de la mise à l’échelle de fonction Lambda.
Configuration, déploiement et exécution de fonction
Les quotas suivants s’appliquent à la configuration, au déploiement et à l’exécution des fonctions. Sauf indication contraire, ils ne peuvent pas être modifiés.
Note
La documentation Lambda, les messages de journal et la console utilisent l’abréviation Mo (plutôt que Mio) pour faire référence à 1024 Ko.
Ressource | Quota |
---|---|
Allocation de mémoire des fonctions |
128 Mo à 10 240 Mo, par incréments de 1 Mo Remarque : Lambda alloue l'CPUénergie proportionnellement à la quantité de mémoire configurée. Vous pouvez augmenter ou diminuer la mémoire et la CPU puissance allouées à votre fonction à l'aide du paramètre Mémoire (Mo). À 1 769 Mo, une fonction a l'équivalent d'un v. CPU |
Délai d’expiration des fonctions |
900 secondes (15 minutes) |
Variables d’environnement des fonctions |
4 Ko, pour toutes les variables d’environnement associées à la fonction, au total |
20 Ko |
|
Couches de fonctions |
cinq couches |
Limite d’échelle de simultanéité des fonctions |
Pour chaque fonction, 1 000 environnements d’exécution toutes les 10 secondes |
Charge utile d’invocation (demande et réponse) |
6 Mo chacun pour la demande et la réponse (synchrone) 20 Mo pour chaque réponse diffusée (synchrone). La taille de la charge utile pour les réponses diffusées en continu peut être augmentée par rapport aux valeurs par défaut. Contactez-nous Support pour en savoir plus.) 256 Ko (asynchrone) 1 Mo pour la taille totale combinée de la ligne de demande et des valeurs d'en-tête |
Bande passante pour les réponses diffusées |
Non plafonné pour les 6 premiers Mo de la réponse de votre fonction Pour les réponses supérieures à 6 Mo, 2 MBps pour le reste de la réponse |
50 Mo (compressés, lors du téléchargement via le API Lambda SDKs ou). Importez des fichiers plus volumineux avec Amazon S3. 50 Mo (en cas de téléchargement via la console Lambda) 250 Mo Taille maximale du contenu d'un package de déploiement, y compris les couches et les environnements d'exécution personnalisés. (dézippé) |
|
Taille des paramètres de l’image de conteneur |
16 Ko |
Taille du package du code de l’image de conteneur |
10 Go (taille maximale de l’image non compressée, comprenant toutes les couches) |
Événements de test (éditeur de console) |
10 |
Stockage dans le répertoire |
Entre 512 Mo et 10 240 Mo par incréments de 1 Mo |
Descripteurs de fichier |
1,024 |
Processus/threads d’exécution |
1,024 |
Requêtes Lambda API
Les quotas suivants sont associés aux requêtes LambdaAPI.
Ressource | Quota |
---|---|
Demandes d’invocation par fonction par région (synchrone) |
Chaque instance de votre environnement d’exécution peut servir jusqu’à 10 demandes par seconde. En d’autres termes, la limite d’invocation totale correspond à 10 fois votre limite de simultanéité. Consultez Présentation de la mise à l’échelle de fonction Lambda. |
Demandes d’invocation par fonction par région (asynchrone) |
Chaque instance de votre environnement d’exécution peut servir un nombre illimité de demandes. En d’autres termes, la limite d’invocation totale est basée uniquement sur la simultanéité disponible pour votre fonction. Consultez Présentation de la mise à l’échelle de fonction Lambda. |
Demandes d’invocation par version ou alias de fonction (demandes par seconde) |
10 x simultanéité provisionnée NoteCe quota s’applique uniquement aux fonctions qui utilisent la simultanéité provisionnée. |
GetFunctionAPIdemandes |
100 requêtes par seconde. Ne peut pas être augmenté. |
GetPolicyAPIdemandes |
15 requêtes par seconde. Ne peut pas être augmenté. |
Reste des API demandes du plan de contrôle (à l'exclusion de l'invocation et GetFunction des GetPolicy demandes) |
15 demandes par seconde en tout APIs (et non 15 demandes par seconde par secondeAPI). Ne peut pas être augmenté. |
Autres services
Les quotas pour d'autres services, tels que AWS Identity and Access Management (IAM), Amazon CloudFront (Lambda @Edge) et Amazon Virtual Private Cloud (AmazonVPC), peuvent avoir un impact sur vos fonctions Lambda. Pour plus d’informations, consultez Quotas Service AWS dans le Référence générale d'Amazon Web Services et Invoquer Lambda avec des événements provenant d'autres services AWS.
De nombreuses applications impliquant Lambda utilisent plusieurs AWS services. Étant donné que les différents services ont des quotas différents pour les différentes fonctionnalités, il peut être difficile de gérer ces quotas dans l'ensemble de votre application. Par exemple, API Gateway a une limite de fréquence par défaut de 10 000 requêtes par seconde, tandis que Lambda a une limite de simultanéité par défaut de 1 000. En raison de cette incompatibilité, il est possible que Lambda puisse traiter un plus grand nombre de demandes entrantes provenant de API Gateway. Vous pouvez résoudre ce problème en demandant une augmentation de la limite de simultanéité Lambda pour correspondre au niveau de trafic attendu.
Le test de charge de votre application vous permet de surveiller les performances de votre application end-to-end avant de la déployer en production. Lors d'un test de charge, vous pouvez identifier les quotas susceptibles de limiter les niveaux de trafic que vous attendez et prendre les mesures nécessaires en conséquence.