calcul et stockage Configuration, déploiement et exécution de fonction Requêtes d’API Lambda MicroVM Autres services

Quotas Lambda

Important

Comptes AWS Les nouveautés ont réduit la simultanéité et les quotas de mémoire pour les fonctions Lambda et les microVM Lambda. AWS augmente automatiquement ces quotas en fonction de votre utilisation.

AWS Lambda est conçu pour évoluer rapidement afin de répondre à la demande, ce qui permet à vos fonctions de s'adapter au trafic de votre application. Lambda est conçu pour les tâches de calcul de courte durée qui ne conservent pas ou ne dépendent pas de l’état entre les invocations. Le code peut être exécuté pendant 15 minutes au cours d’une seule invocation et chaque fonction peut utiliser jusqu’à 10 240 Mo de mémoire.

Il est important de comprendre les garde-fous mis en place pour protéger votre compte et la charge de travail des autres clients. Les quotas de service existent dans tous les AWS services et se composent de limites strictes, que vous ne pouvez pas modifier, et de limites souples, pour lesquelles vous pouvez demander des augmentations. Par défaut, tous les nouveaux comptes se voient attribuer un profil de quota qui permet d'explorer AWS les services.

Pour voir les quotas qui s’appliquent à votre compte, accédez au tableau de bord Service Quotas. Ici, vous pouvez consulter vos quotas de service, demander une augmentation de quota et consulter l’utilisation actuelle. À partir de là, vous pouvez accéder à un AWS service spécifique, tel que Lambda :

Les sections suivantes répertorient les quotas et limites par défaut dans Lambda par catégorie.

Rubriques

calcul et stockage
Configuration, déploiement et exécution de fonction
Requêtes d’API Lambda
MicroVM Lambda
Autres services

calcul et stockage

Lambda définit des quotas pour les ressources de calcul et de stockage que vous pouvez utiliser afin d’exécuter et de stocker des fonctions. Les quotas d’exécutions simultanées et de stockage s’appliquent par Région AWS. Les quotas d’Interface réseau Elastic (ENI) s’appliquent par cloud privé virtuel (VPC), quelle que soit la Région. Les quotas suivants peuvent être augmentés par rapport à leurs valeurs par défaut. Pour de plus amples informations, veuillez consulter Demande d’augmentation de quota dans le Guide de l’utilisateur Service Quotas.

Ressource	Quota par défaut	Peut être augmentée jusqu’à
Exécutions simultanées	1 000	Dizaines de milliers
Stockage des fonctions téléchargées (archives de fichiers .zip) et des couches à l'aide du Lambda-managed stockage. Chaque version de fonction et de couche consomme de l’espace de stockage. Pour éviter les limites de stockage, vous pouvez configurer vos fonctions et vos couches pour qu'elles utilisent plutôt un stockage de code S3 autogéré. Pour respecter les bonnes pratiques en matière d’administration du stockage du code, veuillez consulter Surveillance du stockage de code Lambda dans Serverless Land.	300 Go (décompressé)	Non augmentable. Utilisez le stockage de code S3 autogéré pour le stockage au-delà de cette limite.
Stockage des fonctions définies en tant qu’images de conteneur. Ces images sont stockées dans Amazon ECR.	Consultez Service Quotas Amazon ECR.
Interfaces réseau Elastic par cloud privé virtuel (VPC) Note Ce quota est partagé avec d’autres services, tels qu’Amazon Elastic File System (Amazon EFS). Consultez Quotas Amazon VPC.	500	Milliers
Exécutions durables maximales	1 000 000	Des millions

Pour en savoir plus sur la simultanéité et la manière dont Lambda met à l’échelle la simultanéité de votre fonction en réponse au trafic, consultez Présentation de la mise à l’échelle de fonction Lambda.

Configuration, déploiement et exécution de fonction

Les quotas suivants s’appliquent à la configuration, au déploiement et à l’exécution des fonctions. Sauf indication contraire, ils ne peuvent pas être modifiés.

Note

La documentation Lambda, les messages de journal et la console utilisent l’abréviation Mo (plutôt que Mio) pour faire référence à 1024 Ko.

Ressource	Quota
Allocation de mémoire des fonctions	128 Mo à 10 240 Mo, par incréments de 1 Mo Remarque : Lambda alloue de la puissance d’UC en fonction de la quantité de mémoire configurée. Vous pouvez augmenter ou réduire la mémoire et la puissance d’UC allouées à votre fonction à l’aide du paramètre Mémoire (Mo). À 1 769 Mo, une fonction possède l’équivalent d’un vCPU.
Délai d’expiration des fonctions	900 secondes (15 minutes)
Variables d’environnement des fonctions	4 Ko, pour toutes les variables d’environnement associées à la fonction, au total
stratégie de fonction basée sur les ressources	20 Ko
Couches de fonctions	5 couches
Limite d’échelle de simultanéité des fonctions	Pour chaque fonction, 1 000 environnements d’exécution toutes les 10 secondes
Charge utile d’invocation (demande et réponse)	6 Mo chacun pour la demande et la réponse (synchrone) 200 Mo pour chaque réponse diffusée (synchrone) 1 Mo (asynchrone) 1 Mo pour la taille totale combinée des valeurs de ligne de requête et d’en-tête
Bande passante pour les réponses diffusées	Non plafonné pour les 6 premiers Mo de la réponse de votre fonction Pour les réponses supérieures à 6 Mo, 2 Mbit/s pour le reste de la réponse
Taille du package de déploiement (archive de fichiers .zip)	50 Mo (compressés, lors du chargement via l’API Lambda ou les SDK). Chargez vos fichiers sur Amazon S3. 50 Mo (en cas de chargement via la console Lambda) 250 Mo La taille maximale du contenu d’un package de déploiement, y compris les couches et les environnements d’exécution personnalisés. (décompressé)
Taille des paramètres de l’image de conteneur	16 Ko
Taille du package du code de l’image de conteneur	10 Go (taille maximale de l’image non compressée, comprenant toutes les couches)
Événements de test (éditeur de console)	10
Stockage dans le répertoire `/tmp`	Entre 512 Mo et 10 240 Mo par incréments de 1 Mo
Descripteurs de fichier	1,024 Note Les instances gérées Lambda utilisent une limite de descripteurs de fichiers plus élevée de 4 096. Pour de plus amples informations, veuillez consulter Comprendre l'environnement d'exécution des instances gérées Lambda.
Exécution processes/threads	1,024 Note Les instances gérées Lambda utilisent les limites de processus et de thread par défaut de Bottlerocket. Pour de plus amples informations, veuillez consulter Comprendre l'environnement d'exécution des instances gérées Lambda.
Nombre maximum d'opérations durables par exécution durable	3 000 Note Pour plus d'informations, consultez la section Opérations durables disponibles.
Stockage d'exécution durable écrit en mégaoctets	100 Mo Note Taille de charge utile cumulée maintenue par des fonctions durables par exécution. Pour plus d'informations, consultez la section Données persistantes par opération durable.

Requêtes d’API Lambda

Les quotas suivants sont associés aux demandes d’API Lambda.

Ressource	Quota
Demandes d’invocation par fonction par région (synchrone)	Chaque instance de votre environnement d’exécution peut servir jusqu’à 10 demandes par seconde. En d’autres termes, la limite d’invocation totale correspond à 10 fois votre limite de simultanéité. Consultez Présentation de la mise à l’échelle de fonction Lambda.
Demandes d’invocation par fonction par région (asynchrone)	Chaque instance de votre environnement d’exécution peut servir un nombre illimité de demandes. En d’autres termes, la limite d’invocation totale est basée uniquement sur la simultanéité disponible pour votre fonction. Consultez Présentation de la mise à l’échelle de fonction Lambda.
Demandes d’invocation par version ou alias de fonction (demandes par seconde)	10 x simultanéité provisionnée Note Ce quota s’applique uniquement aux fonctions qui utilisent la simultanéité provisionnée.
Demandes d'API GetFunction	100 requêtes par seconde. Il ne peut pas être augmenté.
Demandes d'API GetPolicy	15 requêtes par seconde. Il ne peut pas être augmenté.
Demandes d'API CheckpointDurableExecution	1 000 demandes par seconde.
Demandes d'API GetDurableExecution	30 requêtes par seconde.
Demandes d'API GetDurableExecutionHistory	15 requêtes par seconde.
Demandes d'API GetDurableExecutionState	1 000 demandes par seconde.
Demandes d'API ListDurableExecutionsByFunction	15 requêtes par seconde.
Demandes d'API SendDurableExecutionCallbackFailure	300 requêtes par seconde.
Demandes d'API SendDurableExecutionCallbackHeartbeat	300 requêtes par seconde.
Demandes d'API SendDurableExecutionCallbackSuccess	300 requêtes par seconde.
Demandes d'API StopDurableExecution	30 requêtes par seconde.
Reste des demandes d'API du plan de contrôle (à l'exclusion de l'invocation et GetFunction des GetPolicy demandes)	15 requêtes par seconde pour l’ensemble des API (et non 15 requêtes par seconde par API). Il ne peut pas être augmenté.

MicroVM Lambda

Lambda MicroVMS définit des quotas pour les requêtes de calcul, de stockage et d'API. Les quotas marqués comme ajustables peuvent être augmentés via la console Service Quotas.

Note

Les microVM Lambda prennent en charge l'architecture ARM64 (Graviton).AWS

calcul et stockage

Ressource	Quota par défaut	Ajustable
Mémoire allouée sur toutes les microVM (par compte, par région)	400 Go (c'est-à-dire 200 microVM avec 2 Go de mémoire configurée chacune ou 400 microVM avec 1 Go de mémoire configurée chacune). 1 024 Go dans l'est des États-Unis (Virginie du Nord), l'ouest des États-Unis (Oregon), l'est des États-Unis (Ohio) et l'Asie-Pacifique (Tokyo) (soit 512 microVM avec 2 Go de mémoire configurée chacune ou 1 024 microVM avec 1 Go de mémoire configurée chacune). Peut être utilisé jusqu'à quatre fois ce quota.	Oui
Durée d'exécution maximale par microVM	8 heures (28 800 secondes)	Non

Ressource

Quota par défaut

Ajustable

Mémoire allouée sur toutes les microVM (par compte, par région)

400 Go (c'est-à-dire 200 microVM avec 2 Go de mémoire configurée chacune ou 400 microVM avec 1 Go de mémoire configurée chacune).

1 024 Go dans l'est des États-Unis (Virginie du Nord), l'ouest des États-Unis (Oregon), l'est des États-Unis (Ohio) et l'Asie-Pacifique (Tokyo) (soit 512 microVM avec 2 Go de mémoire configurée chacune ou 1 024 microVM avec 1 Go de mémoire configurée chacune).

Peut être utilisé jusqu'à quatre fois ce quota.

Oui

Durée d'exécution maximale par microVM

8 heures (28 800 secondes)

Non

Images et versions

Ressource	Quota par défaut	Ajustable
Images microVM par compte et par région	100	Oui
Versions par image microVM	50	Oui
Créations d'images simultanées (par compte, par région)	5 10 dans l'est des États-Unis (Virginie du Nord), l'ouest des États-Unis (Oregon), l'est des États-Unis (Ohio) et l'Asie-Pacifique (Tokyo)	Oui

Ressource

Quota par défaut

Ajustable

Images microVM par compte et par région

100

Oui

Versions par image microVM

Oui

Créations d'images simultanées (par compte, par région)

10 dans l'est des États-Unis (Virginie du Nord), l'ouest des États-Unis (Oregon), l'est des États-Unis (Ohio) et l'Asie-Pacifique (Tokyo)

Oui

Per-MicroVM débit

Ressource	Limite	Ajustable
Connexions simultanées par microVM	8 (1 vCPU), 16 (2 vCPU), 32 (4 vCPU), 64 (8 vCPU), 128 (16 vCPU)	Non
Demandes par seconde par microVM	40 (4 vCPU 8 Go), 160 (16 vCPU 32 Go)	Non

limites de débit d’API

Opération API	Tarif (TPS)	Mode rafale	Ajustable
`RunMicrovm`	5	5	Oui
`ResumeMicrovm`	5	5	Oui
`SuspendMicrovm`	2	2	Oui
`TerminateMicrovm`	10	10	Oui
`GetMicrovm`	100	100	Oui
`CreateMicrovmAuthToken`	50	50	Oui
`CreateMicrovmShellAuthToken`	5	5	Oui

Note

TPS = transactions par seconde. Ces limites de taux s'appliquent par compte et par région. Réessayez les demandes limitées en utilisant un retard exponentiel avec instabilité.

Autres services

Les quotas pour d'autres services, tels que Gestion des identités et des accès AWS (IAM), Amazon CloudFront (Lambda @Edge) et Amazon Virtual Private Cloud (Amazon VPC), peuvent avoir un impact sur vos fonctions Lambda. Pour plus d’informations, consultez Quotas Service AWS dans le Référence générale d'Amazon Web Services et Invoquer Lambda avec des événements provenant d'autres AWS services.

De nombreuses applications impliquant Lambda utilisent plusieurs AWS services. Étant donné que les différents services ont des quotas différents pour différentes fonctionnalités, il peut être difficile de gérer ces quotas dans l’ensemble de votre application. API Gateway a une limitation par défaut de 10 000 requêtes par seconde, alors que Lambda a une limitation par défaut de 1 000. En raison de cette incompatibilité, il est possible qu’API Gateway envoie plus de demandes que ce que Lambda peut traiter. Ce problème peut être résolu en demandant que la limite de simultanéité de Lambda soit augmentée afin qu’elle corresponde au niveau de trafic attendu.

Le test de charge de votre application vous permet de surveiller les performances de votre de bout en bout avant son déploiement en production. Lors d’un test de charge, vous pouvez identifier les quotas susceptibles de limiter les niveaux de trafic que vous attendez et prendre les mesures nécessaires en conséquence.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Création et test d’une application sans serveur

Historique de la documentation