Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Inférence en temps réel
L'inférence en temps réel est idéale pour les charges de travail d'inférence où vous avez des exigences en temps réel, interactives et à faible latence. Vous pouvez déployer votre modèle sur des services d' SageMaker hébergement et obtenir un point de terminaison pouvant être utilisé à des fins d'inférence. Ces points de terminaison sont entièrement gérés et prennent en charge la scalabilité automatique (voir Mise à l'échelle automatique des SageMaker modèles Amazon).
Rubriques
- Déployez des modèles pour une inférence en temps réel
- Invoquez des modèles pour une inférence en temps réel
- Points de terminaison
- Options d'hébergement
- Mise à l'échelle automatique des SageMaker modèles Amazon
- Volumes de stockage des instances
- Validation des modèles en production
- Explicabilité en ligne avec Clarify SageMaker