Capture de données - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Capture de données

Pour journaliser les entrées de votre point de terminaison et les sorties d'inférence de votre modèle déployé sur Amazon S3, vous pouvez activer une fonction appelée Data Capture (Capture de données). La fonction Data Capture (Capture de données) est généralement utilisée pour enregistrer des informations qui peuvent être utilisées pour l'entraînement, le débogage et la surveillance. Amazon SageMaker Model Monitor analyse automatiquement ces données capturées et compare les mesures issues de ces données avec une référence que vous créez pour le modèle. Pour obtenir plus d'informations sur Model Monitor, consultez Surveillance de la qualité des données et des modèles avec Amazon SageMaker Model Monitor.

Vous pouvez implémenter la capture de données à la fois pour les modes de surveillance du modèle en temps réel et par lots à l'aide de AWS SDK for Python (Boto) Python SageMaker . SDK Pour un point de terminaison en temps réel, vous devez spécifier votre configuration de Data Capture (Capture de données) lors de la création de votre point de terminaison. En raison de la nature persistante de votre point de terminaison en temps réel, vous pouvez configurer des options supplémentaires pour activer ou désactiver la capture de données à certains moments, ou modifier la fréquence d'échantillonnage. Vous pouvez également choisir de chiffrer vos données d'inférence.

Pour une tâche de transformation par lots, vous pouvez activer Data Capture (Capture de données) si vous souhaitez exécuter une surveillance des modèles dans les délais ou une surveillance continue des modèles pour des tâches de transformation par lots régulières et périodiques. Vous spécifierez votre configuration de Data Capture (Capture de données) lorsque vous créerez votre tâche de transformation par lots. Dans cette configuration, vous avez la possibilité d'activer le chiffrement ou de générer l'identifiant d'inférence avec votre sortie, ce qui vous permet de faire correspondre vos données capturées aux données Ground Truth.