Utilisation d'instances de bloc-notes pour créer des modèles - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation d'instances de bloc-notes pour créer des modèles

L'un des meilleurs moyens pour les professionnels de l'apprentissage automatique (ML) d'utiliser Amazon SageMaker consiste à former et à déployer des modèles de machine learning à l'aide d'instances de SageMaker bloc-notes. Les instances de SageMaker bloc-notes aident à créer l'environnement en lançant des serveurs Jupyter sur Amazon Elastic Compute Cloud (AmazonEC2) et en fournissant des noyaux préconfigurés contenant les packages suivants : Amazon SageMaker PythonSDK, AWS Command Line Interface (AWS CLI), Conda AWS SDK for Python (Boto3), Pandas, les bibliothèques de framework d'apprentissage profond et d'autres bibliothèques pour la science des données et l'apprentissage automatique.

Machine Learning avec SageMaker Python SDK

Pour entraîner, valider, déployer et évaluer un modèle de machine learning dans une instance de SageMaker notebook, utilisez le SageMaker PythonSDK. Les SDK résumés AWS SDK for Python (Boto3) et les SageMaker API opérations en SageMaker Python. Il vous permet d'intégrer et d'orchestrer d'autres AWS services, tels qu'Amazon Simple Storage Service (Amazon S3) pour enregistrer des données et des artefacts de modèles, Amazon Elastic Container Registry ECR () pour importer et gérer les modèles de ML, Amazon Elastic Compute Cloud (EC2Amazon) pour la formation et l'inférence.

Vous pouvez également tirer parti des SageMaker fonctionnalités qui vous aident à gérer chaque étape d'un cycle complet de machine learning : étiquetage des données, prétraitement des données, formation des modèles, déploiement des modèles, évaluation des performances de prédiction et surveillance de la qualité du modèle en production.

Si vous utilisez le logiciel pour la première SageMaker fois, nous vous recommandons d'utiliser le SageMaker PythonSDK, en suivant le didacticiel end-to-end ML. Pour trouver la documentation open source, consultez Amazon SageMaker Python SDK.

Présentation du tutoriel

Ce didacticiel de mise en route explique comment créer une instance de SageMaker bloc-notes, ouvrir un bloc-notes Jupyter avec un noyau préconfiguré dans l'environnement Conda pour l'apprentissage automatique et démarrer une SageMaker session pour exécuter un cycle ML. end-to-end Vous apprendrez à enregistrer un ensemble de données dans un compartiment Amazon S3 par défaut automatiquement associé à la SageMaker session, à soumettre une tâche de formation sur un modèle de ML à Amazon EC2 et à déployer le modèle entraîné à des fins de prédiction par hébergement ou par inférence par lots via AmazonEC2.

Ce didacticiel montre explicitement un flux ML complet d'entraînement du XGBoost modèle à partir du pool de modèles SageMaker intégré. Vous utilisez l'ensemble de données du recensement des adultes des États-Unis et vous évaluez les performances du SageMaker XGBoost modèle entraîné en matière de prévision du revenu des individus.