Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Utilisation d'instances de bloc-notes pour créer des modèles
L'un des meilleurs moyens pour les professionnels de l'apprentissage automatique (ML) d'utiliser Amazon SageMaker consiste à former et à déployer des modèles de machine learning à l'aide d'instances de SageMaker bloc-notes. Les instances de SageMaker bloc-notes aident à créer l'environnement en lançant des serveurs Jupyter sur Amazon Elastic Compute Cloud (AmazonEC2) et en fournissant des noyaux préconfigurés contenant les packages suivants : Amazon SageMaker PythonSDK, AWS Command Line Interface (AWS CLI), Conda AWS SDK for Python (Boto3), Pandas, les bibliothèques de framework d'apprentissage profond et d'autres bibliothèques pour la science des données et l'apprentissage automatique.
Machine Learning avec SageMaker Python SDK
Pour entraîner, valider, déployer et évaluer un modèle de machine learning dans une instance de SageMaker notebook, utilisez le SageMaker PythonSDK. Les SDK résumés AWS SDK for Python (Boto3) et les SageMaker API opérations en SageMaker Python. Il vous permet d'intégrer et d'orchestrer d'autres AWS services, tels qu'Amazon Simple Storage Service (Amazon S3) pour enregistrer des données et des artefacts de modèles, Amazon Elastic Container Registry ECR () pour importer et gérer les modèles de ML, Amazon Elastic Compute Cloud (EC2Amazon) pour la formation et l'inférence.
Vous pouvez également tirer parti des SageMaker fonctionnalités qui vous aident à gérer chaque étape d'un cycle complet de machine learning : étiquetage des données, prétraitement des données, formation des modèles, déploiement des modèles, évaluation des performances de prédiction et surveillance de la qualité du modèle en production.
Si vous utilisez le logiciel pour la première SageMaker fois, nous vous recommandons d'utiliser le SageMaker PythonSDK, en suivant le didacticiel end-to-end ML. Pour trouver la documentation open source, consultez Amazon SageMaker Python SDK
Présentation du tutoriel
Ce didacticiel de mise en route explique comment créer une instance de SageMaker bloc-notes, ouvrir un bloc-notes Jupyter avec un noyau préconfiguré dans l'environnement Conda pour l'apprentissage automatique et démarrer une SageMaker session pour exécuter un cycle ML. end-to-end Vous apprendrez à enregistrer un ensemble de données dans un compartiment Amazon S3 par défaut automatiquement associé à la SageMaker session, à soumettre une tâche de formation sur un modèle de ML à Amazon EC2 et à déployer le modèle entraîné à des fins de prédiction par hébergement ou par inférence par lots via AmazonEC2.
Ce didacticiel montre explicitement un flux ML complet d'entraînement du XGBoost modèle à partir du pool de modèles SageMaker intégré. Vous utilisez l'ensemble de données du recensement des adultes des États-Unis
-
SageMakerXGBoost— Le XGBoost
modèle est adapté à l' SageMaker environnement et préconfiguré sous forme de conteneurs Docker. SageMakerfournit une suite d'algorithmes intégrés préparés pour utiliser les SageMaker fonctionnalités. Pour en savoir plus sur les algorithmes de machine learning adaptés SageMaker, consultez Choisir un algorithme et utiliser les algorithmes SageMaker intégrés d'Amazon. Pour les API opérations d'algorithme SageMaker intégrées, consultez Algorithmes de première partie dans Amazon SageMaker Python SDK . -
Jeu de données du recensement des adultes
– Jeu de données de la base de données du Bureau du recensement de 1994 par Ronny Kohavi et Barry Becker (Data Mining and Visualization, Silicon Graphics). Le SageMaker XGBoost modèle est entraîné à l'aide de cet ensemble de données pour prédire si un individu gagne plus de 50 000$ par an ou moins.
Rubriques
- Étape 1 : créer une instance Amazon SageMaker Notebook pour le didacticiel
- Étape 2 : créer un bloc-notes Jupyter dans l'instance de bloc-notes SageMaker
- Étape 3 : télécharger, explorer et transformer un jeu de données
- Étape 4 : entraîner un modèle
- Étape 5 : Déployer le modèle sur Amazon EC2
- Étape 6 : évaluer le modèle
- Étape 7 : Nettoyer les ressources de l'instance Amazon SageMaker Notebook