Uso de instancias de cuadernos para crear modelos - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso de instancias de cuadernos para crear modelos

Una de las mejores formas para que los profesionales del aprendizaje automático (ML) utilicen Amazon SageMaker es entrenar e implementar modelos de aprendizaje automático mediante instancias de SageMaker notebook. Las instancias de SageMaker notebook ayudan a crear el entorno al iniciar los servidores de Jupyter en Amazon Elastic Compute Cloud (AmazonEC2) y proporcionar núcleos preconfigurados con los siguientes paquetes: Amazon SageMaker PythonSDK, AWS Command Line Interface (AWS CLI), Conda AWS SDK for Python (Boto3), Pandas, bibliotecas de marcos de aprendizaje profundo y otras bibliotecas para ciencia de datos y aprendizaje automático.

Machine Learning con SageMaker Python SDK

Para entrenar, validar, implementar y evaluar un modelo de aprendizaje automático en una instancia de SageMaker notebook, usa SageMaker PythonSDK. Los SDK resúmenes AWS SDK for Python (Boto3) y las SageMaker API operaciones de SageMaker Python. Le permite integrarse con otros AWS servicios y organizarlos, como Amazon Simple Storage Service (Amazon S3) para guardar datos y artefactos de modelos, Amazon Elastic Container Registry ECR () para importar y reparar los modelos de aprendizaje automático y Amazon Elastic Compute Cloud (EC2Amazon) para el entrenamiento y la inferencia.

También puede aprovechar SageMaker las funciones que lo ayudan a abordar cada etapa de un ciclo completo de aprendizaje automático: etiquetado de datos, preprocesamiento de datos, entrenamiento de modelos, implementación de modelos, evaluación del rendimiento de predicción y monitoreo de la calidad del modelo en producción.

Si es la primera vez que SageMaker lo utiliza, le recomendamos que utilice SageMaker Python SDK siguiendo el tutorial de end-to-end ML. Para encontrar la documentación de código abierto, consulte Amazon SageMaker Python SDK.

Información general del tutorial

Este tutorial de introducción explica cómo crear una instancia de SageMaker cuaderno, abrir un cuaderno de Jupyter con un núcleo preconfigurado con el entorno Conda para el aprendizaje automático e iniciar una SageMaker sesión para ejecutar un ciclo de aprendizaje automático. end-to-end Aprenderá a guardar un conjunto de datos en un bucket de Amazon S3 predeterminado que se empareja automáticamente con la SageMaker sesión, a enviar un trabajo de formación de un modelo de aprendizaje automático a Amazon EC2 y a implementar el modelo entrenado para la predicción mediante el alojamiento o la inferencia por lotes a través de AmazonEC2.

En este tutorial se muestra de forma explícita un flujo completo de aprendizaje automático para entrenar el XGBoost modelo a partir del conjunto de modelos SageMaker integrado. Utiliza el conjunto de datos del censo de adultos de EE. UU. y evalúa el rendimiento del SageMaker XGBoost modelo entrenado a la hora de predecir los ingresos de las personas.