Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Uso de instancias de cuadernos para crear modelos
Una de las mejores formas para que los profesionales del aprendizaje automático (ML) utilicen Amazon SageMaker es entrenar e implementar modelos de aprendizaje automático mediante instancias de SageMaker notebook. Las instancias de SageMaker notebook ayudan a crear el entorno al iniciar los servidores de Jupyter en Amazon Elastic Compute Cloud (AmazonEC2) y proporcionar núcleos preconfigurados con los siguientes paquetes: Amazon SageMaker PythonSDK, AWS Command Line Interface (AWS CLI), Conda AWS SDK for Python (Boto3), Pandas, bibliotecas de marcos de aprendizaje profundo y otras bibliotecas para ciencia de datos y aprendizaje automático.
Machine Learning con SageMaker Python SDK
Para entrenar, validar, implementar y evaluar un modelo de aprendizaje automático en una instancia de SageMaker notebook, usa SageMaker PythonSDK. Los SDK resúmenes AWS SDK for Python (Boto3) y las SageMaker API operaciones de SageMaker Python. Le permite integrarse con otros AWS servicios y organizarlos, como Amazon Simple Storage Service (Amazon S3) para guardar datos y artefactos de modelos, Amazon Elastic Container Registry ECR () para importar y reparar los modelos de aprendizaje automático y Amazon Elastic Compute Cloud (EC2Amazon) para el entrenamiento y la inferencia.
También puede aprovechar SageMaker las funciones que lo ayudan a abordar cada etapa de un ciclo completo de aprendizaje automático: etiquetado de datos, preprocesamiento de datos, entrenamiento de modelos, implementación de modelos, evaluación del rendimiento de predicción y monitoreo de la calidad del modelo en producción.
Si es la primera vez que SageMaker lo utiliza, le recomendamos que utilice SageMaker Python SDK siguiendo el tutorial de end-to-end ML. Para encontrar la documentación de código abierto, consulte Amazon SageMaker Python SDK
Información general del tutorial
Este tutorial de introducción explica cómo crear una instancia de SageMaker cuaderno, abrir un cuaderno de Jupyter con un núcleo preconfigurado con el entorno Conda para el aprendizaje automático e iniciar una SageMaker sesión para ejecutar un ciclo de aprendizaje automático. end-to-end Aprenderá a guardar un conjunto de datos en un bucket de Amazon S3 predeterminado que se empareja automáticamente con la SageMaker sesión, a enviar un trabajo de formación de un modelo de aprendizaje automático a Amazon EC2 y a implementar el modelo entrenado para la predicción mediante el alojamiento o la inferencia por lotes a través de AmazonEC2.
En este tutorial se muestra de forma explícita un flujo completo de aprendizaje automático para entrenar el XGBoost modelo a partir del conjunto de modelos SageMaker integrado. Utiliza el conjunto de datos del censo de adultos de EE
-
SageMakerXGBoost— El XGBoost
modelo está adaptado al SageMaker entorno y preconfigurado como contenedores Docker. SageMakerproporciona un conjunto de algoritmos integrados que están preparados para usar SageMaker funciones. Para obtener más información sobre a qué se adaptan los algoritmos de aprendizaje automático SageMaker, consulte Elegir un algoritmo y utilizar los algoritmos SageMaker integrados de Amazon. Para ver las API operaciones de los algoritmos SageMaker integrados, consulte Prist-Party Algorithms en Amazon SageMaker Python SDK . -
Conjunto de datos del censo de adultos
: el conjunto de datos de la base de datos de la oficina del censo de 1994 creado por Ronny Kohavi y Barry Becker (minería y visualización de datos, Silicon Graphics). El SageMaker XGBoost modelo se entrena con este conjunto de datos para predecir si una persona gana más de 50 000$ al año o menos.
Temas
- Paso 1: Crear una instancia de Amazon SageMaker Notebook para el tutorial
- Paso 2: Crea un cuaderno de Jupyter en la instancia de bloc de SageMaker notas
- Paso 4: Descargar, explorar y transformar un conjunto de datos
- Paso 4: Entrenar un modelo
- Paso 5: Implemente el modelo en Amazon EC2
- Paso 6: Evaluar el modelo
- Paso 7: Limpiar los recursos de instancias de Amazon SageMaker Notebook