Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Utilizzo di istanze del notebook per creare modelli
Uno dei modi migliori per i professionisti del machine learning (ML) di usare Amazon SageMaker è addestrare e distribuire modelli di machine learning utilizzando SageMaker istanze notebook. Le istanze SageMaker notebook aiutano a creare l'ambiente avviando i server Jupyter su Amazon Elastic Compute Cloud (EC2Amazon) e fornendo kernel preconfigurati con i seguenti pacchetti: Amazon SageMaker SDK Python AWS SDK for Python (Boto3),,AWS CLI(), Conda, Pandas AWS Command Line Interface , librerie framework di deep learning e altre librerie per la scienza dei dati e l'apprendimento automatico.
Machine Learning con SageMaker Python SDK
Per addestrare, convalidare, distribuire e valutare un modello ML in un'istanza SageMaker notebook, usa Python SageMaker . SDK Gli SDK abstract AWS SDK for Python (Boto3) e le operazioni di SageMaker Python. SageMaker API Ti consente di integrare e orchestrare altri AWS servizi, come Amazon Simple Storage Service (Amazon S3) per il salvataggio di dati e artefatti del modello, Amazon Elastic Container Registry ECR () per l'importazione e la manutenzione dei modelli ML, Amazon Elastic Compute Cloud (Amazon) per la formazione e l'inferenza. EC2
Puoi anche sfruttare SageMaker le funzionalità che ti aiutano a gestire ogni fase di un ciclo di machine learning completo: etichettatura dei dati, preelaborazione dei dati, formazione dei modelli, implementazione del modello, valutazione delle prestazioni di previsione e monitoraggio della qualità del modello in produzione.
Se sei un SageMaker utente alle prime armi, ti consigliamo di usare SageMaker SDK Python, seguendo end-to-end il tutorial ML. Per trovare la documentazione open source, consulta Amazon SageMaker Python SDK
Panoramica del tutorial
Questo tutorial introduttivo illustra come creare un'istanza di notebook, aprire un SageMaker notebook Jupyter con un kernel preconfigurato con l'ambiente Conda per l'apprendimento automatico e avviare una sessione per eseguire un SageMaker ciclo di machine learning. end-to-end Imparerai come salvare un set di dati in un bucket Amazon S3 predefinito associato SageMaker automaticamente alla sessione, inviare un processo di formazione su un modello di machine learning ad EC2 Amazon e distribuire il modello addestrato per la previsione ospitando o inferendo in batch tramite Amazon. EC2
Questo tutorial mostra esplicitamente un flusso di apprendimento automatico completo per addestrare il modello dal pool di modelli integrato. XGBoost SageMaker Utilizzi il set di dati del censimento degli adulti degli Stati Uniti
-
SageMakerXGBoost— Il XGBoost
modello è adattato all' SageMaker ambiente e preconfigurato come contenitori Docker. SageMakerfornisce una suite di algoritmi integrati preparati per l'utilizzo delle funzionalità. SageMaker Per ulteriori informazioni su ciò a cui sono adattati gli algoritmi ML SageMaker, consulta Scegli un algoritmo e usa gli algoritmi SageMaker integrati di Amazon. Per le API operazioni dell'algoritmo SageMaker integrato, consulta Algoritmi di prima parte in Amazon Python SageMaker . SDK -
Set di dati Adult Census
: il set di dati del database del Census Bureau del 1994 di Ronny Kohavi e Barry Becker (Data Mining and Visualization, Silicon Graphics). Il SageMaker XGBoost modello viene addestrato utilizzando questo set di dati per prevedere se un individuo guadagna più di 50.000 dollari all'anno o meno.
Argomenti
- Passaggio 1: crea un'istanza Amazon SageMaker Notebook per il tutorial
- Passaggio 2: crea un notebook Jupyter nell'istanza del notebook SageMaker
- Fase 3: scaricare, esplorare e trasformare un set di dati
- Fase 4: addestrare un modello
- Fase 5: Implementazione del modello su Amazon EC2
- Fase 6: valutare il modello
- Fase 7: Pulizia delle risorse delle istanze dei SageMaker notebook Amazon