SageMaker Pilota automatico - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

SageMaker Pilota automatico

Importante

A partire dal 30 novembre 2023, l'interfaccia utente di Autopilot sta migrando su SageMaker Amazon Canvas come parte dell'esperienza Amazon SageMaker Studio aggiornata. SageMaker Canvas offre agli analisti e ai citizen data scientist funzionalità senza codice per attività come la preparazione dei dati, l'ingegneria delle funzionalità, la selezione degli algoritmi, la formazione e l'ottimizzazione, l'inferenza e altro ancora. Gli utenti possono sfruttare le visualizzazioni integrate e l'analisi ipotetica per esplorare i propri dati e diversi scenari, con previsioni automatizzate che consentono loro di produrre facilmente i propri modelli. Canvas supporta una varietà di casi d'uso, tra cui visione artificiale, previsione della domanda, ricerca intelligente e intelligenza artificiale generativa.

Gli utenti di Amazon SageMaker Studio Classic, l'esperienza precedente di Studio, possono continuare a utilizzare l'interfaccia utente Autopilot in Studio Classic. Gli utenti con esperienza di programmazione possono continuare a utilizzare tutti i APIriferimenti in qualsiasi implementazione tecnica supportataSDK.

Se hai utilizzato Autopilot in Studio Classic fino ad ora e desideri migrare a SageMaker Canvas, potresti dover concedere autorizzazioni aggiuntive al tuo profilo utente o IAM ruolo in modo da poter creare e utilizzare l'applicazione Canvas. SageMaker Per ulteriori informazioni, consulta (Facoltativo) Esegui la migrazione da Autopilot in Studio Classic a Canvas SageMaker .

Tutte le istruzioni relative all'interfaccia utente contenute in questa guida riguardano le funzionalità autonome di Autopilot prima della migrazione ad Amazon Canvas. SageMaker Gli utenti che seguono queste istruzioni devono utilizzare Studio Classic.

Amazon SageMaker Autopilot è un set di funzionalità che semplifica e accelera varie fasi del flusso di lavoro di machine learning automatizzando il processo di creazione e distribuzione di modelli di machine learning (AutoML). La pagina seguente spiega le informazioni chiave su Amazon SageMaker Autopilot.

Autopilot esegue le seguenti attività chiave che puoi utilizzare con il pilota automatico o con vari gradi di guida umana:

  • Analisi e preelaborazione dei dati: Autopilot identifica il tipo di problema specifico, gestisce i valori mancanti, normalizza i dati, seleziona le funzionalità e nel complesso prepara i dati per l'addestramento dei modelli.

  • Selezione del modello: Autopilot esplora una varietà di algoritmi e utilizza una tecnica di ricampionamento a convalida incrociata per generare metriche che valutano la qualità predittiva degli algoritmi sulla base di metriche oggettive predefinite.

  • Ottimizzazione degli iperparametri: Autopilot automatizza la ricerca di configurazioni iperparametriche ottimali.

  • Addestramento e valutazione dei modelli: Autopilot automatizza il processo di formazione e valutazione di vari modelli candidati. Suddivide i dati in set di addestramento e convalida, addestra i candidati modello selezionati utilizzando i dati di addestramento e valuta le loro prestazioni sulla base dei dati invisibili del set di convalida. Infine, classifica i modelli candidati ottimizzati in base alle loro prestazioni e identifica il modello con le migliori prestazioni.

  • Implementazione del modello: una volta identificato il modello con le migliori prestazioni, Autopilot offre la possibilità di implementarlo automaticamente generando gli artefatti del modello e l'endpoint che espone un. API Le applicazioni esterne possono inviare dati all'endpoint e ricevere le previsioni o le inferenze corrispondenti.

Autopilot supporta la creazione di modelli di machine learning su set di dati di grandi dimensioni, fino a centinaia di. GBs

Il diagramma seguente illustra le attività di questo processo AutoML gestito da Autopilot.

Panoramica del processo Amazon SageMaker Autopilot AutoML.

A seconda del tuo livello di dimestichezza con il processo di machine learning e l'esperienza di programmazione, puoi usare Autopilot in diversi modi:

  • Utilizzando l'interfaccia utente di Studio Classic, gli utenti possono scegliere tra un'esperienza senza codice o un certo livello di input umano.

    Nota

    Solo gli esperimenti creati da dati tabulari per tipi di problemi come la regressione o la classificazione sono disponibili tramite l'interfaccia utente di Studio Classic.

  • Utilizzando AutoML API, gli utenti con esperienza di programmazione possono utilizzare available per SDKs creare lavori AutoML. Questo approccio offre maggiore flessibilità e opzioni di personalizzazione ed è disponibile per tutti i tipi di problemi.

La attualmente Autopilot supporta i seguenti tipi di problemi:

Nota

Per problemi di regressione o classificazione che coinvolgono dati tabulari, gli utenti possono scegliere tra due opzioni: utilizzare l'interfaccia utente di Studio Classic o Reference. API

Attività come la classificazione di testo e immagini, la previsione di serie temporali e la messa a punto di modelli linguistici di grandi dimensioni sono disponibili esclusivamente tramite la versione 2 di AutoML. REST API Se il linguaggio che preferisci è Python, puoi fare riferimento AWS SDK for Python (Boto3)o direttamente all'MLV2oggetto Auto di Amazon Python SageMaker . SDK

Gli utenti che preferiscono la comodità di un'interfaccia utente possono utilizzare Amazon SageMaker Canvas per accedere a modelli pre-addestrati e modelli di base di intelligenza artificiale generativa o creare modelli personalizzati su misura per testi specifici, classificazione delle immagini, esigenze di previsione o intelligenza artificiale generativa.

Inoltre, Autopilot aiuta gli utenti a capire come i modelli effettuano previsioni generando automaticamente report che mostrano l'importanza di ogni singola funzionalità. Ciò fornisce trasparenza e informazioni sui fattori che influenzano le previsioni, che possono essere utilizzate dai team di rischio e conformità e dalle autorità di regolamentazione esterne. Autopilot fornisce anche un modello di rapporto sulle prestazioni, che comprende un riepilogo delle metriche di valutazione, una matrice di confusione, varie visualizzazioni come le curve caratteristiche di funzionamento del ricevitore e le curve di richiamo di precisione e altro ancora. Il contenuto specifico di ogni rapporto varia a seconda del tipo di problema dell'esperimento Autopilot.

I report sulla spiegabilità e sulle prestazioni per il miglior modello candidato in un esperimento Autopilot sono disponibili per i tipi di problemi di classificazione di dati di testo, immagini e tabelle.

Per casi d'uso di dati tabulari come la regressione o la classificazione, Autopilot offre una visibilità aggiuntiva sul modo in cui i dati sono stati gestiti e su come i candidati al modello sono stati selezionati, addestrati e ottimizzati generando notebook che contengono il codice utilizzato per esplorare i dati e trovare il modello con le migliori prestazioni. Questi notebook forniscono un ambiente interattivo ed esplorativo per aiutarti a conoscere l'impatto di vari input o i compromessi raggiunti negli esperimenti. È possibile sperimentare ulteriormente con il modello candidato dalle prestazioni più elevate apportando le proprie modifiche ai notebook per l'esplorazione dei dati e la definizione dei candidati forniti da Autopilot.

Con Amazon SageMaker, paghi solo per ciò che usi. Paghi per le risorse di elaborazione e archiviazione sottostanti all'interno dei SageMaker nostri altri AWS servizi, in base all'utilizzo. Per ulteriori informazioni sui costi di utilizzo SageMaker, consulta la pagina SageMakerdei prezzi di Amazon.