Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
SageMaker Pilota automatico
Importante
A partire dal 30 novembre 2023, l'interfaccia utente di Autopilot sta migrando su SageMaker Amazon Canvas come parte dell'esperienza Amazon SageMaker Studio aggiornata. SageMaker Canvas offre agli analisti e ai citizen data scientist funzionalità senza codice per attività come la preparazione dei dati, l'ingegneria delle funzionalità, la selezione degli algoritmi, la formazione e l'ottimizzazione, l'inferenza e altro ancora. Gli utenti possono sfruttare le visualizzazioni integrate e l'analisi ipotetica per esplorare i propri dati e diversi scenari, con previsioni automatizzate che consentono loro di produrre facilmente i propri modelli. Canvas supporta una varietà di casi d'uso, tra cui visione artificiale, previsione della domanda, ricerca intelligente e intelligenza artificiale generativa.
Gli utenti di Amazon SageMaker Studio Classic, l'esperienza precedente di Studio, possono continuare a utilizzare l'interfaccia utente Autopilot in Studio Classic. Gli utenti con esperienza di programmazione possono continuare a utilizzare tutti i APIriferimenti in qualsiasi implementazione tecnica supportataSDK.
Se hai utilizzato Autopilot in Studio Classic fino ad ora e desideri migrare a SageMaker Canvas, potresti dover concedere autorizzazioni aggiuntive al tuo profilo utente o IAM ruolo in modo da poter creare e utilizzare l'applicazione Canvas. SageMaker Per ulteriori informazioni, consulta (Facoltativo) Esegui la migrazione da Autopilot in Studio Classic a Canvas SageMaker .
Tutte le istruzioni relative all'interfaccia utente contenute in questa guida riguardano le funzionalità autonome di Autopilot prima della migrazione ad Amazon Canvas. SageMaker Gli utenti che seguono queste istruzioni devono utilizzare Studio Classic.
Amazon SageMaker Autopilot è un set di funzionalità che semplifica e accelera varie fasi del flusso di lavoro di machine learning automatizzando il processo di creazione e distribuzione di modelli di machine learning (AutoML). La pagina seguente spiega le informazioni chiave su Amazon SageMaker Autopilot.
Autopilot esegue le seguenti attività chiave che puoi utilizzare con il pilota automatico o con vari gradi di guida umana:
-
Analisi e preelaborazione dei dati: Autopilot identifica il tipo di problema specifico, gestisce i valori mancanti, normalizza i dati, seleziona le funzionalità e nel complesso prepara i dati per l'addestramento dei modelli.
-
Selezione del modello: Autopilot esplora una varietà di algoritmi e utilizza una tecnica di ricampionamento a convalida incrociata per generare metriche che valutano la qualità predittiva degli algoritmi sulla base di metriche oggettive predefinite.
-
Ottimizzazione degli iperparametri: Autopilot automatizza la ricerca di configurazioni iperparametriche ottimali.
-
Addestramento e valutazione dei modelli: Autopilot automatizza il processo di formazione e valutazione di vari modelli candidati. Suddivide i dati in set di addestramento e convalida, addestra i candidati modello selezionati utilizzando i dati di addestramento e valuta le loro prestazioni sulla base dei dati invisibili del set di convalida. Infine, classifica i modelli candidati ottimizzati in base alle loro prestazioni e identifica il modello con le migliori prestazioni.
-
Implementazione del modello: una volta identificato il modello con le migliori prestazioni, Autopilot offre la possibilità di implementarlo automaticamente generando gli artefatti del modello e l'endpoint che espone un. API Le applicazioni esterne possono inviare dati all'endpoint e ricevere le previsioni o le inferenze corrispondenti.
Autopilot supporta la creazione di modelli di machine learning su set di dati di grandi dimensioni, fino a centinaia di. GBs
Il diagramma seguente illustra le attività di questo processo AutoML gestito da Autopilot.
A seconda del tuo livello di dimestichezza con il processo di machine learning e l'esperienza di programmazione, puoi usare Autopilot in diversi modi:
-
Utilizzando l'interfaccia utente di Studio Classic, gli utenti possono scegliere tra un'esperienza senza codice o un certo livello di input umano.
Nota
Solo gli esperimenti creati da dati tabulari per tipi di problemi come la regressione o la classificazione sono disponibili tramite l'interfaccia utente di Studio Classic.
-
Utilizzando AutoML API, gli utenti con esperienza di programmazione possono utilizzare available per SDKs creare lavori AutoML. Questo approccio offre maggiore flessibilità e opzioni di personalizzazione ed è disponibile per tutti i tipi di problemi.
La attualmente Autopilot supporta i seguenti tipi di problemi:
Nota
Attività come la classificazione di testo e immagini, la previsione di serie temporali e la messa a punto di modelli linguistici di grandi dimensioni sono disponibili esclusivamente tramite la versione 2 di AutoML. REST API Se il linguaggio che preferisci è Python, puoi fare riferimento AWS SDK for Python (Boto3)
Gli utenti che preferiscono la comodità di un'interfaccia utente possono utilizzare Amazon SageMaker Canvas per accedere a modelli pre-addestrati e modelli di base di intelligenza artificiale generativa o creare modelli personalizzati su misura per testi specifici, classificazione delle immagini, esigenze di previsione o intelligenza artificiale generativa.
-
Classificazione di regressione, binaria e multiclasse con dati tabulari formattati come CSV file Parquet in cui ogni colonna contiene una funzionalità con un tipo di dati specifico e ogni riga contiene un'osservazione. I tipi di dati delle colonne accettati includono serie numeriche, categoriali, testuali e temporali costituite da stringhe di numeri separati da virgole.
-
Per creare un lavoro Autopilot come esperimento pilota utilizzando il riferimento, vedere. SageMaker API Crea lavori di regressione o classificazione per dati tabulari utilizzando AutoML API
-
Per creare un lavoro Autopilot come esperimento pilota utilizzando l'interfaccia utente di Studio Classic, vedi. Crea un esperimento di regressione o classificazione automatica per dati tabulari utilizzando l'interfaccia utente di Studio Classic
-
Se sei un amministratore e desideri preconfigurare i parametri predefiniti di infrastruttura, rete o sicurezza degli esperimenti Autopilot nell'interfaccia utente di Studio Classic, consulta. Configura i parametri predefiniti di un esperimento Autopilot (per amministratori)
-
-
Classificazione del testo con dati formattati come CSV file Parquet in cui una colonna fornisce le frasi da classificare, mentre un'altra colonna deve fornire l'etichetta di classe corrispondente. Per informazioni, consulta Creare un lavoro AutoML per la classificazione del testo utilizzando API.
-
Classificazione delle immagini con formati di immagine come PNGJPEG, o una combinazione di entrambi. Vedi. Creare un job di classificazione delle immagini utilizzando AutoML API
-
Previsione di serie temporali con dati di serie temporali formattati come file o file Parquet. Vedi. CSV Crea un lavoro AutoML per la previsione di serie temporali utilizzando API
-
Ottimizzazione di modelli linguistici di grandi dimensioni (LLMs) per la generazione di testo con dati formattati come file o file Parquet. Vedi. CSV Crea un lavoro AutoML per ottimizzare i modelli di generazione di testo utilizzando API
Inoltre, Autopilot aiuta gli utenti a capire come i modelli effettuano previsioni generando automaticamente report che mostrano l'importanza di ogni singola funzionalità. Ciò fornisce trasparenza e informazioni sui fattori che influenzano le previsioni, che possono essere utilizzate dai team di rischio e conformità e dalle autorità di regolamentazione esterne. Autopilot fornisce anche un modello di rapporto sulle prestazioni, che comprende un riepilogo delle metriche di valutazione, una matrice di confusione, varie visualizzazioni come le curve caratteristiche di funzionamento del ricevitore e le curve di richiamo di precisione e altro ancora. Il contenuto specifico di ogni rapporto varia a seconda del tipo di problema dell'esperimento Autopilot.
I report sulla spiegabilità e sulle prestazioni per il miglior modello candidato in un esperimento Autopilot sono disponibili per i tipi di problemi di classificazione di dati di testo, immagini e tabelle.
Per casi d'uso di dati tabulari come la regressione o la classificazione, Autopilot offre una visibilità aggiuntiva sul modo in cui i dati sono stati gestiti e su come i candidati al modello sono stati selezionati, addestrati e ottimizzati generando notebook che contengono il codice utilizzato per esplorare i dati e trovare il modello con le migliori prestazioni. Questi notebook forniscono un ambiente interattivo ed esplorativo per aiutarti a conoscere l'impatto di vari input o i compromessi raggiunti negli esperimenti. È possibile sperimentare ulteriormente con il modello candidato dalle prestazioni più elevate apportando le proprie modifiche ai notebook per l'esplorazione dei dati e la definizione dei candidati forniti da Autopilot.
Con Amazon SageMaker, paghi solo per ciò che usi. Paghi per le risorse di elaborazione e archiviazione sottostanti all'interno dei SageMaker nostri altri AWS servizi, in base all'utilizzo. Per ulteriori informazioni sui costi di utilizzo SageMaker, consulta la pagina SageMakerdei prezzi di Amazon
Argomenti
- Crea lavori di regressione o classificazione per dati tabulari utilizzando AutoML API
- Creare un job di classificazione delle immagini utilizzando AutoML API
- Creare un lavoro AutoML per la classificazione del testo utilizzando API
- Crea un lavoro AutoML per la previsione di serie temporali utilizzando API
- Crea un lavoro AutoML per ottimizzare i modelli di generazione di testo utilizzando API
- Crea un esperimento di regressione o classificazione automatica per dati tabulari utilizzando l'interfaccia utente di Studio Classic
- Notebook di esempio di Amazon SageMaker Autopilot
- Video: utilizzare Autopilot per automatizzare ed esplorare il processo di machine learning
- Tutorial: Inizia a usare Amazon Autopilot SageMaker
- Quote autopilot
- APIGuida di riferimento per Autopilot