Machine learning per principianti ed esperti - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Machine learning per principianti ed esperti

Con Amazon Redshift, puoi sfruttare le funzionalità di Machine Learning (ML) per ottenere informazioni dai tuoi dati, che tu sia un principiante o un esperto di ML. Machine Learning è una funzionalità di Amazon Redshift che consente di creare, addestrare e distribuire modelli ML utilizzando i comandi SQL, senza la necessità di ampie competenze di machine learning o di ingegneria dei dati complessa.

Le seguenti sezioni ti guidano nel processo di utilizzo del Machine Learning, consentendoti di sbloccare tutto il potenziale dei tuoi dati con Amazon Redshift.

Amazon Redshift ML consente di addestrare i modelli con un singolo comando SQL CREATE MODEL. Il comando CREATE MODEL crea un modello utilizzato da Amazon Redshift per generare previsioni basate su modelli con costrutti SQL familiari.

Amazon Redshift ML è particolarmente utile quando non hai esperienza in machine learning, strumenti, linguaggi, algoritmi e. APIs Con il ML di Amazon Redshift, non è necessario eseguire alcuno dei carichi pesanti indifferenziati necessari per l'integrazione con un servizio di machine learning esterno. Amazon Redshift consente di risparmiare tempo per formattare e spostare i dati, gestire i controlli delle autorizzazioni o creare integrazioni, flussi di lavoro e script personalizzati. È possibile utilizzare facilmente gli algoritmi di machine learning più diffusi e semplificare le esigenze di addestramento che richiedono frequenti iterazioni dall'addestramento fino alla previsione. Amazon Redshift rileva automaticamente l'algoritmo migliore e ottimizza il modello migliore per il problema. È possibile fare previsioni dall'interno del cluster Amazon Redshift senza la necessità di spostare i dati da Amazon Redshift né di interfacciarsi e pagare per un altro servizio.

Amazon Redshift ML supporta analisti di dati e data scientist nell'utilizzo del machine learning. Inoltre, consente agli esperti di machine learning di utilizzare le loro conoscenze per guidare l'istruzione CREATE MODEL per utilizzare solo gli aspetti specificati. In questo modo, è possibile accelerare il tempo necessario a CREATE MODEL per trovare il miglior candidato e/o migliorare la precisione del modello.

L'istruzione CREATE MODEL offre flessibilità nel modo in cui è possibile specificare i parametri per il processo di addestramento. Ciò consente sia agli utenti principianti che a quelli esperti di machine learning di scegliere i preprocessori, gli algoritmi, i tipi di problemi o gli iperparametri preferiti. Ad esempio, un utente interessato all'abbandono del cliente potrebbe specificare all'istruzione CREATE MODEL che il tipo di problema è una classificazione binaria che funziona bene per l'abbandono del cliente. Quindi l'istruzione CREATE MODEL restringe la ricerca del modello migliore in modelli di classificazione binaria. Anche con la scelta dell'utente del tipo di problema, ci sono ancora molte opzioni che possono essere utilizzate dall'istruzione CREATE MODEL. Ad esempio, CREATE MODEL rileva e applica le migliori trasformazioni di pre-elaborazione e individua le migliori impostazioni dell'iperparametro.

Amazon Redshift ML semplifica la formazione trovando automaticamente il modello migliore utilizzando Amazon SageMaker AI Autopilot. Dietro le quinte, Amazon SageMaker AI Autopilot addestra e ottimizza automaticamente il miglior modello di machine learning in base ai dati forniti. Amazon SageMaker AI Neo compila quindi il modello di formazione e lo rende disponibile per la previsione nel cluster Redshift. Quando si esegue una query di inferenza di machine learning utilizzando un modello addestrato, la query la query può utilizzare le enormi capacità di elaborazione in parallelo di Amazon Redshift. Allo stesso tempo, la query può utilizzare la previsione basata sul machine learning.

  • Come principiante di machine learning, con una conoscenza generale dei diversi aspetti del machine learning, ad esempio preprocessori, algoritmi e iperparametri, utilizzare l'istruzione CREATE MODEL solo per gli aspetti specificati. Quindi è possibile ridurre il tempo necessario a CREATE MODEL per trovare il miglior candidato o migliorare la precisione del modello. Inoltre, è possibile aumentare il valore aziendale delle previsioni introducendo ulteriori conoscenze sul dominio, ad esempio il tipo di problema o l'obiettivo. Ad esempio, in uno scenario di abbandono del cliente, se il risultato "il cliente non è attivo" è raro, l'obiettivo F1 è spesso preferito all'obiettivo Precisione. Poiché i modelli ad alta precisione potrebbero prevedere "il cliente è attivo" per tutto il tempo, ciò si traduce in un'elevata precisione ma poco valore aziendale. Per informazioni sugli obiettivi F1, consulta Auto MLJob Objective nell'Amazon SageMaker AI API Reference.

    Per ulteriori informazioni sulle opzioni di base per l'istruzione CREATE MODEL, consultare CREATE MODEL semplice.

  • Come operatore avanzato di machine learning, è possibile specificare il tipo di problema e i preprocessori per determinate funzionalità (ma non tutte). Quindi CREATE MODEL segue i suggerimenti sugli aspetti specificati. Allo stesso tempo, CREATE MODEL rileva automaticamente i migliori preprocessori per le funzioni restanti e i migliori iperparametri. Per ulteriori informazioni su come limitare uno o più aspetti della pipeline di addestramento, consultare CREATE MODEL con guida per l'utente.

  • Come esperto di machine learning, è possibile assumere il pieno controllo dell'addestramento e dell'ottimizzazione degli iperparametri. Quindi l'istruzione CREATE MODEL non prova a scoprire i preprocessori, gli algoritmi e gli iperparametri ottimali perché sei tu a fare tutte le scelte. Per ulteriori informazioni su come utilizzare l'istruzione CREATE MODEL con AUTO OFF, consultare CREA XGBoost modelli con AUTO OFF.

  • In qualità di ingegnere dei dati, puoi importare un XGBoost modello preaddestrato in Amazon SageMaker AI e importarlo in Amazon Redshift per l'inferenza locale. Con Bring your own model (BYOM), puoi utilizzare un modello addestrato all'esterno di Amazon Redshift con Amazon AI per l'inferenza all'interno del database localmente in SageMaker Amazon Redshift. Amazon Redshift ML supporta l'utilizzo di BYOM sia nell'inferenza locale che in quella remota.

    Per ulteriori informazioni su come utilizzare l'istruzione CREATE MODEL per l'inferenza locale o remota, consultare Bring your own model (BYOM) - inferenza locale.

In qualità di utente Amazon Redshift ML, è possibile scegliere una delle seguenti opzioni per addestrare e distribuire il proprio modello.