Machine learning per principianti ed esperti - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Machine learning per principianti ed esperti

Con Amazon Redshift, puoi sfruttare le funzionalità di Machine Learning (ML) per ottenere informazioni dai tuoi dati, sia che tu sia un principiante o un esperto di ML. Machine Learning è una funzionalità di Amazon Redshift che consente di creare, addestrare e distribuire modelli di machine learning utilizzando SQL comandi, senza la necessità di una vasta esperienza di machine learning o di una complessa ingegneria dei dati.

Le seguenti sezioni ti guidano nel processo di utilizzo del Machine Learning, consentendoti di sbloccare tutto il potenziale dei tuoi dati con Amazon Redshift.

Amazon Redshift ML ti consente di addestrare modelli con un solo SQL CREATE MODEL comando. Il CREATE MODEL comando crea un modello che Amazon Redshift utilizza per generare previsioni basate su modelli con costrutti familiari. SQL

Amazon Redshift ML è particolarmente utile quando non hai esperienza in machine learning, strumenti, linguaggi, algoritmi e. APIs Con il ML di Amazon Redshift, non è necessario eseguire alcuno dei carichi pesanti indifferenziati necessari per l'integrazione con un servizio di machine learning esterno. Amazon Redshift consente di risparmiare tempo per formattare e spostare i dati, gestire i controlli delle autorizzazioni o creare integrazioni, flussi di lavoro e script personalizzati. È possibile utilizzare facilmente gli algoritmi di machine learning più diffusi e semplificare le esigenze di addestramento che richiedono frequenti iterazioni dall'addestramento fino alla previsione. Amazon Redshift rileva automaticamente l'algoritmo migliore e ottimizza il modello migliore per il problema. È possibile fare previsioni dall'interno del cluster Amazon Redshift senza la necessità di spostare i dati da Amazon Redshift né di interfacciarsi e pagare per un altro servizio.

Amazon Redshift ML supporta analisti di dati e data scientist nell'utilizzo del machine learning. Consente inoltre agli esperti di machine learning di utilizzare le proprie conoscenze per guidare la CREATE MODEL dichiarazione a utilizzare solo gli aspetti da loro specificati. In questo modo, è possibile velocizzare il tempo CREATE MODEL necessario per trovare il candidato migliore, migliorare la precisione del modello o entrambe le cose.

La CREATE MODEL dichiarazione offre flessibilità nel modo in cui è possibile specificare i parametri relativi al lavoro di formazione. Ciò consente sia agli utenti principianti che a quelli esperti di machine learning di scegliere i preprocessori, gli algoritmi, i tipi di problemi o gli iperparametri preferiti. Ad esempio, un utente interessato al tasso di abbandono dei clienti potrebbe specificare nell'CREATEMODEListruzione che il tipo di problema è una classificazione binaria, che funziona bene per il tasso di abbandono dei clienti. Quindi l'CREATEMODEListruzione restringe la ricerca del modello migliore ai modelli di classificazione binaria. Anche con la scelta del tipo di problema da parte dell'utente, ci sono ancora molte opzioni con cui l'CREATEMODEListruzione può funzionare. Ad esempio, CREATE MODEL rileva e applica le migliori trasformazioni di preelaborazione e scopre le migliori impostazioni degli iperparametri.

Amazon Redshift ML semplifica la formazione trovando automaticamente il modello migliore con Amazon SageMaker Autopilot. Dietro le quinte, Amazon SageMaker Autopilot addestra e ottimizza automaticamente il miglior modello di machine learning in base ai dati forniti. Amazon SageMaker Neo compila quindi il modello di formazione e lo rende disponibile per la previsione nel cluster Redshift. Quando si esegue una query di inferenza di machine learning utilizzando un modello addestrato, la query la query può utilizzare le enormi capacità di elaborazione in parallelo di Amazon Redshift. Allo stesso tempo, la query può utilizzare la previsione basata sul machine learning.

  • Se sei un principiante dell'apprendimento automatico, con una conoscenza generale di diversi aspetti dell'apprendimento automatico come preprocessori, algoritmi e iperparametri, usa l'CREATEMODEListruzione solo per gli aspetti da te specificati. Quindi puoi ridurre il tempo CREATE MODEL necessario per trovare il candidato migliore o migliorare la precisione del modello. Inoltre, è possibile aumentare il valore aziendale delle previsioni introducendo ulteriori conoscenze sul dominio, ad esempio il tipo di problema o l'obiettivo. Ad esempio, in uno scenario di abbandono del cliente, se il risultato "il cliente non è attivo" è raro, l'obiettivo F1 è spesso preferito all'obiettivo Precisione. Poiché i modelli ad alta precisione potrebbero prevedere "il cliente è attivo" per tutto il tempo, ciò si traduce in un'elevata precisione ma poco valore aziendale. Per informazioni sugli obiettivi di F1, consulta A utoMLJob Objective in Amazon SageMaker API Reference.

    Per ulteriori informazioni sulle opzioni di base per la CREATE MODEL dichiarazione, consultaSemplice CREATE MODEL.

  • Come operatore avanzato di machine learning, è possibile specificare il tipo di problema e i preprocessori per determinate funzionalità (ma non tutte). CREATEMODELSegue quindi i vostri suggerimenti sugli aspetti specificati. Allo stesso tempo, scopre CREATE MODEL comunque i migliori preprocessori per le restanti funzionalità e i migliori iperparametri. Per ulteriori informazioni su come limitare uno o più aspetti della pipeline di addestramento, consultare CREATEMODELcon guida per l'utente.

  • Come esperto di machine learning, è possibile assumere il pieno controllo dell'addestramento e dell'ottimizzazione degli iperparametri. Quindi l'CREATEMODEListruzione non tenta di scoprire i preprocessori, gli algoritmi e gli iperparametri ottimali perché sei tu a fare tutte le scelte. Per ulteriori informazioni su come utilizzare CREATE MODEL con AUTOOFF, vedere. CREATEXGBoostmodelli con AUTO OFF

  • In qualità di ingegnere dei dati, puoi importare un XGBoost modello preaddestrato in Amazon SageMaker e importarlo in Amazon Redshift per l'inferenza locale. Con bring your own model (BYOM), puoi utilizzare un modello addestrato all'esterno di Amazon Redshift con Amazon SageMaker per l'inferenza nel database a livello locale in Amazon Redshift. Amazon Redshift ML supporta l'utilizzo BYOM in inferenza locale o remota.

    Per ulteriori informazioni su come utilizzare l'CREATEMODEListruzione per l'inferenza locale o remota, consulta. Bring your own model (BYOM) - inferenza locale

In qualità di utente Amazon Redshift ML, è possibile scegliere una delle seguenti opzioni per addestrare e distribuire il proprio modello.