Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Integrazione dei modelli di SageMaker intelligenza artificiale di Amazon con Amazon QuickSight
Nota
Non è necessaria alcuna esperienza tecnica nell'apprendimento automatico (ML) per creare analisi e dashboard che utilizzano le funzionalità basate sul machine learning di Amazon. QuickSight
Puoi aumentare i dati della tua edizione Amazon QuickSight Enterprise con i modelli di machine learning di Amazon SageMaker AI. Puoi eseguire inferenze sui dati archiviati in SPICE importato da qualsiasi fonte di dati supportata da Amazon QuickSight. Per un elenco completo delle origini dati supportate, consulta Origini dati supportate.
L'utilizzo di Amazon QuickSight con i modelli di SageMaker intelligenza artificiale può far risparmiare tempo che altrimenti potresti dedicare alla gestione dello spostamento dei dati e alla scrittura del codice. I risultati sono utili sia per valutare il modello sia, quando sei soddisfatto dei risultati, per condividerli con i responsabili delle decisioni. Puoi iniziare subito dopo la creazione del modello. In questo modo emergono i modelli precompilati dei data scientist e puoi applicare la data science ai set di dati. Puoi quindi condividere queste informazioni nei pannelli di controllo predittivi. Con l'approccio QuickSight serverless di Amazon, il processo si adatta perfettamente, quindi non devi preoccuparti dell'inferenza o della capacità di interrogazione.
Amazon QuickSight supporta modelli di SageMaker intelligenza artificiale che utilizzano algoritmi di regressione e classificazione. È possibile applicare questa caratteristica per ottenere previsioni per quasi qualsiasi caso d'uso aziendale. Alcuni esempi includono la previsione della probabilità di abbandono dei clienti, il logoramento dei dipendenti, il punteggio dei lead di vendita e la valutazione dei rischi di credito. Per utilizzare Amazon QuickSight per fornire previsioni, i dati del modello SageMaker AI per l'input e l'output devono essere in formato tabulare. Nei casi d'uso di classificazione multiclass o multilabel, ogni colonna di output deve contenere un singolo valore. Amazon QuickSight non supporta più valori all'interno di una singola colonna.
Argomenti
- Come funziona l'integrazione con l' SageMaker intelligenza artificiale
- Costi addebitati (l'integrazione di per sé non prevede costi aggiuntivi)
- Linee guida per l'utilizzo
- Definizione del file di schema
- Aggiungere un modello SageMaker AI al QuickSight set di dati
- Crea modelli predittivi con SageMaker AI Canvas
Come funziona l'integrazione con l' SageMaker intelligenza artificiale
In generale, il processo avviene in questo modo:
-
Un QuickSight amministratore Amazon aggiunge le autorizzazioni per consentire QuickSight ad Amazon di accedere all' SageMaker IA. Per fare ciò, apri le impostazioni di sicurezza e autorizzazioni dalla pagina Gestisci QuickSight. Vai all'QuickSightaccesso ai AWS servizi e aggiungi SageMaker AI.
Quando aggiungi queste autorizzazioni, Amazon QuickSight viene aggiunto a un ruolo AWS Identity and Access Management (IAM) che fornisce l'accesso per elencare tutti i modelli di SageMaker intelligenza artificiale presenti nel tuo AWS account. Fornisce inoltre le autorizzazioni per eseguire lavori di SageMaker intelligenza artificiale con nomi preceduti da.
quicksight-auto-generated-
-
Ti consigliamo di connetterti a un modello di SageMaker intelligenza artificiale dotato di una pipeline di inferenza, poiché esegue automaticamente la preelaborazione dei dati. Per ulteriori informazioni, consulta Deploy an Inference Pipeline nella AI Developer Guide. SageMaker
-
Quando hai individuato i dati e il modello sottoposto al training che desideri utilizzare insieme, il proprietario del modello crea e mette a disposizione un file dello schema. Questo JSON file è un contratto con AI. SageMaker Fornisce metadati su campi, tipi di dati, ordine delle colonne, output e sulle impostazioni previste dal modello. Il componente delle impostazioni opzionali fornisce le dimensioni dell'istanza e il numero delle istanze di calcolo da utilizzare per il processo.
Se sei il data scientist che ha creato il modello, devi creare il file di schema utilizzando il formato riportato di seguito. Se sei un consumatore del modello, devi ricevere il file dello schema dal proprietario del modello.
-
In Amazon QuickSight, inizi creando un nuovo set di dati con i dati su cui vuoi fare previsioni. Se stai caricando un file, puoi aggiungere il modello SageMaker AI nella schermata delle impostazioni di caricamento. Altrimenti, puoi aggiungere il modello nella pagina di preparazione dei dati.
Prima di procedere, verificare le mappature tra il set di dati e il modello.
-
Dopo l'importazione dei dati nel set di dati, i campi di output contengono i dati restituiti dall' SageMaker IA. Questi campi possono essere utilizzati con le normali procedure descritte in Linee guida per l'utilizzo.
Quando esegui l'integrazione dell' SageMaker intelligenza artificiale, Amazon QuickSight invia una richiesta all' SageMaker IA per eseguire lavori di trasformazione in batch con pipeline di inferenza. Amazon QuickSight avvia il provisioning e la distribuzione delle istanze necessarie nel tuo AWS account. Al termine dell'elaborazione, queste istanze vengono arrestate e terminate. La capacità di elaborazione prevede costi solo quando è in fase di elaborazione dei modelli.
Per facilitarti l'identificazione, Amazon QuickSight nomina tutti i suoi lavori di SageMaker intelligenza artificiale con il prefisso
quicksight-auto-generated-
. -
L'output dell'inferenza viene memorizzato in SPICE e aggiunto al set di dati. Non appena l'inferenza è completa, è possibile utilizzare il set di dati per creare visualizzazioni e pannelli di controllo con i dati di previsione.
-
L'aggiornamento dei dati inizia ogni volta che si salva il set di dati. È possibile avviare manualmente il processo di aggiornamento dei dati aggiornando il SPICE set di dati oppure è possibile pianificarne l'esecuzione a intervalli regolari. Durante ogni aggiornamento dei dati, il sistema chiama automaticamente SageMaker AI batch transform per aggiornare i campi di output con nuovi dati.
Puoi usare Amazon QuickSight SPICE APIoperazioni di ingestione per controllare il processo di aggiornamento dei dati. Per ulteriori informazioni sull'utilizzo di queste API operazioni, consulta Amazon QuickSight API Reference.
Costi addebitati (l'integrazione di per sé non prevede costi aggiuntivi)
L'utilizzo di questa funzione non prevede una tariffa aggiuntiva. I costi comprendono quanto segue:
-
Il costo dell'implementazione del modello tramite l' SageMaker intelligenza artificiale, sostenuto solo quando il modello è in esecuzione. Il salvataggio di un set di dati, dopo averlo creato o modificato, o l'aggiornamento dei dati avvia il processo di importazione dei dati. Questo processo include la chiamata all' SageMaker IA se il set di dati ha campi dedotti. I costi vengono sostenuti nello stesso AWS account in cui è previsto l'abbonamento QuickSight .
-
I costi di QuickSight abbonamento sono i seguenti:
-
Il costo dell'archiviazione dei dati nel motore di calcolo in memoria in QuickSight (SPICE). Se stai aggiungendo nuovi dati a SPICE, potrebbe essere necessario acquistarne una quantità sufficiente SPICE capacità di ospitarlo.
-
QuickSight abbonamenti per gli autori o gli amministratori che creano i set di dati.
-
Pay-per-session costi per gli spettatori (lettori) per accedere a dashboard interattivi.
-
Linee guida per l'utilizzo
In Amazon QuickSight, le seguenti linee guida di utilizzo si applicano a questa funzionalità dell'edizione Enterprise:
-
L'elaborazione del modello avviene in SPICEDi conseguenza, può essere applicata solo ai set di dati archiviati in . SPICE. Attualmente il processo supporta fino a 500 milioni di righe per set di dati.
-
Solo gli QuickSight amministratori o gli autori possono aumentare i set di dati con modelli ML. I lettori possono visualizzare i risultati solo quando fanno parte di un pannello di controllo.
-
Ogni set di dati può utilizzare uno e un solo modello ML.
-
I campi di output non possono essere utilizzati per calcolare nuovi campi.
-
I set di dati non possono essere filtrati in base ai campi integrati con il modello. In altre parole, se il campo del set di dati è attualmente mappato al modello ML, non è possibile applicarvi filtri.
Nell' SageMaker intelligenza artificiale, le seguenti linee guida d'uso si applicano a un modello preaddestrato che utilizzi con Amazon QuickSight:
-
Quando crei il modello, associalo ad Amazon Resource Name (ARN) per il IAM ruolo appropriato. Il IAM ruolo del modello di SageMaker intelligenza artificiale deve avere accesso al bucket Amazon S3 utilizzato da Amazon. QuickSight
-
Verifica che il modello supporti i file .csv sia per l'input che per l'output. Verifica che i dati siano in formato tabulare.
-
Fornisci un file di schema contenente metadati relativi al modello, compreso l'elenco dei campi di input e output. Attualmente, il file di schema deve essere creato manualmente.
-
Calcola la quantità di tempo necessaria per completare l'inferenza, che dipende da una serie di fattori, tra cui la complessità del modello, la quantità di dati e la capacità di elaborazione definita. Il completamento dell'inferenza può richiedere da diversi minuti a diverse ore. Amazon QuickSight limita tutti i processi di inserimento e inferenza dei dati a un massimo di 10 ore. Per ridurre il tempo necessario per eseguire un'inferenza, è consigliabile aumentare la dimensione dell'istanza o il numero delle istanze.
-
Attualmente, puoi utilizzare solo trasformazioni in batch per l'integrazione con l' SageMaker intelligenza artificiale, non dati in tempo reale. Non puoi usare un endpoint SageMaker AI.
Definizione del file di schema
Prima di utilizzare un modello di SageMaker intelligenza artificiale con QuickSight i dati Amazon, crea il file di JSON schema che contiene i metadati QuickSight necessari ad Amazon per elaborare il modello. L' QuickSight autore o l'amministratore di Amazon carica il file di schema durante la configurazione del set di dati.
I campi dello schema sono definiti nel seguente modo. Tutti i campi sono obbligatori, a meno che non sia specificato nella seguente descrizione. Gli attributi rispettano la distinzione tra maiuscole e minuscole.
- inputContentType
-
Il tipo di contenuto che questo modello di SageMaker intelligenza artificiale si aspetta per i dati di input. L'unico valore supportato per questo è
"text/csv"
. QuickSight non include nessuno dei nomi di intestazione aggiunti al file di input. - outputContentType
-
Il tipo di contenuto dell'output prodotto dal modello di SageMaker intelligenza artificiale che desideri utilizzare. L'unico valore supportato è
"text/csv"
. - input
-
Un elenco di funzionalità che il modello prevede nei dati di input. QuickSight produce i dati di input esattamente nello stesso ordine. Questo elenco contiene i seguenti attributi:
-
name: il nome della colonna. Se possibile, rendilo uguale al nome della colonna corrispondente nel QuickSight set di dati. Questo attributo ha un limite di 100 caratteri.
-
type: il tipo di dati di questa colonna. Questo attributo accetta i valori
"INTEGER"
,"STRING"
e"DECIMAL"
. -
nullable (facoltativo): l'annullabilità del campo. Il valore predefinito è
true
. Se lonullable
imposti sufalse
, QuickSight elimina le righe che non contengono questo valore prima di chiamare SageMaker AI. In questo modo si evita il fallimento dell' SageMaker IA in caso di dati obbligatori mancanti.
-
- output
-
Un elenco di colonne di output prodotte dal modello SageMaker AI. QuickSightprevede che questi campi siano esattamente nello stesso ordine. Questo elenco contiene i seguenti attributi:
-
nome: questo nome diventa il nome predefinito per la nuova colonna corrispondente creata in QuickSight. È possibile sovrascrivere il nome specificato qui in QuickSight. Questo attributo ha un limite di 100 caratteri.
-
type: il tipo di dati di questa colonna. Questo attributo accetta i valori
"INTEGER"
,"STRING"
e"DECIMAL"
.
-
- instanceTypes
-
Un elenco dei tipi di istanze ML che SageMaker AI può fornire per eseguire il processo di trasformazione. L'elenco viene fornito all' QuickSight utente tra cui scegliere. Questo elenco è limitato ai tipi supportati dall' SageMaker IA. Per ulteriori informazioni sui tipi supportati, TransformResourcesconsulta la Guida per sviluppatori SageMaker AI.
- defaultInstanceType
-
(Facoltativo) Il tipo di istanza presentato come opzione predefinita nella procedura guidata SageMaker AI in QuickSight. Includi questo tipo di istanza in
instanceTypes
. - instanceCount
-
(Facoltativo) Il conteggio delle istanze definisce il numero di istanze selezionate che l' SageMaker IA deve fornire per eseguire il processo di trasformazione. Questo valore deve essere un numero intero positivo.
- description
-
Questo campo fornisce un luogo in cui la persona proprietaria del modello di SageMaker intelligenza artificiale può comunicare con la persona che utilizza questo modello in QuickSight. Utilizza questo campo per fornire suggerimenti sull'utilizzo efficace del modello. Ad esempio, questo campo può contenere informazioni sulla selezione di un tipo di istanza efficace da scegliere dall'elenco in
instanceTypes
, in base alle dimensioni del set di dati. Questo campo ha un limite di 1.000 caratteri. - versione
-
La versione dello schema, ad esempio "
1.0"
.
L'esempio seguente mostra la struttura del JSON file di schema.
{ "inputContentType": "CSV", "outputContentType": "CSV", "input": [ { "name": "buying", "type": "STRING" }, { "name": "maint", "type": "STRING" }, { "name": "doors", "type": "INTEGER" }, { "name": "persons", "type": "INTEGER" }, { "name": "lug_boot", "type": "STRING" }, { "name": "safety", "type": "STRING" } ], "output": [ { "name": "Acceptability", "type": "STRING" } ], "description": "Use ml.m4.xlarge instance for small datasets, and ml.m4.4xlarge for datasets over 10 GB", "version": "1.0", "instanceCount": 1, "instanceTypes": [ "ml.m4.xlarge", "ml.m4.4xlarge" ], "defaultInstanceType": "ml.m4.xlarge" }
La struttura del file di schema è correlata al tipo di modello utilizzato negli esempi forniti dall' SageMaker IA.
Aggiungere un modello SageMaker AI al QuickSight set di dati
Utilizzando la procedura seguente, puoi aggiungere un modello di SageMaker intelligenza artificiale preaddestrato al tuo set di dati, in modo da poter utilizzare i dati predittivi nelle analisi e nelle dashboard.
Prima di iniziare, devi disporre delle seguenti voci:
-
I dati da utilizzare per creare il set di dati.
-
Il nome del modello di SageMaker intelligenza artificiale che desideri utilizzare per aumentare il set di dati.
-
Lo schema del modello. Questo schema include le mappature dei nomi dei campi e i tipi di dati. È utile se contiene anche le impostazioni consigliate per il tipo di istanza e il numero di istanze da utilizzare.
Per aumentare il tuo QuickSight set di dati Amazon con l'intelligenza artificiale SageMaker
-
Crea un nuovo set di dati dalla pagina iniziale selezionando Set di dati, quindi Nuovo set di dati.
È anche possibile modificare un set di dati esistente.
-
Scegli Augment with SageMaker nella schermata di preparazione dei dati.
-
In Select your model (Seleziona modello), scegliere le seguenti impostazioni:
-
Modello: scegli il modello di SageMaker intelligenza artificiale da utilizzare per dedurre i campi.
-
Name: fornisci un nome descrittivo per il modello.
-
Schema: carica il file di JSON schema fornito per il modello.
-
Impostazioni avanzate: QuickSight consiglia le impostazioni predefinite selezionate in base al set di dati. Puoi utilizzare impostazioni specifiche del runtime per equilibrare la velocità e il costo del processo. Per fare ciò, inserisci i tipi di istanza SageMaker AI ML per Tipo di istanza e il numero di istanze per Count.
Seleziona Successivo per continuare.
-
-
Per gli input di revisione, esamina i campi mappati al tuo set di dati. QuickSight tenta di mappare automaticamente i campi dello schema ai campi del set di dati. Se la mappatura deve essere regolata, qui puoi apportare le necessarie modifiche.
Seleziona Successivo per continuare.
-
In Esamina gli output, visualizza i campi aggiunti al set di dati.
Selezionare Save and prepare data (Salva e prepara dati) per confermare le scelte.
-
Per aggiornare i dati, scegliere il set di dati per visualizzarne i dettagli. Quindi, scegliere Refresh Now (Aggiorna ora) per aggiornare manualmente i dati o Schedule refresh (Pianifica aggiornamento) per impostare aggiornamenti a intervalli regolari. Durante ogni aggiornamento dei dati, il sistema esegue automaticamente il processo di trasformazione in batch SageMaker AI per aggiornare i campi di output con nuovi dati.