Integrazione dei SageMaker modelli Amazon con Amazon QuickSight - Amazon QuickSight

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Integrazione dei SageMaker modelli Amazon con Amazon QuickSight

Nota

Non è necessaria alcuna esperienza tecnica nell'apprendimento automatico (ML) per creare analisi e dashboard che utilizzano le funzionalità basate sul machine learning di Amazon. QuickSight

Puoi aumentare i dati della tua edizione Amazon QuickSight Enterprise con i modelli di apprendimento SageMaker automatico di Amazon. Puoi eseguire inferenze sui dati SPICE archiviati importati da qualsiasi fonte di dati supportata da Amazon QuickSight. Per un elenco completo delle origini dati supportate, consulta Origini dati supportate.

L'uso di Amazon QuickSight con SageMaker i modelli può far risparmiare tempo che altrimenti potresti dedicare alla gestione dello spostamento dei dati e alla scrittura del codice. I risultati sono utili sia per valutare il modello sia, quando sei soddisfatto dei risultati, per condividerli con i responsabili delle decisioni. Puoi iniziare subito dopo la creazione del modello. In questo modo emergono i modelli precompilati dei data scientist e puoi applicare la data science ai set di dati. Puoi quindi condividere queste informazioni nei pannelli di controllo predittivi. Con l'approccio QuickSight serverless di Amazon, il processo si adatta perfettamente, quindi non devi preoccuparti dell'inferenza o della capacità di interrogazione.

Amazon QuickSight supporta SageMaker modelli che utilizzano algoritmi di regressione e classificazione. È possibile applicare questa caratteristica per ottenere previsioni per quasi qualsiasi caso d'uso aziendale. Alcuni esempi includono la previsione della probabilità di abbandono dei clienti, il logoramento dei dipendenti, il punteggio dei lead di vendita e la valutazione dei rischi di credito. Per utilizzare Amazon QuickSight per fornire previsioni, i dati del SageMaker modello per l'input e l'output devono essere in formato tabulare. Nei casi d'uso di classificazione multiclass o multilabel, ogni colonna di output deve contenere un singolo valore. Amazon QuickSight non supporta più valori all'interno di una singola colonna.

Come funziona SageMaker l'integrazione

In generale, il processo avviene in questo modo:

  1. Un QuickSight amministratore Amazon aggiunge le autorizzazioni per l'accesso QuickSight SageMaker ad Amazon. Per fare ciò, apri le impostazioni di sicurezza e autorizzazioni dalla pagina Gestisci QuickSight. Vai ad QuickSightaccedere ai AWS servizi e aggiungi SageMaker.

    Quando aggiungi queste autorizzazioni, Amazon QuickSight viene aggiunto a un ruolo AWS Identity and Access Management (IAM) che fornisce l'accesso per elencare tutti i SageMaker modelli nel tuo AWS account. Fornisce inoltre le autorizzazioni per eseguire SageMaker lavori con nomi preceduti da. quicksight-auto-generated-

  2. Si consiglia di connettersi a un SageMaker modello dotato di una pipeline di inferenza, poiché esegue automaticamente la preelaborazione dei dati. Per ulteriori informazioni, consulta l'argomento Distribuzione di una pipeline di inferenza nella Guida per sviluppatori di SageMaker .

  3. Quando hai individuato i dati e il modello sottoposto al training che desideri utilizzare insieme, il proprietario del modello crea e mette a disposizione un file dello schema. Questo file JSON è un contratto con. SageMaker Fornisce metadati su campi, tipi di dati, ordine delle colonne, output e sulle impostazioni previste dal modello. Il componente delle impostazioni opzionali fornisce le dimensioni dell'istanza e il numero delle istanze di calcolo da utilizzare per il processo.

    Se sei il data scientist che ha creato il modello, devi creare il file di schema utilizzando il formato riportato di seguito. Se sei un consumatore del modello, devi ricevere il file dello schema dal proprietario del modello.

  4. In Amazon QuickSight, inizi creando un nuovo set di dati con i dati su cui vuoi fare previsioni. Se stai caricando un file, puoi aggiungere il modello SageMaker nella schermata delle impostazioni di caricamento. Altrimenti, puoi aggiungere il modello nella pagina di preparazione dei dati.

    Prima di procedere, verificare le mappature tra il set di dati e il modello.

  5. Dopo l'importazione dei dati nel set di dati, i campi di output contengono i dati restituiti da. SageMaker Questi campi possono essere utilizzati con le normali procedure descritte in Linee guida per l'utilizzo.

    Quando esegui SageMaker l'integrazione, Amazon invia QuickSight una richiesta per SageMaker eseguire processi di trasformazione in batch con pipeline di inferenza. Amazon QuickSight avvia il provisioning e la distribuzione delle istanze necessarie nel tuo AWS account. Al termine dell'elaborazione, queste istanze vengono arrestate e terminate. La capacità di elaborazione prevede costi solo quando è in fase di elaborazione dei modelli.

    Per facilitarti l'identificazione, Amazon QuickSight nomina tutti i suoi SageMaker lavori con il prefissoquicksight-auto-generated-.

  6. L'output dell'inferenza viene memorizzato in SPICE e aggiunto al set di dati. Non appena l'inferenza è completa, è possibile utilizzare il set di dati per creare visualizzazioni e pannelli di controllo con i dati di previsione.

  7. L'aggiornamento dei dati inizia ogni volta che si salva il set di dati. È possibile avviare manualmente il processo di aggiornamento dei dati aggiornando il set di dati SPICE oppure è possibile pianificarlo in modo che venga eseguito a intervalli regolari. Durante ogni aggiornamento dei dati, il sistema richiama automaticamente la trasformazione SageMaker in batch per aggiornare i campi di output con nuovi dati.

    Puoi utilizzare le operazioni dell'API QuickSight SPICE di importazione di Amazon per controllare il processo di aggiornamento dei dati. Per ulteriori informazioni sull'utilizzo di queste operazioni API, consulta Amazon QuickSight API Reference.

Costi addebitati (l'integrazione di per sé non prevede costi aggiuntivi)

L'utilizzo di questa funzione non prevede una tariffa aggiuntiva. I costi comprendono quanto segue:

  • Il costo di implementazione del modello SageMaker, che viene sostenuto solo quando il modello è in esecuzione. Il salvataggio di un set di dati, dopo averlo creato o modificato, o l'aggiornamento dei dati avvia il processo di importazione dei dati. Questo processo include la chiamata SageMaker se il set di dati contiene campi dedotti. I costi vengono sostenuti nello stesso AWS account in cui è previsto l'abbonamento QuickSight .

  • I costi di QuickSight abbonamento sono i seguenti:

    • Il costo dell'archiviazione dei dati nel motore di calcolo in memoria in QuickSight (SPICE). Se aggiungi nuovi dati a SPICE, potresti dover acquistare una capacità SPICE sufficiente ad accoglierli.

    • QuickSight abbonamenti per gli autori o gli amministratori che creano i set di dati.

    • P ay-per-session addebita agli spettatori (lettori) l'accesso a dashboard interattivi.

Linee guida per l'utilizzo

In Amazon QuickSight, le seguenti linee guida di utilizzo si applicano a questa funzionalità dell'edizione Enterprise:

  • L'elaborazione del modello avviene in SPICE. Di conseguenza, può essere applicata solo ai set di dati archiviati in SPICE. Attualmente il processo supporta fino a 500 milioni di righe per ogni set di dati.

  • Solo gli QuickSight amministratori o gli autori possono aumentare i set di dati con modelli ML. I lettori possono visualizzare i risultati solo quando fanno parte di un pannello di controllo.

  • Ogni set di dati può utilizzare uno e un solo modello ML.

  • I campi di output non possono essere utilizzati per calcolare nuovi campi.

  • I set di dati non possono essere filtrati in base ai campi integrati con il modello. In altre parole, se il campo del set di dati è attualmente mappato al modello ML, non è possibile applicarvi filtri.

Nel SageMaker, le seguenti linee guida per l'utilizzo si applicano a un modello preaddestrato che utilizzi con Amazon QuickSight:

  • Quando crei il modello, associalo all'Amazon Resource Name (ARN) del ruolo IAM appropriato. Il ruolo IAM per il SageMaker modello deve avere accesso al bucket Amazon S3 utilizzato da Amazon. QuickSight

  • Verifica che il modello supporti i file .csv sia per l'input che per l'output. Verifica che i dati siano in formato tabulare.

  • Fornisci un file di schema contenente metadati relativi al modello, compreso l'elenco dei campi di input e output. Attualmente, il file di schema deve essere creato manualmente.

  • Calcola la quantità di tempo necessaria per completare l'inferenza, che dipende da una serie di fattori, tra cui la complessità del modello, la quantità di dati e la capacità di elaborazione definita. Il completamento dell'inferenza può richiedere da diversi minuti a diverse ore. Amazon QuickSight limita tutti i processi di inserimento e inferenza dei dati a un massimo di 10 ore. Per ridurre il tempo necessario per eseguire un'inferenza, è consigliabile aumentare la dimensione dell'istanza o il numero delle istanze.

  • Attualmente, puoi utilizzare solo trasformazioni in batch per l'integrazione con SageMaker dati, non in tempo reale. Non puoi usare un SageMaker endpoint.

Definizione del file di schema

Prima di utilizzare un SageMaker modello con QuickSight dati Amazon, crea il file di schema JSON che contiene i metadati QuickSight necessari ad Amazon per elaborare il modello. L' QuickSight autore o l'amministratore di Amazon carica il file di schema durante la configurazione del set di dati.

I campi dello schema sono definiti nel seguente modo. Tutti i campi sono obbligatori, a meno che non sia specificato nella seguente descrizione. Gli attributi rispettano la distinzione tra maiuscole e minuscole.

inputContentType

Il tipo di contenuto che questo SageMaker modello si aspetta per i dati di input. L'unico valore supportato è "text/csv". QuickSight non include nessuno dei nomi di intestazione aggiunti al file di input.

outputContentType

Il tipo di contenuto dell'output prodotto dal SageMaker modello che si desidera utilizzare. L'unico valore supportato è "text/csv".

input

Un elenco di funzionalità che il modello prevede nei dati di input. QuickSight produce i dati di input esattamente nello stesso ordine. Questo elenco contiene i seguenti attributi:

  • name: il nome della colonna. Se possibile, rendilo uguale al nome della colonna corrispondente nel QuickSight set di dati. Questo attributo ha un limite di 100 caratteri.

  • type: il tipo di dati di questa colonna. Questo attributo accetta i valori "INTEGER", "STRING" e "DECIMAL".

  • nullable (facoltativo): l'annullabilità del campo. Il valore predefinito è true. Se lo nullable imposti sufalse, QuickSight elimina le righe che non contengono questo valore prima della chiamata SageMaker. In questo modo si evita di causare errori SageMaker a causa dei dati obbligatori mancanti.

output

Un elenco di colonne di output prodotte dal SageMaker modello. QuickSightprevede che questi campi siano esattamente nello stesso ordine. Questo elenco contiene i seguenti attributi:

  • nome: questo nome diventa il nome predefinito per la nuova colonna corrispondente creata in QuickSight. È possibile sovrascrivere il nome specificato qui in QuickSight. Questo attributo ha un limite di 100 caratteri.

  • type: il tipo di dati di questa colonna. Questo attributo accetta i valori "INTEGER", "STRING" e "DECIMAL".

instanceTypes

Un elenco dei tipi di istanze ML che SageMaker possono essere predisposti per eseguire il processo di trasformazione. L'elenco viene fornito all' QuickSight utente tra cui scegliere. Questo elenco è limitato ai tipi supportati da SageMaker. Per ulteriori informazioni sui tipi supportati, consulta TransformResourcesla Guida per gli SageMaker sviluppatori.

defaultInstanceType

(Facoltativo) Il tipo di istanza presentato come opzione predefinita nella SageMaker procedura guidata in QuickSight. Includi questo tipo di istanza in instanceTypes.

instanceCount

(Facoltativo) Il conteggio delle istanze definisce il numero di istanze selezionate di SageMaker cui disporre per eseguire il processo di trasformazione. Questo valore deve essere un numero intero positivo.

description

Questo campo fornisce un luogo in cui la persona proprietaria del SageMaker modello può comunicare con la persona che lo utilizza. QuickSight Utilizza questo campo per fornire suggerimenti sull'utilizzo efficace del modello. Ad esempio, questo campo può contenere informazioni sulla selezione di un tipo di istanza efficace da scegliere dall'elenco in instanceTypes, in base alle dimensioni del set di dati. Questo campo ha un limite di 1.000 caratteri.

versione

La versione dello schema, ad esempio "1.0".

L'esempio seguente mostra la struttura del file JSON nel file dello schema.

{ "inputContentType": "CSV", "outputContentType": "CSV", "input": [ { "name": "buying", "type": "STRING" }, { "name": "maint", "type": "STRING" }, { "name": "doors", "type": "INTEGER" }, { "name": "persons", "type": "INTEGER" }, { "name": "lug_boot", "type": "STRING" }, { "name": "safety", "type": "STRING" } ], "output": [ { "name": "Acceptability", "type": "STRING" } ], "description": "Use ml.m4.xlarge instance for small datasets, and ml.m4.4xlarge for datasets over 10 GB", "version": "1.0", "instanceCount": 1, "instanceTypes": [ "ml.m4.xlarge", "ml.m4.4xlarge" ], "defaultInstanceType": "ml.m4.xlarge" }

La struttura del file di schema è correlata al tipo di modello utilizzato negli esempi forniti da SageMaker.

Aggiungere un SageMaker modello al QuickSight set di dati

Utilizzando la procedura seguente, puoi aggiungere un SageMaker modello preaddestrato al tuo set di dati, in modo da poter utilizzare i dati predittivi nelle analisi e nei dashboard.

Prima di iniziare, devi disporre delle seguenti voci:

  • I dati da utilizzare per creare il set di dati.

  • Il nome del SageMaker modello che desideri utilizzare per aumentare il set di dati.

  • Lo schema del modello. Questo schema include le mappature dei nomi dei campi e i tipi di dati. È utile se contiene anche le impostazioni consigliate per il tipo di istanza e il numero di istanze da utilizzare.

Per ampliare il tuo QuickSight set di dati Amazon con SageMaker
  1. Crea un nuovo set di dati dalla pagina iniziale selezionando Set di dati, quindi Nuovo set di dati.

    È anche possibile modificare un set di dati esistente.

  2. Scegli Augment with SageMaker nella schermata di preparazione dei dati.

  3. In Select your model (Seleziona modello), scegliere le seguenti impostazioni:

    • Modello: scegli il SageMaker modello da utilizzare per dedurre i campi.

    • Name: fornisci un nome descrittivo per il modello.

    • Schema: carica il file dello schema JSON fornito per il modello.

    • Impostazioni avanzate: QuickSight consiglia le impostazioni predefinite selezionate in base al set di dati. Puoi utilizzare impostazioni specifiche del runtime per equilibrare la velocità e il costo del processo. A tale scopo, inserisci i tipi di istanza SageMaker ML per Tipo di istanza e il numero di istanze per Count.

    Seleziona Successivo per continuare.

  4. Per gli input di revisione, esamina i campi mappati al tuo set di dati. QuickSight tenta di mappare automaticamente i campi dello schema ai campi del set di dati. Se la mappatura deve essere regolata, qui puoi apportare le necessarie modifiche.

    Seleziona Successivo per continuare.

  5. In Esamina gli output, visualizza i campi aggiunti al set di dati.

    Selezionare Save and prepare data (Salva e prepara dati) per confermare le scelte.

  6. Per aggiornare i dati, scegliere il set di dati per visualizzarne i dettagli. Quindi, scegliere Refresh Now (Aggiorna ora) per aggiornare manualmente i dati o Schedule refresh (Pianifica aggiornamento) per impostare aggiornamenti a intervalli regolari. Durante ogni aggiornamento dei dati, il sistema esegue automaticamente il processo di trasformazione in batch SageMaker per aggiornare i campi di output con nuovi dati.