Importazione di dati in SPICE - Amazon QuickSight

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Importazione di dati in SPICE

Quando importi dati in un set di dati anziché utilizzare una SQL query diretta, questi diventano SPICE dati a causa del modo in cui vengono archiviati. SPICE (Super-fast, Parallel, In-memory Calculation Engine)è il robusto motore in memoria QuickSight utilizzato da Amazon. È stato sviluppato per eseguire rapidamente calcoli avanzati e restituire dati significativi. Nell'edizione Enterprise, i dati sono archiviati in SPICE è crittografato a riposo.

Quando si crea o si modifica un set di dati, si sceglie di utilizzare uno dei due SPICE o una query diretta, a meno che il set di dati non contenga file caricati. Importazione (chiamata anche acquisizione) dei dati in SPICE può far risparmiare tempo e denaro:

  • Le tue query analitiche vengono elaborate più rapidamente.

  • Non è necessario attendere l'elaborazione di una query diretta.

  • Dati archiviati in SPICE può essere riutilizzato più volte senza incorrere in costi aggiuntivi. Se utilizzi un'origine dati che addebita un costo per query, ti verranno addebitati i costi per l'esecuzione delle query sui dati quando crei il set di dati per la prima volta e successivamente quando aggiorni il set di dati.

SPICE la capacità viene allocata separatamente per ciascuna di esse. Regione AWS Predefinita SPICE la capacità viene assegnata automaticamente alla casa. Regione AWS Per ogni AWS account, SPICE la capacità è condivisa da tutte le persone che lo utilizzano QuickSight in un unico dispositivo Regione AWS. Gli altri non Regioni AWS hanno SPICE capacità a meno che tu non scelga di acquistarne una. QuickSight gli amministratori possono visualizzare quanto SPICEla capacità di cui disponi in ciascuno di essi Regione AWS e quanta di essa è attualmente in uso. Un QuickSight amministratore può acquistarne di più SPICE capacità o release non utilizzate SPICE capacità in base alle esigenze. Per ulteriori informazioni, consulta Gestione di SPICE capacità di memoria.

Stima delle dimensioni di SPICE dataset

La dimensione di un set di dati in SPICE relativo a quello del tuo account SPICE la capacità è chiamata dimensione logica. La dimensione logica di un set di dati non è uguale alla dimensione del file o della tabella di origine del set di dati. Il calcolo della dimensione logica di un set di dati viene effettuato dopo che sono state definite tutte le trasformazioni dei tipi di dati e le colonne calcolate durante la preparazione dei dati. Questi campi sono materializzati in SPICE in modo da migliorare le prestazioni delle query. Qualsiasi modifica apportata in un'analisi non ha alcun effetto sulla dimensione logica dei dati in SPICE. Solo le modifiche salvate nel set di dati si applicano a SPICE capacità.

La dimensione logica di un SPICE il set di dati dipende dai tipi di dati dei campi del set di dati e dal numero di righe nel set di dati. I tre tipi di SPICE i dati sono decimali, date e stringhe. Puoi trasformare il tipo di dati di un campo durante la fase di preparazione dei dati per adattarlo alle tue esigenze di visualizzazione dei dati. Ad esempio, è possibile che il file che desideri importare contenga tutte le stringhe (testo). Tuttavia, affinché queste possano essere utilizzate in modo significativo in un'analisi, devi preparare i dati cambiando i relativi tipi nella loro forma corretta. I campi contenenti i prezzi possono essere modificati da stringhe in decimali e i campi che contengono le date vengono cambiati da stringhe in date. Puoi anche creare campi calcolati ed escludere i campi che non ti servono dalla tabella di origine. Quando hai finito di preparare il set di dati e tutte le trasformazioni sono complete, puoi stimare la dimensione logica dello schema finale.

Nota

I tipi di dati geospaziali utilizzano i metadati per interpretare il tipo di dati fisico. Latitudine e longitudine sono valori numerici, mentre tutte le altre categorie geospaziali sono stringhe.

Nella formula seguente, i decimali e le date vengono calcolati come 8 byte per cella con 4 byte aggiuntivi per i dati ausiliari. Le stringhe vengono calcolate in base alla lunghezza del testo nella codifica UTF -8 più 24 byte per la codifica ausiliaria. I tipi di dati di tipo stringa richiedono più spazio a causa dell'indicizzazione aggiuntiva richiesta da SPICE per fornire prestazioni di query elevate.

Logical dataset size in bytes = (Number of Numeric cells * (12 bytes per cell)) + (Number of Date cells * (12 bytes per cell)) + SUM ((24 bytes + UTF-8 encoded length) per Text cell)

La formula sopra riportata deve essere utilizzata solo per stimare la dimensione di un singolo set di dati in SPICE. La SPICE l'utilizzo della capacità è la dimensione totale di tutti i set di dati in un account in una regione specifica. non è consigliabile utilizzare questa formula per stimare il totale SPICE la capacità utilizzata dal tuo account.