Importation de données dans SPICE - Amazon QuickSight

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Importation de données dans SPICE

Lorsque vous importez des données dans un ensemble de données plutôt que d'utiliser une requête SQL directe, elles deviennent SPICEdes données en raison de la façon dont elles sont stockées. SPICE (Super-fast, Parallel, In-memory Calculation Engine)est le moteur en mémoire robuste QuickSight utilisé par Amazon. Il est conçu pour effectuer des calculs avancés et traiter les données rapidement. Dans l'édition Enterprise, les données stockées dans SPICE sont chiffrées au repos.

Lorsque vous créez ou modifiez un jeu de données, vous choisissez d'utiliser soit SPICE, soit une requête directe, sauf si le jeu de données contient des fichiers chargés. L'importation (également appelée ingestion) de vos données dans SPICE peut vous faire gagner du temps et de l'argent :

  • Vos requêtes analytiques sont traitées plus rapidement.

  • Vous n'avez pas besoin d'attendre qu'une requête directe soit traitée.

  • Les données stockées dans SPICE peuvent être réutilisées plusieurs fois sans entraîner de coûts supplémentaires. Si vous utilisez une source de données facturée à l'interrogation, vous êtes facturé pour l'interrogation des données lors de la création du jeu de données et plus tard lorsque vous actualisez le jeu de données.

La capacité SPICE est allouée séparément pour chaque Région AWS. La capacité SPICE par défaut est automatiquement attribuée à votre Région AWS d'origine. Pour chaque AWS compte, la SPICE capacité est partagée par toutes les personnes qui l'utilisent QuickSight dans un seul compteRégion AWS. Les autres n'Régions AWSont aucune SPICE capacité à moins que vous ne choisissiez d'en acheter. QuickSight les administrateurs peuvent voir la SPICEcapacité dont vous disposez dans chacune d'elles Région AWS et la quantité actuellement utilisée. Un QuickSight administrateur peut acheter de la SPICE capacité supplémentaire ou libérer de la SPICE capacité inutilisée selon les besoins. Pour plus d’informations, consultez Gestion de la capacité de mémoire SPICE.

Estimation de la taille des jeux de données SPICE

La taille d'un jeu de données en SPICE par rapport à la capacité de SPICE de votre compte est appelée taille logique. La taille logique d'un jeu de données n'est pas la même que la taille du fichier ou de la table source du jeu de données. Le calcul de la taille logique d'un jeu de données intervient après que toutes les transformations de type de données et les colonnes calculées ont été définies lors de la préparation des données. Ces champs sont matérialisés dans SPICE, de façon à améliorer la performance des requêtes. Toutes les modifications apportées à une analyse n'ont aucun effet sur la taille logique des données dans SPICE. Seules les modifications qui sont enregistrées dans le jeu de données s'appliquent à la capacité SPICE.

La taille logique d'un jeu de données SPICE dépend des types de données des champs du jeu de données et du nombre de lignes du jeu de données. Les trois types de données SPICE sont les décimales, les dates et les chaînes. Vous pouvez transformer le type de données d'un champ pendant la phase de préparation des données pour l'adapter à vos besoins de représentation visuelle des données. Par exemple, le fichier que vous souhaitez importer peut contenir toutes les chaînes (texte). Mais pour qu'elles puissent être utilisées de façon significative dans une analyse, vous préparez les données en modifiant les types de données selon leur forme appropriée. Les champs contenant des prix peuvent être transformés de chaînes en décimales, et les champs contenant des dates peuvent être transformés de chaînes en dates. Vous pouvez également créer des champs calculés et exclure de la table source les champs dont vous n'avez pas besoin. Lorsque vous avez fini de préparer votre jeu de données et que toutes les transformations sont terminées, vous pouvez estimer la taille logique du schéma final.

Note

Les types de données géospatiales utilisent les métadonnées pour interpréter le type de données physique. La latitude et la longitude sont numériques. Toutes les autres catégories géospatiales sont des chaînes.

Dans la formule ci-dessous, les décimales et les dates sont calculées sur la base de 8 octets par cellule, avec 4 octets supplémentaires pour les données auxiliaires. Les chaînes de caractères sont calculées sur la base de la longueur du texte en codage UTF-8, plus 24 octets pour l'auxiliaire. Les types de données de type chaîne nécessitent plus d'espace en raison de l'indexation supplémentaire requise par SPICE pour assurer des performances de requête élevées.

Logical dataset size in bytes = (Number of Numeric cells * (12 bytes per cell)) + (Number of Date cells * (12 bytes per cell)) + SUM ((24 bytes + UTF-8 encoded length) per Text cell)

La formule ci-dessus ne doit être utilisée que pour estimer la taille d'un seul jeu de données dans SPICE. L'utilisation de la capacité SPICE est la taille totale de tous les jeux de données d'un compte dans une région spécifique. ne vous recommande pas d'utiliser cette formule pour estimer la capacité SPICE totale que votre compte utilise.