Opérations de chargement de données - Amazon Redshift

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Opérations de chargement de données

Gérez le comportement par défaut de l’opération de chargement pour le dépannage ou pour réduire les temps de chargement en spécifiant les paramètres suivants.

Paramètres
COMPROWSnumrows

Permet de spécifier le nombre de lignes à utiliser comme taille d’échantillon pour l’analyse de la compression. L’analyse est exécutée sur les lignes de chaque tranche de données. Par exemple, si vous spécifiez COMPROWS 1000000 (1 000 000) et que le système contient quatre sections totales, pas plus de 250 000 lignes par section sont lues et analysées.

Si COMPROWS ce n'est pas spécifié, la taille de l'échantillon est par défaut de 100 000 pour chaque tranche. Les valeurs COMPROWS inférieures à la valeur par défaut de 100 000 lignes pour chaque tranche sont automatiquement mises à niveau vers la valeur par défaut. Toutefois, la compression automatique n’aura pas lieu si la quantité de données en cours de chargement n’est pas suffisante pour produire un échantillon représentatif.

Si le COMPROWS nombre est supérieur au nombre de lignes du fichier d'entrée, la COPY commande continue et exécute l'analyse de compression sur toutes les lignes disponibles. La plage acceptée pour cet argument est un nombre compris entre 1000 et 2147483647 (2 147 483 647).

COMPUPDATE[PRESET| {SUR |TRUE} | {OFF|FALSE}]

Contrôle si les codages de compression sont automatiquement appliqués pendant unCOPY.

Dans COMPUPDATE ce casPRESET, la COPY commande choisit le codage de compression pour chaque colonne si la table cible est vide, même si les colonnes ont déjà des encodages autres queRAW. Les encodages de colonne actuellement spécifiés peuvent être remplacés. L’encodage de chaque colonne est basé sur le type de données de la colonne. Aucune donnée échantillonnée. Amazon Redshift attribue automatiquement l’encodage de compression comme suit :

  • La RAW compression est affectée aux colonnes définies comme clés de tri.

  • Les colonnes définies comme BOOLEANREAL, ou les types de DOUBLE PRECISION données sont RAW compressées.

  • Colonnes définies commeSMALLINT,,INTEGER,BIGINT,, DECIMAL DATETIMESTAMP, ou TIMESTAMPTZ auxquelles une AZ64 compression est affectée.

  • Colonnes définies CHAR ou VARCHAR auxquelles une LZO compression est affectée.

Lorsqu'elle COMPUPDATE est omise, la COPY commande choisit le codage de compression pour chaque colonne uniquement si la table cible est vide et que vous n'avez spécifié aucun codage (autre queRAW) pour aucune des colonnes. L’encodage pour chaque colonne est déterminé par Amazon Redshift. Aucune donnée échantillonnée.

Lorsque cette COMPUPDATE valeur est activée (ouTRUE), ou COMPUPDATE qu'elle est spécifiée sans option, la COPY commande applique une compression automatique si le tableau est vide, même si les colonnes du tableau ont déjà des encodages autres queRAW. Les encodages de colonne actuellement spécifiés peuvent être remplacés. L’encodage de chaque colonne est basé sur une analyse des exemples de données. Pour de plus amples informations, veuillez consulter Chargement des tables avec compression automatique.

Lorsque COMPUPDATE c'est le cas OFF (ouFALSE), la compression automatique est désactivée. Les encodages de colonne ne sont pas modifiés.

Pour plus de détails sur la table système utilisée pour analyser la compression, consultez STL_ANALYZE_COMPRESSION.

IGNOREALLERRORS

Vous pouvez spécifier cette option pour ignorer toutes les erreurs qui se produisent pendant l’opération de chargement.

Vous ne pouvez pas spécifier l'IGNOREALLERRORSoption si vous la MAXERROR spécifiez. Vous ne pouvez pas spécifier l'IGNOREALLERRORSoption pour les formats en colonnes, y compris ORC le parquet.

MAXERROR[AS] error_count

Si la charge renvoie le nombre d’erreurs error_count ou un nombre supérieur, la charge échoue. Si le chargement renvoie moins d'erreurs, il se poursuit et renvoie un INFO message indiquant le nombre de lignes qui n'ont pas pu être chargées. Utilisez ce paramètre pour permettre aux charges de continuer lorsque certaines lignes échouent à se charger dans la table en raison d’erreurs de mise en forme ou d’autres incohérences dans les données.

Définissez cette valeur sur 0 ou 1 si vous voulez que la charge échoue dès que la première erreur se produit. Le mot-clé AS est facultatif. La valeur MAXERROR par défaut est 0 et la limite est100000.

Le nombre réel d'erreurs signalées peut être supérieur au nombre spécifié en MAXERROR raison de la nature parallèle d'Amazon Redshift. Si un nœud du cluster Amazon Redshift détecte un dépassement, chaque nœud signale toutes les erreurs qu'il a rencontrées. MAXERROR

NOLOAD

Permet de vérifier la validité du fichier de données sans réellement charger les données. Utilisez le NOLOAD paramètre pour vous assurer que votre fichier de données se charge sans erreur avant d'exécuter le chargement de données proprement dit. L'exécution COPY avec le NOLOAD paramètre est beaucoup plus rapide que le chargement des données, car elle analyse uniquement les fichiers.

STATUPDATE[{SUR |TRUE} | {OFF|FALSE}]

Gère le calcul automatique et l'actualisation des statistiques de l'optimiseur à la fin d'une commande réussie. COPY Par défaut, si le STATUPDATE paramètre n'est pas utilisé, les statistiques sont mises à jour automatiquement si la table est initialement vide.

Chaque fois que l'ingestion de données dans une table non vide modifie de manière significative la taille de la table, nous vous recommandons de mettre à jour les statistiques en exécutant une ANALYZE commande ou en utilisant l'argument STATUPDATE ON.

Avec STATUPDATE ON (ouTRUE), les statistiques sont mises à jour automatiquement, que la table soit initialement vide ou non. S'il STATUPDATE est utilisé, l'utilisateur actuel doit être soit le propriétaire de la table, soit un superutilisateur. Si STATUPDATE ce n'est pas spécifié, seule une INSERT autorisation est requise.

Avec STATUPDATE OFF (ouFALSE), les statistiques ne sont jamais mises à jour.

Pour plus d’informations, consultez Analyse des tables.