Chargement des données à partir d’Amazon S3 - Amazon Redshift

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Chargement des données à partir d’Amazon S3

La COPY commande utilise l'architecture Amazon Redshift massively parallel processing MPP () pour lire et charger des données en parallèle à partir d'un ou de plusieurs fichiers d'un compartiment Amazon S3. Vous pouvez tirer le meilleur parti du traitement parallèle en fractionnant vos données en plusieurs fichiers, dans les cas où les fichiers sont compressés. (Il existe des exceptions à cette règle, qui sont détaillées dans la section Chargement de fichiers de données.) Vous pouvez aussi profiter au maximum du traitement parallèle en définissant les clés de distribution de vos tables. Pour plus d’informations sur les clés de distribution, consultez Distribution des données pour l'optimisation des requêtes.

Les données sont chargées dans la table cible, une ligne par ligne. Les champs du fichier de données sont mis en correspondance avec les colonnes de la table dans l’ordre, de gauche à droite. Les champs des fichiers de données peuvent être à largeur fixe ou délimités par un caractère ; le délimiteur par défaut est une barre verticale (|). Par défaut, toutes les colonnes de la table sont chargées, mais vous pouvez, le cas échéant, définir une liste de colonnes séparées par des virgules. Si une colonne de table n'est pas incluse dans la liste de colonnes spécifiée dans la COPY commande, elle est chargée avec une valeur par défaut. Pour de plus amples informations, veuillez consulter Chargement des valeurs par défaut des colonnes.