COPYà partir de formats de données en colonnes - Amazon Redshift

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

COPYà partir de formats de données en colonnes

COPYpeut charger des données depuis Amazon S3 dans les formats en colonnes suivants :

  • ORC

  • Parquet

Pour des exemples d'utilisation COPY de formats de données à partir de colonnes, voirCOPYexemples.

COPYprend en charge les données formatées en colonnes en tenant compte des considérations suivantes :

  • Le compartiment Amazon S3 doit se trouver dans le même AWS Région en tant que base de données Amazon Redshift.

  • Pour accéder à vos données Amazon S3 via un VPC point de terminaison, configurez l'accès à l'aide de IAM politiques et de IAM rôles, comme décrit dans la section Utilisation d'Amazon Redshift Spectrum with VPC Enhanced Routing du guide de gestion Amazon Redshift.

  • COPYn'applique pas automatiquement les codages de compression.

  • Seuls les COPY paramètres suivants sont pris en charge :

  • En COPY cas d'erreur lors du chargement, la commande échoue. ACCEPTANYDATEet MAXERROR ne sont pas pris en charge pour les types de données en colonnes.

  • Des messages d'erreur sont envoyés au SQL client. Certaines erreurs sont enregistrées dans STL _ LOAD _ ERRORS et STL _ERROR.

  • COPYinsère des valeurs dans les colonnes de la table cible dans l'ordre dans lequel les colonnes apparaissent dans les fichiers de données en colonnes. Le nombre de colonnes de la table cible et le nombre de colonnes du fichier de données doivent correspondre.

  • Si le fichier que vous spécifiez pour l'COPYopération inclut l'une des extensions suivantes, nous décompressons les données sans qu'il soit nécessaire d'ajouter de paramètres :

    • .gz

    • .snappy

    • .bz2

  • COPYdepuis le Parquet et les formats de ORC fichier utilisent Redshift Spectrum et l'accès au bucket. COPYPour utiliser ces formats, assurez-vous qu'aucune IAM politique ne bloque l'utilisation d'Amazon S3 presignedURLs. Les fichiers présignés URLs générés par Amazon Redshift sont valides pendant 1 heure afin qu'Amazon Redshift ait suffisamment de temps pour charger tous les fichiers depuis le compartiment Amazon S3. Un présigné unique URL est généré pour chaque fichier scanné à COPY partir de formats de données en colonnes. Pour les politiques de compartiment qui incluent une s3:signatureAge action, veillez à définir la valeur sur au moins 3 600 000 millisecondes. Pour plus d'informations, consultez la section Utilisation d'Amazon Redshift Spectrum avec un routage VPC amélioré.