COPY da formati di dati a colonna - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

COPY da formati di dati a colonna

COPY può caricare i dati da Amazon S3 nei seguenti formati di colonna:

  • ORC

  • Parquet

Per esempi di utilizzo di COPY con formati di dati colonnari, consulta Esempi di COPY.

COPY supporta dati in formato colonnare con le seguenti considerazioni:

  • Il bucket Amazon S3 deve trovarsi nella stessa AWS regione del database Amazon Redshift.

  • Per accedere ai dati Amazon S3 tramite un endpoint VPC, configurare l'accesso utilizzando le policy e i ruoli IAM come descritto in Utilizzo di Amazon Redshift Spectrum con il routing VPC avanzato nella Guida alla gestione di Amazon Redshift.

  • COPY non applica automaticamente le codifiche di compressione.

  • Sono supportati solo i seguenti parametri COPY:

  • Se COPY rileva un errore durante il caricamento, il comando fallisce. ACCEPTANYDATE e MAXERROR non sono supportati per i tipi di dati colonnari..

  • I messaggi di errore vengono inviati al client SQL. Alcuni errori vengono registrati in STL_LOAD_ERRORS e STL_ERROR.

  • COPY inserisce i valori nelle colonne della tabella di destinazione nello stesso ordine in cui si presentano le colonne nei file di dati a colonna. Il numero di colonne nella tabella di destinazione e il numero di colonne nel file di dati devono corrispondere.

  • Se il file specificato per l'operazione COPY include una delle seguenti estensioni, decomprimiamo i dati senza la necessità di aggiungere alcun parametro:

    • .gz

    • .snappy

    • .bz2

  • Il COPY dai formati di file Parquet e ORC utilizza Redshift Spectrum e l'accesso al bucket. Per utilizzare COPY per questi formati, assicurati che non vi siano policy IAM che blocchino l'uso di URL predefiniti di Amazon S3. Gli URL predefiniti generati da Amazon Redshift sono validi per 1 ora, in modo che Amazon Redshift abbia abbastanza tempo per caricare tutti i file dal bucket Amazon S3. Viene generato un URL predefinito univoco per ogni file scansionato da COPY da formati di dati colonnari. Per le policy bucket che includono un's3:signatureAgeazione, assicurati di impostare il valore su almeno 3.600.000 millisecondi. Per ulteriori informazioni, consultare Utilizzo di Amazon Redshift Spectrum con il routing VPC avanzato.