Operazioni di caricamento dati - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Operazioni di caricamento dati

Gestisce il comportamento predefinito dell'operazione di caricamento per la risoluzione dei problemi o per ridurre i tempi di caricamento specificando i seguenti parametri.

Parametri
COMPROWSnumeri di righe

Specifica il numero di righe da utilizzare come dimensione del campione per l'analisi della compressione. L'analisi viene eseguita su righe da ciascuna sezione di dati. Ad esempio, se specifichi COMPROWS 1000000 (1,000,000) e il sistema contiene quattro sezioni totali, vengono lette e analizzate non più di 250.000 righe per ogni sezione.

Se COMPROWS non è specificato, la dimensione predefinita del campione è 100.000 per ogni fetta. I valori COMPROWS inferiori al valore predefinito di 100.000 righe per ogni sezione vengono aggiornati automaticamente al valore predefinito. Tuttavia, la compressione automatica non verrà eseguita se la quantità di dati caricati è insufficiente per produrre un campione significativo.

Se il COMPROWS numero è maggiore del numero di righe nel file di input, il COPY comando continua ed esegue l'analisi di compressione su tutte le righe disponibili. L'intervallo accettato per questo argomento è un numero compreso tra 1000 e 2147483647 (2.147.483.647).

COMPUPDATE[PRESET| {SU |TRUE} | {OFF|FALSE}]

Controlla se le codifiche di compressione vengono applicate automaticamente durante unCOPY.

In COMPUPDATE tal casoPRESET, il COPY comando sceglie la codifica di compressione per ogni colonna se la tabella di destinazione è vuota; anche se le colonne hanno già codifiche diverse da. RAW Le codifiche di colonna specificate attualmente possono essere sostituite. La codifica per ogni colonna si basa sul tipo di dati della colonna. Nessun dato viene campionato. Amazon Redshift assegna automaticamente la codifica della compressione come segue:

  • Alle colonne definite come chiavi di ordinamento viene assegnata la compressione. RAW

  • Alle colonne definite come BOOLEAN o ai tipi di DOUBLE PRECISION dati viene assegnata RAW la compressione. REAL

  • Le colonne definite comeSMALLINT,,INTEGER,BIGINT, DECIMAL DATETIMESTAMP, o a TIMESTAMPTZ cui è assegnata AZ64 la compressione.

  • Colonne definite come compressione CHAR o a VARCHAR cui è assegnata LZO la compressione.

Quando COMPUPDATE viene omesso, il COPY comando sceglie la codifica di compressione per ogni colonna solo se la tabella di destinazione è vuota e non è stata specificata una codifica (diversa daRAW) per nessuna delle colonne. La codifica per ciascuna colonna è determinata da Amazon Redshift. Nessun dato viene campionato.

Quando COMPUPDATE è ON (oTRUE) o COMPUPDATE è specificato senza un'opzione, il COPY comando applica la compressione automatica se la tabella è vuota, anche se le colonne della tabella hanno già codifiche diverse da. RAW Le codifiche di colonna specificate attualmente possono essere sostituite. La codifica di ciascuna colonna è basata su un'analisi dei dati campione. Per ulteriori informazioni, consulta Caricamento di tabelle con compressione automatica.

Quando COMPUPDATE è OFF (oFALSE), la compressione automatica è disabilitata. Le codifiche di colonna non vengono modificate.

Per informazioni sulla tabella di sistema per analizzare la compressione, consultare STL_ANALYZE_COMPRESSION.

IGNOREALLERRORS

Puoi specificare questa opzione per ignorare tutti gli errori che si verificano durante l'operazione di caricamento.

Non è possibile specificare l'IGNOREALLERRORSopzione se si specifica l'MAXERRORopzione. Non è possibile specificare l'IGNOREALLERRORSopzione per i formati colonnari, tra cui ParquetORC.

MAXERROR[AS] error_count

Se il caricamento restituisce il error_count numero di errori o superiore, il caricamento fallisce. Se il caricamento restituisce meno errori, continua e restituisce un INFO messaggio che indica il numero di righe che non è stato possibile caricare. Utilizza questo parametro per permettere la prosecuzione del caricamento quando alcune righe non vengono caricate nella tabella a causa di errori di formattazione o altre incongruenze nei dati.

Imposta questo valore su 0 o 1 se desideri che il caricamento fallisca non appena si verifica il primo errore. La parola chiave AS è facoltativa. Il valore MAXERROR predefinito è 0 e il limite è100000.

Il numero effettivo di errori segnalati potrebbe essere superiore a quello specificato a MAXERROR causa della natura parallela di Amazon Redshift. Se un nodo del cluster Amazon Redshift rileva che MAXERROR è stato superato il limite, ogni nodo segnala tutti gli errori riscontrati.

NOLOAD

Controlla la validità del file di dati senza caricare effettivamente i dati. Utilizza il NOLOAD parametro per assicurarti che il file di dati venga caricato senza errori prima di eseguire il caricamento effettivo dei dati. L'esecuzione COPY con il NOLOAD parametro è molto più veloce del caricamento dei dati perché analizza solo i file.

STATUPDATE[{ON |TRUE} | {OFF|FALSE}]

Gestisce il calcolo automatico e l'aggiornamento delle statistiche dell'ottimizzatore alla fine di un comando riuscito. COPY Per impostazione predefinita, se il STATUPDATE parametro non viene utilizzato, le statistiche vengono aggiornate automaticamente se la tabella è inizialmente vuota.

Ogni volta che l'inserimento di dati in una tabella non vuota modifica in modo significativo la dimensione della tabella, consigliamo di aggiornare le statistiche eseguendo un ANALYZE comando o utilizzando l'STATUPDATEargomento ON.

Con STATUPDATE ON (orTRUE), le statistiche vengono aggiornate automaticamente indipendentemente dal fatto che la tabella sia inizialmente vuota. Se STATUPDATE viene utilizzato, l'utente corrente deve essere il proprietario della tabella o un superutente. Se non STATUPDATE è specificato, è richiesta solo INSERT l'autorizzazione.

Con STATUPDATE OFF (orFALSE), le statistiche non vengono mai aggiornate.

Per ulteriori informazioni, consultare Analisi delle tabelle.