Datenladeoperationen - Amazon Redshift

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Datenladeoperationen

Verwalten Sie das Standardverhalten der Ladeoperation, um Fehler zu beheben oder die Ladezeiten zu reduzieren, indem Sie die folgenden Parameter angeben.

Parameter
COMPROWSZahlen

Gibt die Anzahl der Zeilen an, die als Stichprobengröße für Kompressionsanalysen verwendet werden soll. Die Analyse wird für Zeilen aus jedem Daten-Slice ausgeführt. Wenn Sie beispielsweise COMPROWS 1000000 (1.000.000) angeben und das System insgesamt vier Slices enthält, werden nicht mehr als 250.000 Zeilen pro Slice gelesen und analysiert.

Wenn COMPROWS nicht angegeben, beträgt die Standardgröße für jedes Segment 100.000. Werte, die COMPROWS unter dem Standardwert von 100.000 Zeilen für jedes Segment liegen, werden automatisch auf den Standardwert aktualisiert. Es findet jedoch keine automatische Kompression statt, wenn die Menge der geladenen Daten nicht für eine relevante Stichrobe reicht.

Wenn die COMPROWS Anzahl größer als die Anzahl der Zeilen in der Eingabedatei ist, fährt der COPY Befehl trotzdem fort und führt die Komprimierungsanalyse für alle verfügbaren Zeilen aus. Der akzeptierte Bereich für dieses Argument ist eine Zahl zwischen 1000 und 2147483647 (2,147,483,647).

COMPUPDATE[PRESET| {ON |TRUE} | {OFF|FALSE}]

Steuert, ob Kompressionskodierungen während eines COPY automatisch angewendet werden.

Wenn dies der PRESET Fall COMPUPDATE ist, wählt der COPY Befehl die Komprimierungskodierung für jede Spalte aus, wenn die Zieltabelle leer ist. Dies gilt auch dann, wenn die Spalten bereits andere Kodierungen als haben. RAW Aktuell angegebene Spaltenkodierungen können ersetzt werden. Die Codierung jeder Spalte basiert auf dem Datentyp der Spalte. Es werden keine Stichproben der Daten genommen. Amazon Redshift weist die Komprimierungskodierung automatisch wie folgt zu:

  • Spalten, die als Sortierschlüssel definiert sind, wird RAW Komprimierung zugewiesen.

  • Spalten, die als BOOLEANREAL, oder DOUBLE PRECISION Datentypen definiert sind, wird RAW Komprimierung zugewiesen.

  • Spalten, die alsSMALLINT,,, INTEGER BIGINT DECIMAL DATETIMESTAMP, oder definiert TIMESTAMPTZ sind oder denen eine AZ64 Komprimierung zugewiesen wurde.

  • Spalten, die als Komprimierung definiert VARCHAR sind CHAR oder denen LZO Komprimierung zugewiesen wurde.

Wenn diese Option weggelassen COMPUPDATE wird, wählt der COPY Befehl die Komprimierungskodierung für jede Spalte nur dann aus, wenn die Zieltabelle leer ist und Sie für keine der Spalten eine andere Kodierung alsRAW) angegeben haben. Die Kodierung einer jeden Spalte wird durch Amazon Redshift bestimmt. Es werden keine Stichproben der Daten genommen.

Wenn COMPUPDATE auf ON (oderTRUE) gesetzt oder ohne Option angegeben wurde, wendet der COPY Befehl eine automatische Komprimierung an, wenn die Tabelle leer ist. Dies gilt auch dann, wenn die Tabellenspalten bereits andere Kodierungen als RAW haben. COMPUPDATE Aktuell angegebene Spaltenkodierungen können ersetzt werden. Die Kodierung einer jeden Spalte basiert auf der Analyse von Stichprobendaten. Weitere Informationen finden Sie unter Laden von Tabellen mit automatischer Kompression.

Wenn OFF (oderFALSE) COMPUPDATE ist, ist die automatische Komprimierung deaktiviert. Spaltenkodierungen werden nicht geändert.

Informationen zur Systemtabelle für die Analyse der Komprimierung finden Sie unter STL_ANALYZE_COMPRESSION.

IGNOREALLERRORS

Sie können diese Option angeben, wenn alle Fehler, die während des Ladevorgangs auftreten, ignoriert werden sollen.

Sie können die IGNOREALLERRORS Option nicht angeben, wenn Sie die MAXERROR Option angeben. Sie können die IGNOREALLERRORS Option nicht für spaltenförmige Formate wie ORC Parquet angeben.

MAXERROR[AS] error_count

Wenn der Ladevorgang error_count Fehler oder mehr zurückgibt, schlägt der Ladevorgang fehl. Wenn der Ladevorgang weniger Fehler zurückgibt, wird er fortgesetzt und es wird eine INFO Meldung mit der Anzahl der Zeilen zurückgegeben, die nicht geladen werden konnten. Sie verwenden diesen Parameter, um die Fortsetzung von Ladevorgängen zuzulassen, wenn bestimmte Zeilen aufgrund von Formatierungsfehlern oder aufgrund anderer Inkonsistenzen in den Daten nicht in die Tabelle geladen werden können.

Legen Sie diesen Wert auf 0 oder 1 fest, wenn der Ladevorgang fehlschlagen soll, sobald der erste Fehler auftritt. Das Schlüsselwort AS ist optional. Der MAXERROR Standardwert ist 0 und der Grenzwert ist100000.

Die tatsächliche Anzahl der gemeldeten Fehler kann MAXERROR aufgrund der Parallelität von Amazon Redshift höher als angegeben sein. Wenn ein Knoten im Amazon Redshift Redshift-Cluster feststellt, dass diese überschritten MAXERROR wurde, meldet jeder Knoten alle aufgetretenen Fehler.

NOLOAD

Prüft die Gültigkeit der Datendatei, ohne die Daten tatsächlich zu laden. Verwenden Sie den NOLOAD Parameter, um sicherzustellen, dass Ihre Datendatei fehlerfrei geladen wird, bevor Sie den eigentlichen Datenladevorgang ausführen. Das Ausführen COPY mit dem NOLOAD Parameter ist viel schneller als das Laden der Daten, da nur die Dateien analysiert werden.

STATUPDATE[{ON |TRUE} | {OFF|FALSE}]

Steuert die automatische Berechnung und Aktualisierung der Optimizer-Statistiken am Ende eines erfolgreichen Befehls. COPY Wenn der STATUPDATE Parameter nicht verwendet wird, werden Statistiken standardmäßig automatisch aktualisiert, wenn die Tabelle anfänglich leer ist.

Immer wenn das Aufnehmen von Daten in eine nicht leere Tabelle die Größe der Tabelle erheblich verändert, empfehlen wir, die Statistiken entweder durch Ausführen eines ANALYZE Befehls oder mithilfe des Arguments STATUPDATE ON zu aktualisieren.

Mit STATUPDATE ON (oderTRUE) werden Statistiken automatisch aktualisiert, unabhängig davon, ob die Tabelle anfänglich leer ist. Wenn verwendet STATUPDATE wird, muss der aktuelle Benutzer entweder der Tabellenbesitzer oder ein Superuser sein. Wenn nicht angegeben, STATUPDATE ist nur eine INSERT Genehmigung erforderlich.

Mit STATUPDATE OFF (oderFALSE) werden Statistiken niemals aktualisiert.

Weitere Informationen finden Sie unter Analysieren von Tabellen.