Einschränkungen Vererbung von Spalten- und Tabellenattributen Kompressionskodierung Verteilung eingehender Daten Automatische ANALYZE-Operationen

Amazon Redshift unterstützt die Verwendung von Python-UDFs nach dem 30. Juni 2026 nicht mehr. Wir werden damit beginnen, es schrittweise durchzusetzen. Weitere Informationen zu den Einzelheiten zum Ende der Lebensdauer und zu den Migrationsoptionen von Python finden Sie in dem Blogbeitrag, der am 30. Juni 2025 veröffentlicht wurde.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Nutzungshinweise für CTAS

Einschränkungen

Amazon Redshift erzwingt ein Kontingent für die Anzahl der Tabellen pro Cluster nach Knotentyp.

Die maximale Anzahl von Zeichen für einen Tabellennamen ist 127.

Die maximale Anzahl der Spalten, die Sie in einer einzelnen Tabelle definieren können, ist 1.600.

Vererbung von Spalten- und Tabellenattributen

CREATE TABLE AS (CTAS)-Tabellen erben keine Einschränkungen, Identitätsspalten, Standardspaltenwerte oder den Primärschlüssel aus der Tabelle, aus der sie erstellt wurden.

Sie können für CTAS-Tabellen keine Spaltenkomprimierungskodierungen angeben. Amazon Redshift weist die Komprimierungskodierung automatisch wie folgt zu:

Spalten, die als Sortierschlüssel definiert sind, wird die RAW-Kompression zugewiesen.
Spalten, die als Datentyp BOOLEAN, REAL, DOUBLE PRECISION, GEOMETRY oder GEOGRAPHY definiert sind, wird die RAW-Kompression zugewiesen.
Spalten, die als SMALLINT, INTEGER, BIGINT, DECIMAL, DATE, TIME, TIMETZ, TIMESTAMP oder TIMESTAMPTZ definiert sind, wird die AZ64-Komprimierung zugewiesen.
Spalten, die als CHAR, VARCHAR oder VARBYTE definiert sind, wird LZO-Komprimierung zugewiesen.

Weitere Informationen erhalten Sie unter Kompressionskodierungen und Datentypen.

Um Spaltenkodierungen explizit zuzuweisen, verwenden Sie CREATE TABLE.

CTAS legt den Verteilungsstil und Sortierschlüssel für die neue Tabelle anhand des Abfrageplans für die SELECT-Klausel fest.

Im Fall komplexer Abfragen wie Abfragen mit Joins, Aggregationen, einer ORDER BY-Klausel oder einer LIMIT-Klausel wählt CTAS den bestmöglichen Verteilungsstil und Sortierschlüssel auf der Basis des Abfrageplans aus.

Anmerkung

Um für große Datensätze oder komplexe Abfragen eine optimale Leistung zu erzielen, werden Tests mit typischen Datensätzen empfohlen.

Häufig können Sie vorhersagen, welchen Verteilungsstil und Sortierschlüssel CTAS wählen wird, indem Sie im Abfrageplan ermitteln, welche Spalten der Abfrageoptimierer zum Sortieren und Verteilen von Daten auswählt. Wenn es sich beim obersten Knoten des Abfrageplans um einen einfache sequenziellen Scan aus einer einzelnen Tabelle handelt (XN Seq Scan), verwendet CTAS in der Regel den Verteilungsstil und Sortierschlüssel der Quelltabelle. Wenn es sich bei dem obersten Knoten des Abfrageplans um einen anderen sequentiellen Scan handelt (z. B. XN Limit, XN Sort, XN usw.) HashAggregate, bemüht sich CTAS nach besten Kräften, den optimalen Verteilungsstil und den optimalen Sortierschlüssel auf der Grundlage des Abfrageplans auszuwählen.

Angenommen, Sie erstellen fünf Tabellen mit den folgenden Arten von SELECT-Klauseln:

Eine einfache SELECT-Anweisung
Eine Limit-Klausel
Eine Reihenfolgenklausel unter Verwendung von LISTID
Eine Reihenfolgenklausel unter Verwendung von QTYSOLD
Eine SUM-Aggregationsfunktion mit einer Gruppierungsklausel.

In den folgenden Beispielen wird der Abfrageplan für die einzelnen CTAS-Anweisungen gezeigt.


explain create table sales1_simple as select listid, dateid, qtysold from sales;
                           QUERY PLAN
----------------------------------------------------------------
 XN Seq Scan on sales  (cost=0.00..1724.56 rows=172456 width=8)
(1 row)


explain create table sales2_limit as select listid, dateid, qtysold from sales limit 100;
                              QUERY PLAN
----------------------------------------------------------------------
 XN Limit  (cost=0.00..1.00 rows=100 width=8)
   ->  XN Seq Scan on sales  (cost=0.00..1724.56 rows=172456 width=8)
(2 rows)


explain create table sales3_orderbylistid as select listid, dateid, qtysold from sales order by listid;
                               QUERY PLAN
------------------------------------------------------------------------
 XN Sort  (cost=1000000016724.67..1000000017155.81 rows=172456 width=8)
   Sort Key: listid
   ->  XN Seq Scan on sales  (cost=0.00..1724.56 rows=172456 width=8)
(3 rows)


explain create table sales4_orderbyqty as select listid, dateid, qtysold from sales order by qtysold;
                               QUERY PLAN
------------------------------------------------------------------------
 XN Sort  (cost=1000000016724.67..1000000017155.81 rows=172456 width=8)
   Sort Key: qtysold
   ->  XN Seq Scan on sales  (cost=0.00..1724.56 rows=172456 width=8)
(3 rows)


explain create table sales5_groupby as select listid, dateid, sum(qtysold) from sales group by listid, dateid;
                              QUERY PLAN
----------------------------------------------------------------------
 XN HashAggregate  (cost=3017.98..3226.75 rows=83509 width=8)
   ->  XN Seq Scan on sales  (cost=0.00..1724.56 rows=172456 width=8)
(2 rows)

Um den Verteilungs- und Sortierschlüssel für jede Tabelle anzuzeigen, führen Sie eine Abfrage für die Systemkatalogtabelle PG_TABLE_DEF aus wie im Folgenden gezeigt.


select * from pg_table_def where tablename like 'sales%';

      tablename       |   column   | distkey | sortkey
----------------------+------------+---------+---------
 sales                | salesid    | f       |       0
 sales                | listid     | t       |       0
 sales                | sellerid   | f       |       0
 sales                | buyerid    | f       |       0
 sales                | eventid    | f       |       0
 sales                | dateid     | f       |       1
 sales                | qtysold    | f       |       0
 sales                | pricepaid  | f       |       0
 sales                | commission | f       |       0
 sales                | saletime   | f       |       0
 sales1_simple        | listid     | t       |       0
 sales1_simple        | dateid     | f       |       1
 sales1_simple        | qtysold    | f       |       0
 sales2_limit         | listid     | f       |       0
 sales2_limit         | dateid     | f       |       0
 sales2_limit         | qtysold    | f       |       0
 sales3_orderbylistid | listid     | t       |       1
 sales3_orderbylistid | dateid     | f       |       0
 sales3_orderbylistid | qtysold    | f       |       0
 sales4_orderbyqty    | listid     | t       |       0
 sales4_orderbyqty    | dateid     | f       |       0
 sales4_orderbyqty    | qtysold    | f       |       1
 sales5_groupby       | listid     | f       |       0
 sales5_groupby       | dateid     | f       |       0
 sales5_groupby       | sum        | f       |       0

In der folgenden Tabelle werden die Ergebnisse zusammengefasst. Aus Gründen der Einfachheit werden Details zu Kosten, Zeilen und zur Breite aus dem Beispielplan ausgelassen.

Tabelle	CTAS-SELECT-Anweisung	Oberster Knoten des Beispielplans	Verteilungsschlüssel	Sortierschlüssel
S1_SIMPLE	`select listid, dateid, qtysold from sales`	`XN Seq Scan on sales ...`	LISTID	DATEID
S2_LIMIT	`select listid, dateid, qtysold from sales limit 100`	`XN Limit ...`	Kein (EVEN)	Keine
S3_ORDER_BY_LISTID	`select listid, dateid, qtysold from sales order by listid`	`XN Sort ...` `Sort Key: listid`	LISTID	LISTID
S4_ORDER_BY_QTY	`select listid, dateid, qtysold from sales order by qtysold`	`XN Sort ...` `Sort Key: qtysold`	LISTID	QTYSOLD
S5_GROUP_BY	`select listid, dateid, sum(qtysold) from sales group by listid, dateid`	`XN HashAggregate ...`	Kein (EVEN)	Keine

Sie können den Verteilungsstil und Sortierschlüssel in der CTAS-Anweisung explizit angeben. Die folgende Anweisung erstellt beispielsweise eine Tabelle mit der Verteilung EVEN und gibt SALESID als Sortierschlüssel an.


create table sales_disteven
diststyle even
sortkey (salesid)
as
select eventid, venueid, dateid, eventname
from event;

Kompressionskodierung

ENCODE AUTO wird Standardeinstellung für Tabellen verwendet. Amazon Redshift verwaltet automatisch die Komprimierungskodierung für alle Spalten in der Tabelle.

Verteilung eingehender Daten

Wenn das Hash-Verteilungsschema der eingehenden Daten dem der Zieltabelle entspricht, ist keine physische Verteilung der Daten notwendig, wenn die Daten geladen werden. Wenn beispielsweise ein Verteilungsschlüssel für die neue Tabelle festgelegt wird und die Daten aus einer anderen Tabelle eingefügt werden, die anhand der gleichen Schlüsselspalte verteilt wird, werden die Daten unter Verwendung derselben Knoten und Slices entsprechend geladen. Wenn jedoch sowohl die Quell- als auch die Zieltabelle auf eine EVEN-Verteilung festgelegt sind, werden die Daten neu zur Zieltabelle verteilt.

Automatische ANALYZE-Operationen

Amazon Redshift analysiert automatisch Tabellen, die Sie mit CTAS-Befehlen erstellen. Sie müssen den Befehl ANALYZE nicht für diese Tabellen ausführen, wenn sie erstellt werden. Wenn Sie sie ändern, sollten Sie sie jedoch genauso wie andere Tabellen analysieren.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

CREATE TABLE AS

CTAS-Beispiele