Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Beispieldatenbank
In diesem Abschnitt wird eine Beispieldatenbank beschriebenTICKIT, die in Amazon Redshift Redshift-Dokumentationsbeispielen verwendet wird.
Diese kleine Datenbank enthält sieben Tabellen, zwei Faktentabellen und fünf Dimensionen. Sie können den TICKIT Datensatz laden, indem Sie den Schritten in Schritt 4: Daten von Amazon S3 nach Amazon Redshift laden im Amazon Redshift Getting Started Guide folgen.
Mit dieser Beispieldatenbankanwendung können Analysten die Verkaufsaktivitäten für die fiktive TICKIT Website verfolgen, auf der Benutzer Tickets für Sportveranstaltungen, Shows und Konzerte online kaufen und verkaufen. Analysten können damit insbesondere die Bewegungen von Tickets über die Zeit identifizieren, sowie Abschlussraten für Verkäufer und die Ereignisse, Austragungsorte und Spielzeiten ermitteln, die sich am besten verkaufen. Analysten können anhand dieser Informationen Käufern und Verkäufern auf dieser Website Anreize geben, um neue Benutzer anzuziehen und Anzeigen und Werbeaktionen zu fördern.
Die folgende Abfrage ermittelt beispielsweise die Top 5-Verkäufer in San Diego, ausgehend von der Anzahl der 2008 verkauften Tickets:
select sellerid, username, (firstname ||' '|| lastname) as name,
city, sum(qtysold)
from sales, date, users
where sales.sellerid = users.userid
and sales.dateid = date.dateid
and year = 2008
and city = 'San Diego'
group by sellerid, username, name, city
order by 5 desc
limit 5;
sellerid | username | name | city | sum
----------+----------+-------------------+-----------+-----
49977 | JJK84WTE | Julie Hanson | San Diego | 22
19750 | AAS23BDR | Charity Zimmerman | San Diego | 21
29069 | SVL81MEQ | Axel Grant | San Diego | 17
43632 | VAG08HKW | Griffin Dodson | San Diego | 16
36712 | RXT40MKU | Hiram Turner | San Diego | 14
(5 rows)
Die für die Beispiele in diesem Handbuch verwendete Datenbank enthält einen kleinen Datensatz. Die beiden Faktentabellen enthalten jeweils weniger als 200.000 Zeilen, und die Dimensionen reichen von 11 Zeilen in der CATEGORY Tabelle bis zu etwa 50.000 Zeilen in der USERS Tabelle.
Die Datenbankbeispiele in diesem Handbuch sollen insbesondere zentrale Funktionen beim Entwurf von Amazon-Redshift-Tabellen demonstrieren:
-
Datenverteilung
-
Datensortierung
-
Spaltenkompression
Informationen zu den Schemas der Tabellen in der TICKIT Datenbank finden Sie auf den folgenden Registerkarten:
- CATEGORY table
-
Spaltenname |
Datentyp |
Beschreibung |
CATID
|
SMALLINT
|
Primärschlüssel, eine eindeutige Kennung für jede Zeile. Jede Zeile stellt eine spezifische Art von Event dar, für die Tickets gekauft und verkauft werden. |
CATGROUP
|
VARCHAR(10) |
Beschreibender Name für eine Gruppe von Events, beispielsweise Shows oder Sports . |
CATNAME
|
VARCHAR(10) |
Kurzer beschreibender Name für eine Art von Events innerhalb einer Gruppe, beispielsweise Opera oder Musicals . |
CATDESC
|
VARCHAR(50) |
Längerer beschreibender Name für eine Art von Events, beispielsweise Musical theatre . |
- DATE table
-
Spaltenname |
Datentyp |
Beschreibung |
DATEID
|
SMALLINT
|
Primärschlüssel, eine eindeutige Kennung für jede Zeile. Jedes Zeile steht für einen Tag im Kalenderjahr. |
CALDATE
|
DATE
|
Kalenderdatum, beispielsweise 2008-06-24 . |
DAY
|
CHAR(3) |
Wochentag (abgekürzt), beispielsweise SA . |
WEEK
|
SMALLINT
|
Nummer der Kalenderwoche, beispielsweise 26 . |
MONTH
|
CHAR(5) |
Monatsname (abgekürzt), beispielsweise JUN . |
QTR
|
CHAR(5) |
Quartalsnummer (1 bis 4 ). |
YEAR
|
SMALLINT
|
Das vierstellige Jahr (2008 ). |
HOLIDAY
|
BOOLEAN
|
Flag zur Angabe, ob der Tag ein öffentlicher Feiertag (in den USA) ist. |
- EVENT table
-
Spaltenname |
Datentyp |
Beschreibung |
EVENTID
|
INTEGER
|
Primärschlüssel, eine eindeutige Kennung für jede Zeile. Jede Zeile stellt ein eigenes Event dar, das an einem bestimmten Ort und zu einer bestimmten Zeit stattfindet. |
VENUEID
|
SMALLINT
|
Fremdschlüsselverweis auf die Tabelle. VENUE |
CATID
|
SMALLINT
|
Fremdschlüsselverweis auf die Tabelle. CATEGORY |
DATEID
|
SMALLINT
|
Fremdschlüsselverweis auf die Tabelle. DATE |
EVENTNAME
|
VARCHAR(200) |
Name des Ereignisses, etwa Hamlet oder La Traviata . |
STARTTIME
|
TIMESTAMP
|
Vollständige Angabe von Datum und Uhrzeit, beispielsweise 2008-10-10 19:30:00 . |
- VENUE table
-
Spaltenname |
Datentyp |
Beschreibung |
VENUEID
|
SMALLINT
|
Primärschlüssel, eine eindeutige Kennung für jede Zeile. Jede Zeile stellt einen eigenen Veranstaltungsort dar, an dem Events stattfinden. |
VENUENAME
|
VARCHAR(100) |
Exakter Name des Ortes, beispielsweise Cleveland Browns Stadium . |
VENUECITY
|
VARCHAR(30) |
Name des Ortes, beispielsweise Cleveland . |
VENUESTATE
|
CHAR(2) |
Abkürzung des Bundesstaats bzw. der Provinz (in den USA bzw. in Kanada), beispielsweise OH . |
VENUESEATS
|
INTEGER
|
Maximale Anzahl verfügbarer Plätze an dem Veranstaltungsort (falls bekannt), beispielsweise 73200 . Diese Spalte enthält zur Illustration von Sonderfällen auch Nullwerte und Nullen. |
- USERS table
-
Spaltenname |
Datentyp |
Beschreibung |
USERID
|
INTEGER
|
Primärschlüssel, eine eindeutige Kennung für jede Zeile. Jede Zeile stellt einen registrierten Benutzer (Käufer, Verkäufer oder beides) dar, der Tickets für mindestens ein Event angeboten oder gekauft hat. |
USERNAME
|
CHAR(8) |
Ein 8 Zeichen langer, alphanumerischer Benutzername, beispielsweise PGL08LJI . |
FIRSTNAME
|
VARCHAR(30) |
Der Vorname des Benutzers, beispielsweise Victor . |
LASTNAME
|
VARCHAR(30) |
Der Nachname des Benutzers, beispielsweise Hernandez . |
CITY
|
VARCHAR(30) |
Der Heimatort Benutzers, beispielsweise Naperville . |
STATE
|
CHAR(2) |
Der Bundesstaat aus der Heimatanschrift des Benutzers, beispielsweise GA . |
EMAIL
|
VARCHAR(100) |
Die E-Mail-Adresse des Benutzers; diese Spalte enthält zufällige lateinschriftliche Werte, wie etwa turpis@accumsanlaoreet.org . |
PHONE
|
CHAR(14) |
Die 14 Zeichen lange Telefonnummer des Benutzers, beispielsweise (818) 765-4255 . |
LIKESPORTS, ...
|
BOOLEAN
|
Eine Reihe von 10 verschiedenen Spalten zur Angabe der Benutzerpräferenzen bei Events, mit möglichen Werten true oder false , |
- LISTING table
-
Spaltenname |
Datentyp |
Beschreibung |
LISTID
|
INTEGER
|
Primärschlüssel, eine eindeutige Kennung für jede Zeile. Jede Zeile stellt ein Listing für ein Batch an Tickets für ein spezifisches Event dar. |
SELLERID
|
INTEGER
|
Fremdschlüsselverweis auf die USERS Tabelle, der den Benutzer identifiziert, der die Tickets verkauft. |
EVENTID
|
INTEGER
|
Fremdschlüsselverweis auf die Tabelle. EVENT |
DATEID
|
SMALLINT
|
Fremdschlüsselverweis auf die Tabelle. DATE |
NUMTICKETS
|
SMALLINT
|
Die Anzahl der zum Verkauf stehenden Tickets, beispielsweise 2 oder 20 . |
PRICEPERTICKET
|
DECIMAL(8,2) |
Der Festpreis für ein einzelnes Ticket, beispielsweise 27.00 oder 206.00 . |
TOTALPRICE
|
DECIMAL(8,2) |
Der Gesamtpreis für dieses Angebot (NUMTICKETS*PRICEPERTICKET). |
LISTTIME
|
TIMESTAMP
|
Vollständige Angabe von Datum und Uhrzeit, zu der das Listing gebucht wurde, beispielsweise 2008-03-18 07:19:35 . |
- SALES table
-
Spaltenname |
Datentyp |
Beschreibung |
SALESID
|
INTEGER
|
Primärschlüssel, eine eindeutige Kennung für jede Zeile. Jede Zeile stellt eine einen Verkauf von einem oder mehreren Tickets für ein bestimmtes Event dar, wie in einem spezifischen Listing angeboten. |
LISTID
|
INTEGER
|
Fremdschlüssel-Verweis auf die Tabelle. LISTING |
SELLERID
|
INTEGER
|
Fremdschlüsselverweis auf die USERS Tabelle (der Benutzer, der die Tickets verkauft hat). |
BUYERID
|
INTEGER
|
Fremdschlüsselverweis auf die USERS Tabelle (der Benutzer, der die Tickets gekauft hat). |
EVENTID
|
INTEGER
|
Fremdschlüsselverweis auf die Tabelle. EVENT |
DATEID
|
SMALLINT
|
Fremdschlüsselverweis auf die Tabelle. DATE |
QTYSOLD
|
SMALLINT
|
Die Anzahl der verkauften Tickets, ein Wert zwischen 1 und 8 . (Es können pro Transaktion maximal 8 Tickets verkauft werden). |
PRICEPAID
|
DECIMAL(8,2) |
Der Gesamtpreis, der für die Tickets bezahlt wurde, beispielsweise 75.00 oder 488.00 . Der Einzelpreis eines Tickets istPRICEPAID/QTYSOLD. |
COMMISSION
|
DECIMAL(8,2) |
Der Betrag der 15 % Kommission, den das Geschäft aus dem Verkauf einnimmt, beispielsweise 11.25 oder 73.20 . Der Verkäufer erhält 85% des PRICEPAID Wertes. |
SALETIME
|
TIMESTAMP
|
Vollständige Angabe von Datum und Uhrzeit, zu der der Verkauf abgeschlossen wurde, beispielsweise 2008-05-24 06:21:47 . |