En esta sección se describe TICKIT, una base de datos de muestra que se utiliza en los ejemplos de la documentación de Amazon Redshift.
Esa base de datos pequeña consta de siete tablas: dos de hechos y cinco de dimensiones. Puede cargar el conjunto de datos de TICKIT si sigue los pasos que se indican en Paso 4: Cargar datos desde Amazon S3 a Amazon Redshift en la Guía de introducción a Amazon Redshift.

Esta aplicación de base de datos de muestra ayuda a los analistas a realizar un seguimiento de la actividad de ventas del sitio web ficticio TICKIT, en el que los usuarios compran y venden en línea tickets para eventos deportivos, espectáculos y conciertos. En particular, los analistas pueden identificar los movimientos de tickets en el tiempo, las tasas de éxito de los vendedores y los eventos, lugares y temporadas más vendidos. Los analistas pueden usar esta información para ofrecer incentivos a los compradores y vendedores que frecuentan el sitio, a fin de atraer a nuevos usuarios e impulsar la publicidad y las promociones.
Por ejemplo, la siguiente consulta encuentra los cinco vendedores principales de San Diego, en función de la cantidad de tickets vendidos en 2008:
select sellerid, username, (firstname ||' '|| lastname) as name,
city, sum(qtysold)
from sales, date, users
where sales.sellerid = users.userid
and sales.dateid = date.dateid
and year = 2008
and city = 'San Diego'
group by sellerid, username, name, city
order by 5 desc
limit 5;
sellerid | username | name | city | sum
----------+----------+-------------------+-----------+-----
49977 | JJK84WTE | Julie Hanson | San Diego | 22
19750 | AAS23BDR | Charity Zimmerman | San Diego | 21
29069 | SVL81MEQ | Axel Grant | San Diego | 17
43632 | VAG08HKW | Griffin Dodson | San Diego | 16
36712 | RXT40MKU | Hiram Turner | San Diego | 14
(5 rows)
La base de datos usada para los ejemplos de esta guía presenta un conjunto de datos pequeño; cada una de las dos tablas de hechos tiene menos de 200 000 filas y las dimensiones varían, de 11 filas en la tabla CATEGORY hasta, aproximadamente, 50 000 en la tabla USERS.
En particular, los ejemplos de base de datos de esta guía demuestran las características clave del diseño de tablas de Amazon Redshift:
-
Distribución de datos
-
Orden de datos
-
Compresión en columnas
Para obtener información sobre los esquemas de las tablas de la base de datos TICKIT, elija las siguientes pestañas:
Nombre de la columna | Tipo de datos | Descripción |
---|---|---|
CATID | SMALLINT | Clave primaria, un valor de ID único para cada fila. Cada fila representa un tipo de evento específico para el cual se compran y venden tickets. |
CATGROUP | VARCHAR (10) | Nombre descriptivo de un grupo de eventos, como Shows y Sports . |
CATNAME | VARCHAR (10) | Nombre descriptivo abreviado de un tipo de eventos en un grupo, como Opera y Musicals . |
CATDESC | VARCHAR(50) | Nombre descriptivo más largo del tipo de evento, como Musical theatre . |