Cómo crear una Cuenta de AWS Determinación de reglas de firewall Paso 1: Crear un clúster de muestra Paso 2: Configurar las reglas de entrada para los clientes SQL Paso 3: otorgar acceso a un cliente de SQL y ejecutar consultas Paso 4: Cargar datos desde Amazon S3 en Amazon Redshift Paso 5: Probar consultas de ejemplo mediante el editor de consultas Paso 6: Restablecer su entorno

Introducción a los almacenamientos de datos aprovisionados de Amazon Redshift

Si es la primera vez que utiliza Amazon Redshift, le recomendamos que lea las secciones siguientes como ayuda para comenzar a utilizar los clústeres aprovisionados. El flujo básico de Amazon Redshift consiste en crear recursos aprovisionados, conectarse a Amazon Redshift, cargar datos de muestra y, a continuación, ejecutar consultas en los datos. En esta guía, puede elegir cargar los datos de muestra desde Amazon Redshift o desde un bucket de Amazon S3. Los datos de muestra se utilizan en toda la documentación de Amazon Redshift para demostrar características.

En este tutorial se muestra cómo utilizar los clústeres aprovisionados de Amazon Redshift, que son objetos de almacenamiento de datos de AWS para los que se administran los recursos del sistema. También puede usar Amazon Redshift con grupos de trabajo sin servidor, que son objetos de almacenamiento de datos que se escalan automáticamente en respuesta al uso. Para empezar a utilizar Redshift sin servidor, consulte Introducción a los almacenamientos de datos de Amazon Redshift sin servidor.

Después de crear la consola de Amazon Redshift y de iniciar sesión en ella, puede crear y administrar objetos de Amazon Redshift, incluidos clústeres, nodos y bases de datos. También puede ejecutar consultas, ver consultas y realizar otras operaciones del lenguaje de definición de datos (DDL) y del lenguaje de manipulación de datos (DML) con un cliente de SQL.

importante

El clúster que aprovisionó para este ejercicio se ejecuta en un entorno real. Mientras esté en ejecución, acumula cargos en su Cuenta de AWS. Para obtener información acerca de los precios, consulte la página de precios de Amazon Redshift.

Para evitar cargos innecesarios, elimine su clúster cuando termine de usarlo. En la última sección de este capítulo se explica cómo hacerlo.

Inicie sesión en la AWS Management Console y abra la consola de Amazon Redshift en https://console.aws.amazon.com/redshiftv2/.

Le recomendamos que, para empezar, vaya al Panel de clústeres aprovisionados para empezar a utilizar la consola de Amazon Redshift.

Según la configuración, los siguientes elementos aparecen en el panel de navegación de la consola aprovisionada de Amazon Redshift:

‎Redshift sin servidor: acceda a los datos y analícelos sin necesidad de configurar, ajustar ni administrar clústeres aprovisionados de Amazon Redshift.
Panel de clústeres aprovisionados: compruebe los clústeres en su Región de AWS, compruebe Métricas del clúster e Información general sobre consultas para obtener información de los datos de las métricas (como uso de la CPU) e información de consultas. El uso de estas opciones puede ayudarlo a determinar si los datos de rendimiento son anormales en un intervalo temporal especificado.
Clústeres: vea su lista de clústeres en esta Región de AWS, elija un clúster para comenzar a realizar consultas o realizar acciones relacionadas con el clúster. También puede crear un clúster nuevo desde esta página.
Editor de consultas: ejecute consultas en las bases de datos alojadas en el clúster de Amazon Redshift. Recomendamos utilizar el editor de consultas v2.
Editor de consultas v2: el editor de consultas de Amazon Redshift v2 es una aplicación de cliente de SQL independiente basada en web para crear y ejecutar consultas en el almacenamiento de datos de Amazon Redshift. Puede visualizar los resultados en gráficos y colaborar si comparte sus consultas con otros miembros del equipo.
Queries and loads (Consultas y cargas): obtenga información para referenciar o solucionar problemas, como una lista de consultas recientes y el texto SQL de cada consulta.
Datashares (Recursos para compartir datos): los administradores de una cuenta productora pueden autorizar a las cuentas consumidoras para acceder a los recursos para compartir datos o elegir no autorizar ningún acceso. Para utilizar un recurso compartido de datos autorizado, el administrador de la cuenta consumidora puede asociar el recurso compartido de datos a la Cuenta de AWS completa o al espacio de nombres del clúster específico en una cuenta. Un administrador también puede rechazar un recurso para compartir datos.
Integraciones sin ETL: administre las integraciones que hacen que los datos transaccionales estén disponibles en Amazon Redshift después de haberlos escrito en orígenes compatibles.
Conexiones de IAM Identity Center: configure la conexión entre Amazon Redshift e IAM Identity Center.
Configurations (Configuraciones): se puede conectar a clústeres de Amazon Redshift desde herramientas de cliente SQL mediante conexiones Java Database Connectivity (JDBC) y Open Database Connectivity (ODBC). También puede configurar un punto de conexión de Virtual Private Cloud (VPC) administrado por Amazon RedShift. De esta forma, se proporciona una conexión privada entre una VPC basada en el servicio Amazon VPC que contiene un clúster y otra VPC que ejecuta una herramienta cliente.
Integración de socios de AWS: cree una integración con un socio de AWS compatible.
Advisor (Asesor): obtenga recomendaciones específicas sobre los cambios que puede realizar en su clúster de Amazon Redshift para priorizar sus optimizaciones.
AWS Marketplace: obtenga información sobre otras herramientas o servicios de AWS que funcionan con Amazon Redshift.
Alarms (Alarmas): cree alarmas en métricas de clúster para ver datos de rendimiento y realizar un seguimiento de las métricas durante el lapso de tiempo que especifique.
Events (Eventos): realice un seguimiento de los eventos y obtenga informes sobre información, como la fecha en que se produjo el evento, una descripción o el origen del evento.
What’s new (Novedades): vea nuevas características de Amazon Redshift y actualizaciones de productos.

En este tutorial, debe realizar los siguientes pasos.

Los pasos de este tutorial se describen a continuación.

Temas

Cómo crear una Cuenta de AWS
Determinación de reglas de firewall
Paso 1: Crear un clúster de Amazon Redshift de muestra
Paso 2: Configurar las reglas de entrada para los clientes SQL
Paso 3: otorgar acceso a un cliente de SQL y ejecutar consultas
Paso 4: Cargar datos desde Amazon S3 en Amazon Redshift
Paso 5: Probar consultas de ejemplo mediante el editor de consultas
Paso 6: Restablecer su entorno

Para empezar a utilizar AWS, necesita una Cuenta de AWS. Para obtener más información sobre cómo crear una Cuenta de AWS, consulte la sección Introducción a una Cuenta de AWS en la Guía de referencia de AWS Account Management.

Determinación de reglas de firewall

nota

En este tutorial, se da por sentado que el clúster utiliza el puerto predeterminado 5439 y que el editor de consultas de Amazon Redshift v2 se puede utilizar para ejecutar comandos de SQL. No se detallan las configuraciones de red ni la configuración de un cliente de SQL que se podrían necesitar en su entorno.

En algunos entornos, deberá especificar un puerto cuando lance el clúster de Amazon Redshift. Se utiliza este puerto junto con la URL del punto de conexión del clúster para acceder al clúster. También deberá crear una regla de entrada en un grupo de seguridad para permitir el acceso al clúster a través del puerto.

Si el equipo cliente está protegido por un firewall, asegúrese de conocer un puerto abierto que pueda utilizar. Con este puerto abierto, puede conectarse al clúster desde una herramienta cliente SQL y ejecutar consultas. Si no conoce un puerto abierto, deberá trabajar con alguna persona que entienda las reglas del firewall de red para encontrar un puerto abierto en su firewall.

Si bien Amazon Redshift utiliza el puerto 5439 de forma predeterminada, la conexión no funciona si dicho puerto no está abierto en el firewall. No se puede cambiar el número de puerto que corresponde al clúster de Amazon Redshift después de crearlo. Por lo tanto, asegúrese de especificar un puerto abierto que funcione en su entorno durante el proceso de lanzamiento.

Paso 1: Crear un clúster de Amazon Redshift de muestra

En este tutorial, seguirá el proceso de creación de un clúster de Amazon Redshift con una base de datos. Luego, deberá cargar un conjunto de datos desde Amazon S3 en las tablas de la base de datos. Puede utilizar este clúster de ejemplo para evaluar el servicio de Amazon Redshift.

Antes de comenzar a configurar el clúster de Amazon Redshift, asegúrese de completar los requisitos previos necesarios como Determinación de reglas de firewall.

Para cualquier operación que acceda a datos que estén en otro recurso de AWS, el clúster necesita permiso para acceder en su nombre al recurso y a los datos del recurso. Un ejemplo es el uso de un comando de SQL COPY para cargar datos desde Amazon Simple Storage Service (Amazon S3). Estos permisos los concede utilizando AWS Identity and Access Management (IAM). Puede hacerlo a través de un rol de IAM que haya creado y asociado al clúster. Para obtener más información sobre las credenciales y los permisos de acceso, consulte Credenciales y permisos de acceso en la Guía para desarrolladores de bases de datos de Amazon Redshift.

Para crear un clúster de Amazon Redshift

Inicie sesión en la AWS Management Console y abra la consola de Amazon Redshift en https://console.aws.amazon.com/redshiftv2/.

importante
Si utiliza las credenciales de usuario de IAM, asegúrese de que el usuario cuente con los permisos necesarios para realizar las operaciones del clúster. Para obtener más información, consulte Seguridad en Amazon Redshift en la Guía de administración de Amazon Redshift.
En la consola de AWS, elija la Región de AWS en la que desee crear el clúster.
En el menú de navegación, elija Clusters (Clústeres) y, a continuación, elija Create cluster (Crear clúster). Se abrirá la página Create cluster (Crear clúster).
En la sección Cluster configuration (Configuración del clúster), especifique valores para Cluster identifier (Identificador del clúster), Node type (Tipo de nodo) y Nodes (Nodos):
- En Cluster identifier (Identificador del clúster), ingrese examplecluster para este tutorial. Este identificador debe ser único. El identificador debe tener entre 1 y 63 caracteres y utilizar como caracteres válidos letras de la a a la z (solo minúsculas) y el - (guion).
- Elija uno de los siguientes métodos para ajustar el tamaño del clúster:
  
  nota
  En el siguiente paso, se da por sentado que la Región de AWS es compatible con tipos de nodo RG. Para obtener una lista de las Regiones de AWS que admiten tipos de nodos RG o RA3, consulte Disponibilidad del tipo de nodo RG en regiones de AWS y Disponibilidad del tipo de nodo RA3 en regiones de AWS en la Guía de administración de Amazon Redshift. Para obtener más información sobre las especificaciones de cada tipo y tamaño de nodo, consulte Detalles acerca de los tipos de nodos.
  - Si no sabe cuál sería el tamaño adecuado para el clúster, elija Help me choose (Ayúdeme a elegir). De esta forma, se abre una calculadora de tamaño que le hace preguntas sobre el tamaño y las características de consulta de los datos que planea almacenar en el almacenamiento de datos.
    
    Si conoce el tamaño requerido para su clúster (es decir, el tipo de nodo y la cantidad de nodos), elija I’ll choose (Yo elegiré). A continuación, elija el Node type (Tipo de nodo) y la cantidad de Nodes (nodos) para dimensionar el clúster.
    
    Para este tutorial, seleccione rg.4xlarge para Tipo de nodo y 2 para Número de nodos.
    
    Si la opción Configuración de AZ está disponible, elija Single-AZ.
  - Para usar el conjunto de datos de muestra que proporciona Amazon Redshift, en Sample data (Datos de muestra), elija Load sample data (Cargar datos de muestra). Amazon Redshift cargará el conjunto de datos de muestra Tickit en la base de datos dev y el esquema public predeterminados.
En la sección Configuración de la base de datos, especifique un valor para Nombre de usuario del administrador. En Contraseña de administrador, elija entre las siguientes opciones:
- Generar contraseña: use una contraseña generada por Amazon Redshift.
- Añadir manualmente una contraseña de administrador: use su propia contraseña.
- Administrar las credenciales de administrador en AWS Secrets Manager: Amazon Redshift usa AWS Secrets Manager para generar y administrar su contraseña de administrador. El uso de AWS Secrets Manager para generar y administrar el secreto de la contraseña conlleva un gasto. Para obtener información sobre precios de AWS Secrets Manager, consulte Precios de AWS Secrets Manager.
Para este tutorial, utilice los valores siguientes:
- Admin user name (Nombre del usuario administrador): ingrese awsuser.
- Contraseña del usuario administrador: ingrese Changeit1 para la contraseña.
Para este tutorial, cree un rol de IAM y configúrelo como predeterminado para su clúster, como se describe a continuación. Solo se puede configurar un rol de IAM como predeterminado para un clúster.
1. En Cluster permissions (Permisos de clúster), para Manage IAM roles (Administrar roles de IAM), elija Create IAM role (Crear rol de IAM).
2. Especifique un bucket de Amazon S3 para que el rol de IAM tenga acceso mediante uno de los siguientes métodos:
  - Elija No additional Amazon S3 bucket (Sin bucket adicional de Amazon S3), para permitir que el rol de IAM creado acceda solo a los depósitos de Amazon S3 denominados redshift.
  - Elija Any Amazon S3 bucket (Cualquier bucket de Amazon S3), para permitir que el rol de IAM creado acceda a todos los buckets de Amazon S3.
  - Elija Specific Amazon S3 buckets (Buckets específicos de Amazon S3), para especificar uno o más buckets de Amazon S3 para el rol de IAM creado al que puede acceder. A continuación, elija uno o más buckets de Amazon S3 de la tabla.
3. Elija Create IAM role as default (Crear un rol de IAM como predeterminado). Amazon Redshift crea y configura automáticamente el rol de IAM como predeterminado para su clúster.
  
  Debido a que ha creado su rol de IAM desde la consola, este tiene la política AmazonRedshiftAllCommandsFullAccess adjunta. Esto permite a Amazon Redshift copiar, cargar, consultar y analizar datos de los recursos de Amazon en su cuenta de IAM.
Para obtener más información acerca de cómo administrar el rol de IAM predeterminado para un clúster, consulte Creación de un rol de IAM como predeterminado para Amazon Redshift en la Guía de administración de Amazon Redshift.
(Opcional) En la sección Configuraciones adicionales, desactive Utilizar valores predeterminados para modificar las opciones de configuración Red y seguridad, Configuración de base de datos, Mantenimiento, Supervisión y Copia de seguridad.

En algunos casos, puede crear su clúster con la opción Load sample data (Cargar datos de muestra) y quizá desee activar el enrutamiento mejorado de Amazon VPC. De ser así, el clúster de su nube virtual privada requiere acceso al punto de conexión de Amazon S3 para que se carguen los datos.

Para que el clúster sea accesible públicamente, puede optar por una de estas dos opciones. Puede configurar una dirección de traducción de direcciones de red (NAT) en su VPC para que el clúster acceda a Internet. O bien, puede configurar un punto de conexión de la VPC de Amazon S3 en la VPC. Para obtener más información acerca del enrutamiento mejorado de Amazon VPC, consulte Enrutamiento mejorado de Amazon VPC en la Guía de administración de Amazon Redshift.
Elija Create cluster. Espere a que se cree el clúster con el estado Available que aparece en la página Clústeres.

Paso 2: Configurar las reglas de entrada para los clientes SQL

nota

Le recomendamos que se salte este paso y acceda al clúster mediante el editor de consultas de Amazon Redshift v2.

Luego, en este tutorial, puede acceder a su clúster desde una nube virtual privada (VPC) basada en el servicio Amazon VPC. No obstante, si utiliza un cliente SQL desde fuera de su firewall para acceder al clúster, asegúrese de otorgar acceso de entrada.

Para comprobar el firewall y otorgar acceso entrante a su clúster

Compruebe las reglas de su firewall si necesita acceder al clúster desde fuera de un firewall. Por ejemplo, su cliente podría ser una instancia de Amazon Elastic Compute Cloud (Amazon EC2) o un equipo externo.

Para obtener más información sobre las reglas de firewall, consulte Reglas del grupo de seguridad en la Guía del usuario de Amazon EC2.
Para acceder desde un cliente externo de Amazon EC2, agregue una regla de entrada al grupo de seguridad adjunto a su clúster que permita el tráfico entrante. Las reglas del grupo de seguridad de Amazon EC2 se agregan en la consola de Amazon EC2. Por ejemplo, un CIDR/IP de 192.0.2.0/24 permite a los clientes de ese intervalo de direcciones IP conectarse a su clúster. Descubra cuál es el CIDR/IP correcto para su entorno.

Paso 3: otorgar acceso a un cliente de SQL y ejecutar consultas

Para consultar las bases de datos alojadas en el clúster de Amazon Redshift, tiene varias opciones para los clientes de SQL: Entre ellos se incluyen:

Conectarse a su clúster y ejecutar consultas mediante el editor de consultas de Amazon Redshift v2.

Si utiliza el editor de consultas v2, no tiene que descargar y configurar una aplicación cliente de SQL. Inicie el editor de consultas de Amazon Redshift v2 desde la consola de Amazon Redshift.
Conectarse al clúster con RSQL. Para obtener más información, consulte Conexión con Amazon Redshift RSQL en la Guía de administración de Amazon Redshift.
Conéctese al clúster a través de una herramienta de cliente de SQL, como SQL Workbench/J. Para obtener más información, consulte Conexión al clúster mediante SQL Workbench/J en la Guía de administración de Amazon Redshift.

En este tutorial, se usa el editor de consultas de Amazon Redshift v2 como la forma más sencilla de ejecutar consultas en bases de datos alojadas por el clúster de Amazon Redshift. Después de crear su clúster, podrá ejecutar consultas de forma inmediata. Para obtener más información acerca de los aspectos que se deben tener en cuenta al usar el editor de consultas de Amazon Redshift v2, visite Consideraciones al trabajar con el editor de consultas v2 en la Guía de administración de Amazon Redshift.

Otorgamiento de acceso al editor de consultas v2

La primera vez que un administrador configura el editor de consultas v2 para su Cuenta de AWS, este elige la AWS KMS key que se utiliza para cifrar los recursos del editor de consultas v2. Entre los recursos del editor de consultas de Amazon Redshift v2, se incluyen consultas guardadas, libretas y gráficos. De manera predeterminada, se utiliza una clave propia de AWS para cifrar los recursos. Como alternativa, un administrador puede utilizar una clave administrada por el cliente seleccionando el nombre de recurso de Amazon (ARN) para la clave en la página de configuración. Luego de configurar una cuenta, la configuración de cifrado AWS KMS no se puede modificar. Para obtener más información, consulte Configuración de su Cuenta de AWS en la Guía de administración de Amazon Redshift.

Para obtener acceso al editor de consultas v2, necesita permiso. Un administrador puede asociar una de las siguientes políticas administradas de AWS para el editor de consultas de Amazon Redshift v2 al rol o usuario de IAM para conceder permisos. Estas políticas administradas de AWS se escriben con diferentes opciones que controlan cómo los recursos de etiquetado permiten compartir consultas. Puede utilizar la consola de IAM (https://console.aws.amazon.com/iam/) para adjuntar políticas de IAM. Para obtener más información sobre estas políticas, consulte Acceso al editor de consultas v2 en la Guía de administración de Amazon Redshift.

También puede crear su propia política en función de los permisos permitidos y denegados en las políticas administradas proporcionadas. Si utiliza el editor de políticas de la consola de IAM para crear su propia política, elija SQL Workbench como servicio para el que crea la política en el editor visual. El editor de consultas v2 utiliza el nombre del servicio AWS SQL Workbench en el editor visual y el Simulador de políticas de IAM.

Para obtener más información, consulte Trabajo con Query Editor v2 en la Guía de administración de Amazon Redshift.

Paso 4: Cargar datos desde Amazon S3 en Amazon Redshift

Después de crear el clúster, puede cargar datos desde Amazon S3 en las tablas de la base de datos. Hay varias maneras de cargar datos desde Amazon S3.

Puede usar un cliente de SQL para ejecutar el comando de SQL CREATE TABLE para crear una tabla en la base de datos y, a continuación, usar el comando de SQL COPY para cargar datos desde Amazon S3. El editor de consultas de Amazon Redshift v2 es un cliente de SQL.
Puede utilizar el asistente de carga del editor de consultas de Amazon Redshift v2.

En este tutorial se muestra cómo utilizar el editor de consultas V2 de Amazon Redshift para ejecutar comandos de SQL para tablas CREATE y datos COPY. Inicie el Editor de consultas v2 desde el panel de navegación de la consola de Amazon Redshift. En el editor de consultas v2, cree una conexión con el clúster de examplecluster y la base de datos denominada dev con el nombre de su usuario administrador awsuser. Para este tutorial, elija Credenciales temporales con un nombre de usuario de base de datos al crear la conexión. Para obtener información sobre cómo utilizar el editor de consultas de Amazon Redshift v2, consulte Conexión a una base de datos de Amazon Redshift en la Guía de administración de Amazon Redshift.

Carga de datos desde Amazon S3 mediante comandos de SQL

En el panel del editor de consultas v2, confirme que está conectado al clúster de examplecluster y a la base de datos de dev. A continuación, cree tablas en la base de datos y cargue datos en las tablas. Para este tutorial, los datos que se cargan están disponibles en un bucket de Amazon S3 al que se puede acceder desde muchas Regiones de AWS.

En el siguiente procedimiento, se crean tablas y se cargan datos desde un bucket de Amazon S3 público.

Si utiliza el editor de consultas de Amazon Redshift v2, copie y ejecute la siguiente instrucción de creación de tablas para crear una tabla en el esquema public de la base de datos dev. Para obtener más información acerca de la sintaxis, consulte CREATE TABLE en la Guía para desarrolladores de bases de datos de Amazon Redshift.

Creación y carga de datos mediante un cliente de SQL como el editor de consultas v2

Ejecute el siguiente comando de SQL CREATE para crear la tabla sales.



   drop table if exists sales;
   create table sales(
	salesid integer not null,
	listid integer not null distkey,
	sellerid integer not null,
	buyerid integer not null,
	eventid integer not null,
	dateid smallint not null sortkey,
	qtysold smallint not null,
	pricepaid decimal(8,2),
	commission decimal(8,2),
	saletime timestamp);

Ejecute el siguiente comando de SQL CREATE para crear la tabla date.



drop table if exists date;              
create table date(
	dateid smallint not null distkey sortkey,
	caldate date not null,
	day character(3) not null,
	week smallint not null,
	month character(5) not null,
	qtr character(5) not null,
	year smallint not null,
	holiday boolean default('N'));

Cargue la tabla sales desde Amazon S3 con el comando COPY.

nota
Le recomendamos utilizar el comando COPY para cargar grandes conjuntos de datos en Amazon Redshift desde Amazon S3. Para obtener más información acerca de la sintaxis de COPY, consulte COPY en la Guía para desarrolladores de bases de datos de Amazon Redshift.

Proporcione autenticación para que el clúster acceda a Amazon S3 en su nombre para cargar los datos de muestra. Para este paso, deberá proporcionar autenticación mediante la referencia al rol de IAM que creó y configuró como default en su clúster cuando seleccionó Crear un rol de IAM como predeterminado al crear el clúster.

Cargue la tabla sales con el siguiente comando de SQL. Si lo desea, puede descargar y ver desde Amazon S3 los datos de origen para la tabla sales. .
```
COPY sales
    FROM 's3://redshift-downloads/tickit/sales_tab.txt' 
    DELIMITER '\t' 
    TIMEFORMAT 'MM/DD/YYYY HH:MI:SS' 
    REGION 'us-east-1'
    IAM_ROLE default;
```
Cargue la tabla date con el siguiente comando de SQL. Si lo desea, puede descargar y ver desde Amazon S3 los datos de origen para la tabla date. .
```
COPY date
    FROM 's3://redshift-downloads/tickit/date2008_pipe.txt' 
    DELIMITER '|' 
    REGION 'us-east-1'
    IAM_ROLE default;
```

Carga de datos desde Amazon S3 mediante el editor de consultas v2

En esta sección, se describe cómo cargar los datos propios en un clúster de Amazon Redshift. El uso del editor de consultas v2 simplifica la carga de datos cuando se utiliza el asistente Cargar datos. El comando COPY generado y utilizado en el asistente Cargar datos del editor de consultas v2 admite todos los parámetros disponibles para la sintaxis del comando COPY para cargar datos de Amazon S3. Para obtener información acerca del comando COPY y las opciones que se utilizan para copiar la carga de Amazon S3, consulte Comando COPY de Amazon Simple Storage Service en la Guía para el desarrollador de base de datos de Amazon Redshift.

Para cargar sus propios datos de Amazon S3 en Amazon Redshift, Amazon Redshift, requiere un rol de IAM que tenga los privilegios necesarios para cargar datos del bucket de Amazon S3 especificado.

Para cargar los datos propios desde Amazon S3 en Amazon Redshift, puede usar el asistente de carga de datos del editor de consultas v2. Para obtener más información sobre cómo usar el asistente de carga de datos, consulte Carga de datos desde Amazon S3 en la Guía de administración de Amazon Redshift.

Creación de datos de TICKIT en su clúster

TICKIT es una base de datos de ejemplo que, si lo desea, puede cargar en el clúster de Amazon Redshift para aprender a consultar datos en Amazon Redshift. Puede crear el conjunto completo de tablas de TICKIT y cargar datos en su clúster de las siguientes maneras:

Cuando se crea un clúster en la consola de Amazon Redshift, en ese momento tiene la opción cargar datos de TICKIT de muestra al mismo tiempo. En la consola de Amazon Redshift, elija Clústeres y Crear clúster. En la sección Datos de muestra, seleccione Cargar datos de muestra. Amazon Redshift cargará automáticamente el conjunto de datos de muestra en la base de datos dev del clúster de Amazon Redshift durante la creación del clúster.
Para conectarse a un clúster existente, haga lo siguiente:
- En la consola de Amazon Redshift, elija Clústeres en la barra de navegación.
- Elija el clúster en el panel Clústeres.
- Elija Consultar datos y Consultar en el editor de consultas v2.
- Expanda examplecluster en la lista de recursos. Si es la primera vez que se conecta al clúster, aparece Conectarse a examplecluster. Elija Nombre de usuario y contraseña de la base de datos. Deje la base de datos como dev. Especifique awsuser para el nombre de usuario y Changeit1 para la contraseña.
- Elija Crear conexión.
Con el editor de consultas de Amazon Redshift v2, puede cargar datos de TICKIT en una base de datos de muestra denominada sample_data_dev. Elija la base de datos sample_data_dev en la lista de recursos. Junto al nodo tickit, elija el icono Abrir blocs de notas de ejemplo. Confirme que desea crear la base de datos de ejemplo.
El editor de consultas de Amazon Redshift v2 crea la base de datos de muestra junto con un cuaderno de ejemplo denominado tickit-sample-notebook. Puede elegir Ejecutar todo para ejecutar este bloc de notas para consultar los datos de la base de datos de ejemplo.

Para ver más información sobre los datos de TICKIT, consulte Bases de datos de muestra en la Guía para desarrolladores de bases de datos de Amazon Redshift.

Paso 5: Probar consultas de ejemplo mediante el editor de consultas

Para configurar y usar el editor de consultas de Amazon Redshift v2 para consultar una base de datos, visite Trabajo con el editor de consultas v2 en la Guía de administración de Amazon Redshift.

Ahora, pruebe algunas consultas de ejemplo, como se muestra a continuación. Para crear consultas nuevas en el editor de consultas v2, elija el icono + en la esquina superior derecha del panel de consultas y elija SQL. Aparece una nueva página de consultas en la que puede copiar y pegar las siguientes consultas SQL.

nota

Asegúrese de ejecutar primero la primera consulta en el bloc de notas, que establece el valor de configuración del servidor search_path en el esquema tickit mediante el siguiente comando SQL:


set search_path to tickit;

Para obtener más información acerca de cómo trabajar con el comando SELECT, consulte SELECT en la Guía para desarrolladores de bases de datos de Amazon Redshift.


-- Get definition for the sales table.
SELECT *    
FROM pg_table_def    
WHERE tablename = 'sales';


-- Find total sales on a given calendar date.
SELECT sum(qtysold) 
FROM   sales, date 
WHERE  sales.dateid = date.dateid 
AND    caldate = '2008-01-05';


-- Find top 10 buyers by quantity.
SELECT firstname, lastname, total_quantity 
FROM   (SELECT buyerid, sum(qtysold) total_quantity
        FROM  sales
        GROUP BY buyerid
        ORDER BY total_quantity desc limit 10) Q, users
WHERE Q.buyerid = userid
ORDER BY Q.total_quantity desc;


-- Find events in the 99.9 percentile in terms of all time gross sales.
SELECT eventname, total_price 
FROM  (SELECT eventid, total_price, ntile(1000) over(order by total_price desc) as percentile 
       FROM (SELECT eventid, sum(pricepaid) total_price
             FROM   sales
             GROUP BY eventid)) Q, event E
       WHERE Q.eventid = E.eventid
       AND percentile = 1
ORDER BY total_price desc;

Paso 6: Restablecer su entorno

En los pasos anteriores, creó correctamente un clúster de Amazon Redshift, cargó los datos en tablas y consultó los datos mediante un cliente de SQL como el editor de consultas de Amazon Redshift v2.

Cuando haya completado este tutorial, le sugerimos restablecer el entorno a su estado anterior eliminando el clúster de muestra. Se le seguirá cobrando por el servicio Amazon Redshift hasta que elimine el clúster.

No obstante, es posible que desee continuar ejecutando el clúster de muestra si planea probar tareas de otras guías de Amazon Redshift o las tareas descritas en Ejecución de comandos para definir y utilizar una base de datos en el almacenamiento de datos.

Para eliminar un clúster

Inicie sesión en la AWS Management Console y abra la consola de Amazon Redshift en https://console.aws.amazon.com/redshiftv2/.
En el menú de navegación, elija Clusters (Clústeres) para mostrar la lista de clústeres.
Seleccione el clúster de examplecluster. En Actions (Acciones), seleccione Delete (Eliminar). Aparece la página Delete examplecluster?.
Confirme el clúster que desea eliminar, desactive la opción Crear instantánea final y, a continuación, ingrese delete para confirmar la eliminación. Seleccione Delete cluster (Eliminar clúster).

En la página de lista de clúster, se actualiza el estado del clúster a medida que se elimina el clúster.

Luego de completar este tutorial, podrá encontrar más información acerca de Amazon Redshift y los pasos siguientes en Recursos adicionales para obtener información acerca de Amazon Redshift.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Introducción a los almacenamientos de datos sin servidor

Definición y uso de una base de datos en el almacenamiento de datos