Introducción a los almacenamientos de datos aprovisionados de Amazon Redshift
Si es la primera vez que utiliza Amazon Redshift, le recomendamos que lea las secciones siguientes como ayuda para comenzar a utilizar los clústeres aprovisionados. El flujo básico de Amazon Redshift consiste en crear recursos aprovisionados, conectarse a Amazon Redshift, cargar datos de muestra y, a continuación, ejecutar consultas en los datos. En esta guía, puede elegir cargar los datos de muestra desde Amazon Redshift o desde un bucket de Amazon S3. Los datos de muestra se utilizan en toda la documentación de Amazon Redshift para demostrar características.
En este tutorial se muestra cómo utilizar los clústeres aprovisionados de Amazon Redshift, que son objetos de almacenamiento de datos de AWS para los que se administran los recursos del sistema. También puede usar Amazon Redshift con grupos de trabajo sin servidor, que son objetos de almacenamiento de datos que se escalan automáticamente en respuesta al uso. Para empezar a utilizar Redshift sin servidor, consulte Introducción a los almacenamientos de datos de Amazon Redshift sin servidor.
Después de crear la consola de Amazon Redshift y de iniciar sesión en ella, puede crear y administrar objetos de Amazon Redshift, incluidos clústeres, nodos y bases de datos. También puede ejecutar consultas, ver consultas y realizar otras operaciones del lenguaje de definición de datos (DDL) y del lenguaje de manipulación de datos (DML) con un cliente de SQL.
importante
El clúster que aprovisionó para este ejercicio se ejecuta en un entorno real. Mientras esté en ejecución, acumula cargos en su Cuenta de AWS. Para obtener información acerca de los precios, consulte la página de precios de Amazon Redshift
Para evitar cargos innecesarios, elimine su clúster cuando termine de usarlo. En la última sección de este capítulo se explica cómo hacerlo.
Inicie sesión en la AWS Management Console y abra la consola de Amazon Redshift en https://console.aws.amazon.com/redshiftv2/
Le recomendamos que, para empezar, vaya al Panel de clústeres aprovisionados para empezar a utilizar la consola de Amazon Redshift.
Según la configuración, los siguientes elementos aparecen en el panel de navegación de la consola aprovisionada de Amazon Redshift:
Redshift sin servidor: acceda a los datos y analícelos sin necesidad de configurar, ajustar ni administrar clústeres aprovisionados de Amazon Redshift.
Panel de clústeres aprovisionados: compruebe los clústeres en su Región de AWS, compruebe Métricas del clúster e Información general sobre consultas para obtener información de los datos de las métricas (como uso de la CPU) e información de consultas. El uso de estas opciones puede ayudarlo a determinar si los datos de rendimiento son anormales en un intervalo temporal especificado.
Clústeres: vea su lista de clústeres en esta Región de AWS, elija un clúster para comenzar a realizar consultas o realizar acciones relacionadas con el clúster. También puede crear un clúster nuevo desde esta página.
Editor de consultas: ejecute consultas en las bases de datos alojadas en el clúster de Amazon Redshift. Recomendamos utilizar el editor de consultas v2.
Editor de consultas v2: el editor de consultas de Amazon Redshift v2 es una aplicación de cliente de SQL independiente basada en web para crear y ejecutar consultas en el almacenamiento de datos de Amazon Redshift. Puede visualizar los resultados en gráficos y colaborar si comparte sus consultas con otros miembros del equipo.
Queries and loads (Consultas y cargas): obtenga información para referenciar o solucionar problemas, como una lista de consultas recientes y el texto SQL de cada consulta.
Datashares (Recursos para compartir datos): los administradores de una cuenta productora pueden autorizar a las cuentas consumidoras para acceder a los recursos para compartir datos o elegir no autorizar ningún acceso. Para utilizar un recurso compartido de datos autorizado, el administrador de la cuenta consumidora puede asociar el recurso compartido de datos a la Cuenta de AWS completa o al espacio de nombres del clúster específico en una cuenta. Un administrador también puede rechazar un recurso para compartir datos.
Integraciones sin ETL: administre las integraciones que hacen que los datos transaccionales estén disponibles en Amazon Redshift después de haberlos escrito en orígenes compatibles.
Conexiones de IAM Identity Center: configure la conexión entre Amazon Redshift e IAM Identity Center.
Configurations (Configuraciones): se puede conectar a clústeres de Amazon Redshift desde herramientas de cliente SQL mediante conexiones Java Database Connectivity (JDBC) y Open Database Connectivity (ODBC). También puede configurar un punto de conexión de Virtual Private Cloud (VPC) administrado por Amazon RedShift. De esta forma, se proporciona una conexión privada entre una VPC basada en el servicio Amazon VPC que contiene un clúster y otra VPC que ejecuta una herramienta cliente.
Integración de socios de AWS: cree una integración con un socio de AWS compatible.
Advisor (Asesor): obtenga recomendaciones específicas sobre los cambios que puede realizar en su clúster de Amazon Redshift para priorizar sus optimizaciones.
AWS Marketplace: obtenga información sobre otras herramientas o servicios de AWS que funcionan con Amazon Redshift.
Alarms (Alarmas): cree alarmas en métricas de clúster para ver datos de rendimiento y realizar un seguimiento de las métricas durante el lapso de tiempo que especifique.
Events (Eventos): realice un seguimiento de los eventos y obtenga informes sobre información, como la fecha en que se produjo el evento, una descripción o el origen del evento.
What’s new (Novedades): vea nuevas características de Amazon Redshift y actualizaciones de productos.
En este tutorial, debe realizar los siguientes pasos.

Temas
Inscripción en AWS
Si aún no tiene una Cuenta de AWS, regístrese para obtener una. Si ya tiene una cuenta, puede saltearse este requisito previo y utilizar la cuenta existente.
Abra https://portal.aws.amazon.com/billing/signup
. Siga las instrucciones que se le indiquen.
Parte del procedimiento de registro consiste en recibir una llamada telefónica e indicar un código de verificación en el teclado del teléfono.
Al registrarse en una Cuenta de AWS, se crea un Usuario raíz de la cuenta de AWS. El usuario raíz tendrá acceso a todos los Servicios de AWS y recursos de esa cuenta. Como práctica recomendada de seguridad, asigne acceso administrativo a un usuario y utilice únicamente el usuario raíz para realizar tareas que requieren acceso de usuario raíz.
Determinación de reglas de firewall
nota
En este tutorial, se da por sentado que el clúster utiliza el puerto predeterminado 5439 y que el editor de consultas de Amazon Redshift v2 se puede utilizar para ejecutar comandos de SQL. No se detallan las configuraciones de red ni la configuración de un cliente de SQL que se podrían necesitar en su entorno.
En algunos entornos, deberá especificar un puerto cuando lance el clúster de Amazon Redshift. Se utiliza este puerto junto con la URL del punto de conexión del clúster para acceder al clúster. También deberá crear una regla de entrada en un grupo de seguridad para permitir el acceso al clúster a través del puerto.
Si el equipo cliente está protegido por un firewall, asegúrese de conocer un puerto abierto que pueda utilizar. Con este puerto abierto, puede conectarse al clúster desde una herramienta cliente SQL y ejecutar consultas. Si no conoce un puerto abierto, deberá trabajar con alguna persona que entienda las reglas del firewall de red para encontrar un puerto abierto en su firewall.
Si bien Amazon Redshift utiliza el puerto 5439 de forma predeterminada, la conexión no funciona si dicho puerto no está abierto en el firewall. No se puede cambiar el número de puerto que corresponde al clúster de Amazon Redshift después de crearlo. Por lo tanto, asegúrese de especificar un puerto abierto que funcione en su entorno durante el proceso de lanzamiento.
Paso 1: Crear un clúster de Amazon Redshift de muestra
En este tutorial, seguirá el proceso de creación de un clúster de Amazon Redshift con una base de datos. Luego, deberá cargar un conjunto de datos desde Amazon S3 en las tablas de la base de datos. Puede utilizar este clúster de ejemplo para evaluar el servicio de Amazon Redshift.
Antes de comenzar a configurar el clúster de Amazon Redshift, asegúrese de completar los requisitos previos, como Inscripción en AWS y Determinación de reglas de firewall.
Para cualquier operación que acceda a datos que estén en otro recurso de AWS, el clúster necesita permiso para acceder en su nombre al recurso y a los datos del recurso. Un ejemplo es el uso de un comando de SQL COPY para cargar datos desde Amazon Simple Storage Service (Amazon S3). Estos permisos los concede utilizando AWS Identity and Access Management (IAM). Puede hacerlo a través de un rol de IAM que haya creado y asociado al clúster. Para obtener más información sobre las credenciales y los permisos de acceso, consulte Credenciales y permisos de acceso en la Guía para desarrolladores de bases de datos de Amazon Redshift.
Para crear un clúster de Amazon Redshift
-
Inicie sesión en la AWS Management Console y abra la consola de Amazon Redshift en https://console.aws.amazon.com/redshiftv2/
. importante
Si utiliza las credenciales de usuario de IAM, asegúrese de que el usuario cuente con los permisos necesarios para realizar las operaciones del clúster. Para obtener más información, consulte Seguridad en Amazon Redshift en la Guía de administración de Amazon Redshift.
-
En la consola de AWS, elija la Región de AWS en la que desee crear el clúster.
-
En el menú de navegación, elija Clusters (Clústeres) y, a continuación, elija Create cluster (Crear clúster). Se abrirá la página Create cluster (Crear clúster).
-
En la sección Cluster configuration (Configuración del clúster), especifique valores para Cluster identifier (Identificador del clúster), Node type (Tipo de nodo) y Nodes (Nodos):
-
En Cluster identifier (Identificador del clúster), ingrese
examplecluster
para este tutorial. Este identificador debe ser único. El identificador debe tener entre 1 y 63 caracteres y utilizar como caracteres válidos letras de la a a la z (solo minúsculas) y el - (guion). -
Elija uno de los siguientes métodos para ajustar el tamaño del clúster:
nota
En el siguiente paso, se da por sentado que la Región de AWS es compatible con tipos de nodo RA3. Para obtener una lista de las Regiones de AWS que admiten los tipos de nodo RA3, consulte Información general sobre los tipos de nodo RA3 en la Guía de administración de Amazon Redshift. Para obtener más información sobre las especificaciones de cada tipo y tamaño de nodo, consulte Detalles acerca de los tipos de nodos.
-
Si no sabe cuál sería el tamaño adecuado para el clúster, elija Help me choose (Ayúdeme a elegir). De esta forma, se abre una calculadora de tamaño que le hace preguntas sobre el tamaño y las características de consulta de los datos que planea almacenar en el almacenamiento de datos.
Si conoce el tamaño requerido para su clúster (es decir, el tipo de nodo y la cantidad de nodos), elija I’ll choose (Yo elegiré). A continuación, elija el Node type (Tipo de nodo) y la cantidad de Nodes (nodos) para dimensionar el clúster.
Para este tutorial, seleccione ra3.4xlarge para Tipo de nodo y 2 para Número de nodos.
Si la opción Configuración de AZ está disponible, elija Single-AZ.
Para usar el conjunto de datos de muestra que proporciona Amazon Redshift, en Sample data (Datos de muestra), elija Load sample data (Cargar datos de muestra). Amazon Redshift cargará el conjunto de datos de muestra Tickit en la base de datos
dev
y el esquemapublic
predeterminados.
-
-
-
En la sección Configuración de la base de datos, especifique un valor para Nombre de usuario del administrador. En Contraseña de administrador, elija entre las siguientes opciones:
-
Generar contraseña: use una contraseña generada por Amazon Redshift.
-
Añadir manualmente una contraseña de administrador: use su propia contraseña.
-
Administrar las credenciales de administrador en AWS Secrets Manager: Amazon Redshift usa AWS Secrets Manager para generar y administrar su contraseña de administrador. El uso de AWS Secrets Manager para generar y administrar el secreto de la contraseña conlleva un gasto. Para obtener información sobre precios de AWS Secrets Manager, consulte Precios de AWS Secrets Manager
.
Para este tutorial, utilice los valores siguientes:
Admin user name (Nombre del usuario administrador): ingrese
awsuser
.Contraseña del usuario administrador: ingrese
Changeit1
para la contraseña.
-
-
Para este tutorial, cree un rol de IAM y configúrelo como predeterminado para su clúster, como se describe a continuación. Solo se puede configurar un rol de IAM como predeterminado para un clúster.
En Cluster permissions (Permisos de clúster), para Manage IAM roles (Administrar roles de IAM), elija Create IAM role (Crear rol de IAM).
Especifique un bucket de Amazon S3 para que el rol de IAM tenga acceso mediante uno de los siguientes métodos:
Elija No additional Amazon S3 bucket (Sin bucket adicional de Amazon S3), para permitir que el rol de IAM creado acceda solo a los depósitos de Amazon S3 denominados
redshift
.Elija Any Amazon S3 bucket (Cualquier bucket de Amazon S3), para permitir que el rol de IAM creado acceda a todos los buckets de Amazon S3.
Elija Specific Amazon S3 buckets (Buckets específicos de Amazon S3), para especificar uno o más buckets de Amazon S3 para el rol de IAM creado al que puede acceder. A continuación, elija uno o más buckets de Amazon S3 de la tabla.
Elija Create IAM role as default (Crear un rol de IAM como predeterminado). Amazon Redshift crea y configura automáticamente el rol de IAM como predeterminado para su clúster.
Debido a que ha creado su rol de IAM desde la consola, este tiene la política
AmazonRedshiftAllCommandsFullAccess
adjunta. Esto permite a Amazon Redshift copiar, cargar, consultar y analizar datos de los recursos de Amazon en su cuenta de IAM.
Para obtener más información acerca de cómo administrar el rol de IAM predeterminado para un clúster, consulte Creación de un rol de IAM como predeterminado para Amazon Redshift en la Guía de administración de Amazon Redshift.
-
(Opcional) En la sección Additional configurations (Configuraciones adicionales), desactive Use defaults (Utilizar valores predeterminados) para modificar las opciones de configuración Network and security (Redes y seguridad), Database configuration (Configuración de base de datos), Maintenance (Mantenimiento), Monitoring (Supervisión) y Backup (Copia de seguridad).
En algunos casos, puede crear su clúster con la opción Load sample data (Cargar datos de muestra) y quizá desee activar el enrutamiento mejorado de Amazon VPC. De ser así, el clúster de su nube virtual privada requiere acceso al punto de conexión de Amazon S3 para que se carguen los datos.
Para que el clúster sea accesible públicamente, puede optar por una de estas dos opciones. Puede configurar una dirección de traducción de direcciones de red (NAT) en su VPC para que el clúster acceda a Internet. O bien, puede configurar un punto de conexión de la VPC de Amazon S3 en la VPC. Para obtener más información acerca del enrutamiento mejorado de Amazon VPC, consulte Enrutamiento mejorado de Amazon VPC en la Guía de administración de Amazon Redshift.
-
Elija Create cluster. Espere a que se cree el clúster con el estado
Available
que aparece en la página Clústeres.
Paso 2: Configurar las reglas de entrada para los clientes SQL
nota
Le recomendamos que se salte este paso y acceda al clúster mediante el editor de consultas de Amazon Redshift v2.
Luego, en este tutorial, puede acceder a su clúster desde una nube virtual privada (VPC) basada en el servicio Amazon VPC. No obstante, si utiliza un cliente SQL desde fuera de su firewall para acceder al clúster, asegúrese de otorgar acceso de entrada.
Para comprobar el firewall y otorgar acceso entrante a su clúster
Compruebe las reglas de su firewall si necesita acceder al clúster desde fuera de un firewall. Por ejemplo, su cliente podría ser una instancia de Amazon Elastic Compute Cloud (Amazon EC2) o un equipo externo.
Para obtener más información sobre las reglas de firewall, consulte Reglas del grupo de seguridad en la Guía del usuario de Amazon EC2.
Para acceder desde un cliente externo de Amazon EC2, agregue una regla de entrada al grupo de seguridad adjunto a su clúster que permita el tráfico entrante. Las reglas del grupo de seguridad de Amazon EC2 se agregan en la consola de Amazon EC2. Por ejemplo, un CIDR/IP de 192.0.2.0/24 permite a los clientes de ese intervalo de direcciones IP conectarse a su clúster. Descubra cuál es el CIDR/IP correcto para su entorno.
Paso 3: otorgar acceso a un cliente de SQL y ejecutar consultas
Para consultar las bases de datos alojadas en el clúster de Amazon Redshift, tiene varias opciones para los clientes de SQL: Entre ellos se incluyen:
Conectarse a su clúster y ejecutar consultas mediante el editor de consultas de Amazon Redshift v2.
Si utiliza el editor de consultas v2, no tiene que descargar y configurar una aplicación cliente de SQL. Inicie el editor de consultas de Amazon Redshift v2 desde la consola de Amazon Redshift.
Conectarse al clúster con RSQL. Para obtener más información, consulte Conexión con Amazon Redshift RSQL en la Guía de administración de Amazon Redshift.
-
Conéctese al clúster a través de una herramienta de cliente de SQL, como SQL Workbench/J. Para obtener más información, consulte Conexión al clúster mediante SQL Workbench/J en la Guía de administración de Amazon Redshift.
En este tutorial, se usa el editor de consultas de Amazon Redshift v2 como la forma más sencilla de ejecutar consultas en bases de datos alojadas por el clúster de Amazon Redshift. Después de crear su clúster, podrá ejecutar consultas de forma inmediata. Para obtener más información acerca de los aspectos que se deben tener en cuenta al usar el editor de consultas de Amazon Redshift v2, visite Consideraciones al trabajar con el editor de consultas v2 en la Guía de administración de Amazon Redshift.
Otorgamiento de acceso al editor de consultas v2
La primera vez que un administrador configura el editor de consultas v2 para su Cuenta de AWS, este elige la AWS KMS key que se utiliza para cifrar los recursos del editor de consultas v2. Entre los recursos del editor de consultas de Amazon Redshift v2, se incluyen consultas guardadas, libretas y gráficos. De manera predeterminada, se utiliza una clave propia de AWS para cifrar los recursos. Como alternativa, un administrador puede utilizar una clave administrada por el cliente seleccionando el nombre de recurso de Amazon (ARN) para la clave en la página de configuración. Luego de configurar una cuenta, la configuración de cifrado AWS KMS no se puede modificar. Para obtener más información, consulte Configuración de su Cuenta de AWS en la Guía de administración de Amazon Redshift.
Para obtener acceso al editor de consultas v2, necesita permiso. Un administrador puede asociar una de las siguientes políticas administradas de AWS para el editor de consultas de Amazon Redshift v2 al rol o usuario de IAM para conceder permisos. Estas políticas administradas de AWS se escriben con diferentes opciones que controlan cómo los recursos de etiquetado permiten compartir consultas. Puede utilizar la consola de IAM (https://console.aws.amazon.com/iam/
También puede crear su propia política en función de los permisos permitidos y denegados en las políticas administradas proporcionadas. Si utiliza el editor de políticas de la consola de IAM para crear su propia política, elija SQL Workbench como servicio para el que crea la política en el editor visual. El editor de consultas v2 utiliza el nombre del servicio AWS SQL Workbench en el editor visual y el Simulador de políticas de IAM.
Para obtener más información, consulte Trabajo con el editor de consultas v2 en la Guía de administración de Amazon Redshift.
Paso 4: Cargar datos desde Amazon S3 en Amazon Redshift
Después de crear el clúster, puede cargar datos desde Amazon S3 en las tablas de la base de datos. Hay varias maneras de cargar datos desde Amazon S3.
Puede usar un cliente de SQL para ejecutar el comando de SQL CREATE TABLE para crear una tabla en la base de datos y, a continuación, usar el comando de SQL COPY para cargar datos desde Amazon S3. El editor de consultas de Amazon Redshift v2 es un cliente de SQL.
Puede utilizar el asistente de carga del editor de consultas de Amazon Redshift v2.
En este tutorial se muestra cómo utilizar el editor de consultas V2 de Amazon Redshift para ejecutar comandos de SQL para tablas CREATE y datos COPY. Inicie el Editor de consultas v2 desde el panel de navegación de la consola de Amazon Redshift. En el editor de consultas v2, cree una conexión con el clúster de examplecluster
y la base de datos denominada dev
con el nombre de su usuario administrador awsuser
. Para este tutorial, elija Credenciales temporales con un nombre de usuario de base de datos al crear la conexión. Para obtener información sobre cómo utilizar el editor de consultas de Amazon Redshift v2, consulte Conexión a una base de datos de Amazon Redshift en la Guía de administración de Amazon Redshift.
Carga de datos desde Amazon S3 mediante comandos de SQL
En el panel del editor de consultas v2, confirme que está conectado al clúster de examplecluster
y a la base de datos de dev
. A continuación, cree tablas en la base de datos y cargue datos en las tablas. Para este tutorial, los datos que se cargan están disponibles en un bucket de Amazon S3 al que se puede acceder desde muchas Regiones de AWS.
En el siguiente procedimiento, se crean tablas y se cargan datos desde un bucket de Amazon S3 público.
Si utiliza el editor de consultas de Amazon Redshift v2, copie y ejecute la siguiente instrucción de creación de tablas para crear una tabla en el esquema public
de la base de datos dev
. Para obtener más información acerca de la sintaxis, consulte CREATE TABLE en la Guía para desarrolladores de bases de datos de Amazon Redshift.
Creación y carga de datos mediante un cliente de SQL como el editor de consultas v2
-
Ejecute el siguiente comando de SQL CREATE para crear la tabla
sales
.drop table if exists sales;
create table sales( salesid integer not null, listid integer not null distkey, sellerid integer not null, buyerid integer not null, eventid integer not null, dateid smallint not null sortkey, qtysold smallint not null, pricepaid decimal(8,2), commission decimal(8,2), saletime timestamp);
-
Ejecute el siguiente comando de SQL CREATE para crear la tabla
date
.drop table if exists date;
create table date( dateid smallint not null distkey sortkey, caldate date not null, day character(3) not null, week smallint not null, month character(5) not null, qtr character(5) not null, year smallint not null, holiday boolean default('N'));
-
Cargue la tabla
sales
desde Amazon S3 con el comando COPY.nota
Le recomendamos utilizar el comando COPY para cargar grandes conjuntos de datos en Amazon Redshift desde Amazon S3. Para obtener más información acerca de la sintaxis de COPY, consulte COPY en la Guía para desarrolladores de bases de datos de Amazon Redshift.
Proporcione autenticación para que el clúster acceda a Amazon S3 en su nombre para cargar los datos de muestra. Para este paso, deberá proporcionar autenticación mediante la referencia al rol de IAM que creó y configuró como
default
en su clúster cuando seleccionó Crear un rol de IAM como predeterminado al crear el clúster.Cargue la tabla
sales
con el siguiente comando de SQL. Si lo desea, puede descargar y ver desde Amazon S3 los datos de origen para la tablasales
. . COPY sales FROM 's3://redshift-downloads/tickit/sales_tab.txt' DELIMITER '\t' TIMEFORMAT 'MM/DD/YYYY HH:MI:SS' REGION 'us-east-1' IAM_ROLE default;
-
Cargue la tabla
date
con el siguiente comando de SQL. Si lo desea, puede descargar y ver desde Amazon S3 los datos de origen para la tabladate
. . COPY date FROM 's3://redshift-downloads/tickit/date2008_pipe.txt' DELIMITER '|' REGION 'us-east-1' IAM_ROLE default;
Carga de datos desde Amazon S3 mediante el editor de consultas v2
En esta sección, se describe cómo cargar los datos propios en un clúster de Amazon Redshift. El uso del editor de consultas v2 simplifica la carga de datos cuando se utiliza el asistente Cargar datos. El comando COPY generado y utilizado en el asistente Cargar datos del editor de consultas v2 admite todos los parámetros disponibles para la sintaxis del comando COPY para cargar datos de Amazon S3. Para obtener información acerca del comando COPY y las opciones que se utilizan para copiar la carga de Amazon S3, consulte Comando COPY de Amazon Simple Storage Service en la Guía para el desarrollador de base de datos de Amazon Redshift.
Para cargar sus propios datos de Amazon S3 en Amazon Redshift, Amazon Redshift, requiere un rol de IAM que tenga los privilegios necesarios para cargar datos del bucket de Amazon S3 especificado.
Para cargar los datos propios desde Amazon S3 en Amazon Redshift, puede usar el asistente de carga de datos del editor de consultas v2. Para obtener más información sobre cómo usar el asistente de carga de datos, consulte Carga de datos desde Amazon S3 en la Guía de administración de Amazon Redshift.
Creación de datos de TICKIT en su clúster
TICKIT es una base de datos de ejemplo que, si lo desea, puede cargar en el clúster de Amazon Redshift para aprender a consultar datos en Amazon Redshift. Puede crear el conjunto completo de tablas de TICKIT y cargar datos en su clúster de las siguientes maneras:
Cuando se crea un clúster en la consola de Amazon Redshift, en ese momento tiene la opción cargar datos de TICKIT de muestra al mismo tiempo. En la consola de Amazon Redshift, elija Clústeres y Crear clúster. En la sección Datos de muestra, seleccione Cargar datos de muestra. Amazon Redshift cargará automáticamente el conjunto de datos de muestra en la base de datos
dev
del clúster de Amazon Redshift durante la creación del clúster.Para conectarse a un clúster existente, haga lo siguiente:
En la consola de Amazon Redshift, elija Clústeres en la barra de navegación.
Elija el clúster en el panel Clústeres.
Elija Consultar datos y Consultar en el editor de consultas v2.
Expanda examplecluster en la lista de recursos. Si es la primera vez que se conecta al clúster, aparece Conectarse a examplecluster. Elija Nombre de usuario y contraseña de la base de datos. Deje la base de datos como
dev
. Especifiqueawsuser
para el nombre de usuario yChangeit1
para la contraseña.Seleccione Crear conexión.
Con el editor de consultas de Amazon Redshift v2, puede cargar datos de TICKIT en una base de datos de muestra denominada sample_data_dev. Elija la base de datos sample_data_dev en la lista de recursos. Junto al nodo tickit, elija el icono Abrir blocs de notas de ejemplo. Confirme que desea crear la base de datos de ejemplo.
El editor de consultas de Amazon Redshift v2 crea la base de datos de muestra junto con un cuaderno de ejemplo denominado tickit-sample-notebook. Puede elegir Ejecutar todo para ejecutar este bloc de notas para consultar los datos de la base de datos de ejemplo.
Para ver más información sobre los datos de TICKIT, consulte Bases de datos de muestra en la Guía para desarrolladores de bases de datos de Amazon Redshift.
Paso 5: Probar consultas de ejemplo mediante el editor de consultas
Para configurar y usar el editor de consultas de Amazon Redshift v2 para consultar una base de datos, visite Trabajo con el editor de consultas v2 en la Guía de administración de Amazon Redshift.
Ahora, pruebe algunas consultas de ejemplo, como se muestra a continuación. Para crear consultas nuevas en el editor de consultas v2, elija el icono + en la esquina superior derecha del panel de consultas y elija SQL. Aparece una nueva página de consultas en la que puede copiar y pegar las siguientes consultas SQL.
nota
Asegúrese de ejecutar primero la primera consulta en el bloc de notas, que establece el valor de configuración del servidor search_path
en el esquema tickit
mediante el siguiente comando SQL:
set search_path to tickit;
Para obtener más información acerca de cómo trabajar con el comando SELECT, consulte SELECT en la Guía para desarrolladores de bases de datos de Amazon Redshift.
-- Get definition for the sales table. SELECT * FROM pg_table_def WHERE tablename = 'sales';
-- Find total sales on a given calendar date. SELECT sum(qtysold) FROM sales, date WHERE sales.dateid = date.dateid AND caldate = '2008-01-05';
-- Find top 10 buyers by quantity. SELECT firstname, lastname, total_quantity FROM (SELECT buyerid, sum(qtysold) total_quantity FROM sales GROUP BY buyerid ORDER BY total_quantity desc limit 10) Q, users WHERE Q.buyerid = userid ORDER BY Q.total_quantity desc;
-- Find events in the 99.9 percentile in terms of all time gross sales. SELECT eventname, total_price FROM (SELECT eventid, total_price, ntile(1000) over(order by total_price desc) as percentile FROM (SELECT eventid, sum(pricepaid) total_price FROM sales GROUP BY eventid)) Q, event E WHERE Q.eventid = E.eventid AND percentile = 1 ORDER BY total_price desc;
Paso 6: Restablecer su entorno
En los pasos anteriores, creó correctamente un clúster de Amazon Redshift, cargó los datos en tablas y consultó los datos mediante un cliente de SQL como el editor de consultas de Amazon Redshift v2.
Cuando haya completado este tutorial, le sugerimos restablecer el entorno a su estado anterior eliminando el clúster de muestra. Se le seguirá cobrando por el servicio Amazon Redshift hasta que elimine el clúster.
No obstante, es posible que desee continuar ejecutando el clúster de muestra si planea probar tareas de otras guías de Amazon Redshift o las tareas descritas en Ejecución de comandos para definir y utilizar una base de datos en el almacenamiento de datos.
Para eliminar un clúster
-
Inicie sesión en la AWS Management Console y abra la consola de Amazon Redshift en https://console.aws.amazon.com/redshiftv2/
. -
En el menú de navegación, elija Clusters (Clústeres) para mostrar la lista de clústeres.
-
Seleccione el clúster de
examplecluster
. En Actions (Acciones), seleccione Delete (Eliminar). Aparece la página Delete examplecluster?. -
Confirme el clúster que desea eliminar, desactive la opción Crear instantánea final y, a continuación, ingrese
delete
para confirmar la eliminación. Seleccione Delete cluster (Eliminar clúster).
En la página de lista de clúster, se actualiza el estado del clúster a medida que se elimina el clúster.
Luego de completar este tutorial, podrá encontrar más información acerca de Amazon Redshift y los pasos siguientes en Recursos adicionales para obtener información acerca de Amazon Redshift.