Copiar datos en Amazon Redshift mediante la línea de comandos

En este tutorial, se muestra cómo copiar datos de Amazon S3 en Amazon Redshift. Creará una tabla nueva en Amazon Redshift y, a continuación, la utilizará AWS Data Pipeline para transferir datos a esta tabla desde un bucket público de Amazon S3, que contiene datos de entrada de muestra en formato CSV. Los registros se guardan en un bucket de Amazon S3 de su propiedad.

Amazon S3 es un servicio web que le permite almacenar datos en la nube. Para obtener más información, consulte la Guía del usuario de Amazon Simple Storage Service. Amazon Redshift es un servicio de almacenamiento de datos en la nube. Para obtener más información, consulte la Guía de administración de Amazon Redshift.

Requisitos previos

Debe seguir estos pasos antes de comenzar:

Instale y configure la interfaz de la línea de comandos (CLI). Para obtener más información, consulte Accediendo AWS Data Pipeline.
Asegúrese de que las funciones de IAM nombradas DataPipelineDefaultRoley DataPipelineDefaultResourceRolede que existan. La AWS Data Pipeline consola crea estos roles automáticamente. Si no ha utilizado la AWS Data Pipeline consola al menos una vez, debe crear estos roles manualmente. Para obtener más información, consulte Funciones de IAM para AWS Data Pipeline.
Configure el comando COPY en Amazon Redshift, ya que tendrá que disponer de estas mismas opciones en funcionamiento al realizar la copia en AWS Data Pipeline. Para obtener información, consulte Antes de comenzar: configurar las opciones de COPY y cargar datos.
Configuración de una base de datos de Amazon Redshift Para obtener más información, consulte Configurar la canalización, crear un grupo de seguridad y crear un clúster de Amazon Redshift.

Tareas

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Antes de comenzar: configurar la canalización, la seguridad y el clúster

Definir una canalización en formato JSON