AWS Data Pipeline ya no está disponible para nuevos clientes. Clientes actuales de AWS Data Pipeline pueden seguir utilizando el servicio con normalidad. Más información
Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Copiar datos en Amazon Redshift mediante la línea de comandos
En este tutorial, se muestra cómo copiar datos de Amazon S3 en Amazon Redshift. Creará una nueva tabla en Amazon Redshift y, a continuación, usará AWS Data Pipeline para transferir datos a esta tabla desde un bucket de Amazon S3 público, el cual contiene datos de entrada de ejemplo en formato CSV. Los registros se guardan en un bucket de Amazon S3 de su propiedad.
Amazon S3 es un servicio web que le permite almacenar datos en la nube. Para obtener más información, consulte la Guía del usuario de Amazon Simple Storage Service. Amazon Redshift es un servicio de almacenamiento de datos en la nube. Para obtener más información, consulte la Guía de administración de Amazon Redshift.
Requisitos previos
Debe seguir estos pasos antes de comenzar:
-
Instale y configure la interfaz de línea de comandos (CLI). Para obtener más información, consulte Acceder AWS Data Pipeline.
-
Asegúrese de que existan los roles de IAM denominados DataPipelineDefaultRole y DataPipelineDefaultResourceRole La consola AWS Data Pipeline crea estos roles automáticamente. Si no ha utilizado la consola AWS Data Pipeline al menos una vez, debe crear estos roles manualmente. Para obtener más información, consulte Roles de IAM para AWS Data Pipeline.
-
Configure el comando
COPY
en Amazon Redshift, ya que tendrá que disponer de estas mismas opciones en funcionamiento al realizar la copia en AWS Data Pipeline. Para obtener información, consulte Antes de comenzar: configurar las opciones de COPY y cargar datos. -
Configuración de una base de datos de Amazon Redshift Para obtener más información, consulte Configurar la canalización, crear un grupo de seguridad y crear un clúster de Amazon Redshift.