Copia i dati su Amazon Redshift utilizzando la riga di comando - AWS Data Pipeline

AWS Data Pipeline non è più disponibile per i nuovi clienti. I clienti esistenti di AWS Data Pipeline possono continuare a utilizzare il servizio normalmente. Ulteriori informazioni

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Copia i dati su Amazon Redshift utilizzando la riga di comando

Questo tutorial dimostra come copiare dati da Amazon S3 ad Amazon Redshift. Creerai una nuova tabella in Amazon Redshift e la utilizzerai AWS Data Pipeline per trasferire i dati a questa tabella da un bucket Amazon S3 pubblico, che contiene dati di input di esempio in formato CSV. I log vengono salvati in un bucket Amazon S3 di tua proprietà.

Amazon S3 è un servizio Web che consente di archiviare dati nel cloud. Per ulteriori informazioni, consultare la Guida per l'utente di Amazon Simple archiviazione Service. Amazon Redshift è un servizio di data warehouse nel cloud. Per ulteriori informazioni, consulta la Amazon Redshift Management Guide.

Prerequisiti

Prima di iniziare , devi completare le fasi seguenti:

  1. Installa e configura un'interfaccia a riga di comando (CLI). Per ulteriori informazioni, consulta Accedere AWS Data Pipeline.

  2. Assicurati che i ruoli IAM siano denominati DataPipelineDefaultRoleed DataPipelineDefaultResourceRoleesistano. La AWS Data Pipeline console crea questi ruoli automaticamente. Se non hai usato la AWS Data Pipeline console almeno una volta, devi creare questi ruoli manualmente. Per ulteriori informazioni, consulta Ruoli IAM per AWS Data Pipeline.

  3. Imposta il COPY comando in Amazon Redshift, poiché è necessario che queste stesse opzioni funzionino quando esegui la copia all'interno. AWS Data Pipeline Per informazioni, consulta Prima di iniziare: configura le opzioni COPY e di caricamento dati.

  4. Configura un database Amazon Redshift. Per ulteriori informazioni, consulta Configura Pipeline, crea un gruppo di sicurezza e crea un cluster Amazon Redshift.