Copia i dati su Amazon Redshift utilizzando la riga di comando

Questo tutorial dimostra come copiare dati da Amazon S3 ad Amazon Redshift. Creerai una nuova tabella in Amazon Redshift e la utilizzerai AWS Data Pipeline per trasferire i dati su questa tabella da un bucket Amazon S3 pubblico, che contiene dati di input di esempio in formato CSV. I log vengono salvati in un bucket Amazon S3 di tua proprietà.

Amazon S3 è un servizio Web che consente di archiviare dati nel cloud. Per ulteriori informazioni, consultare la Guida per l'utente di Amazon Simple archiviazione Service. Amazon Redshift è un servizio di data warehouse nel cloud. Per ulteriori informazioni, consulta la Amazon Redshift Management Guide.

Prerequisiti

Prima di iniziare , devi completare le fasi seguenti:

Installa e configura un'interfaccia a riga di comando (CLI). Per ulteriori informazioni, consulta Accedere AWS Data Pipeline.
Assicurati che i ruoli IAM siano denominati DataPipelineDefaultRoleed DataPipelineDefaultResourceRoleesistano. La AWS Data Pipeline console crea questi ruoli automaticamente. Se non hai utilizzato la AWS Data Pipeline console almeno una volta, devi creare questi ruoli manualmente. Per ulteriori informazioni, consulta Ruoli IAM per AWS Data Pipeline.
Imposta il COPY comando in Amazon Redshift, poiché avrai bisogno che queste stesse opzioni funzionino quando esegui la copia all'interno. AWS Data Pipeline Per informazioni, consulta Prima di iniziare: configura le opzioni COPY e di caricamento dati.
Configura un database Amazon Redshift. Per ulteriori informazioni, consulta Configura Pipeline, crea un gruppo di sicurezza e crea un cluster Amazon Redshift.

Processi

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Prima di iniziare: Configura pipeline, sicurezza e cluster

Definire una pipeline in formato JSON