Copier des données sur Amazon Redshift à l'aide de la ligne de commande

Ce didacticiel explique comment copier des données d'Amazon S3 vers Amazon Redshift. Vous allez créer une nouvelle table dans Amazon Redshift, puis vous l'utiliserez AWS Data Pipeline pour transférer des données vers cette table depuis un compartiment Amazon S3 public, qui contient des exemples de données d'entrée au format CSV. Les journaux sont enregistrés dans un compartiment Amazon S3 dont vous êtes le propriétaire.

Amazon S3 est un service Web qui vous permet de stocker des données dans le cloud. Pour en savoir plus, consultez Guide de l’utilisateur Amazon Simple Storage Service. Amazon Redshift est un service d'entrepôt de données dans le cloud. Pour plus d'informations, consultez le guide de gestion Amazon Redshift.

Conditions préalables

Avant de commencer, exécutez les étapes suivantes :

Installez et configurez une interface de ligne de commande (CLI). Pour de plus amples informations, veuillez consulter Accès AWS Data Pipeline.
Assurez-vous que les rôles IAM sont nommés DataPipelineDefaultRoleet DataPipelineDefaultResourceRoleexistent. La AWS Data Pipeline console crée automatiquement ces rôles pour vous. Si vous n'avez pas utilisé la AWS Data Pipeline console au moins une fois, vous devez créer ces rôles manuellement. Pour de plus amples informations, veuillez consulter Rôles IAM pour AWS Data Pipeline.
Configurez la COPY commande dans Amazon Redshift, car ces mêmes options doivent fonctionner lorsque vous effectuez la copie dans Amazon Redshift. AWS Data Pipeline Pour plus d'informations, consultez Avant de commencer : configurer les options COPY et charger des données.
Configurez une base de données Amazon Redshift. Pour de plus amples informations, veuillez consulter Configuration du pipeline, création d'un groupe de sécurité et création d'un cluster Amazon Redshift.

Tâches

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Avant de commencer : configurer le pipeline, la sécurité et le cluster

Définition d'un pipeline au format JSON