Daten über die Befehlszeile nach Amazon Redshift kopieren - AWS Data Pipeline

AWS Data Pipeline ist für Neukunden nicht mehr verfügbar. Bestehende Kunden von AWS Data Pipeline können den Service weiterhin wie gewohnt nutzen. Weitere Informationen

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Daten über die Befehlszeile nach Amazon Redshift kopieren

Dieses Tutorial zeigt, wie Sie Daten von Amazon S3 nach Amazon Redshift kopieren. Sie erstellen eine neue Tabelle in Amazon Redshift und verwenden sie dann, AWS Data Pipeline um Daten aus einem öffentlichen Amazon S3-Bucket, der Beispieleingabedaten im CSV-Format enthält, in diese Tabelle zu übertragen. Die Protokolle werden in einem Amazon S3-Bucket gespeichert, dessen Eigentümer Sie sind.

Amazon S3 ist ein Webservice, mit dem Sie Daten in der Cloud speichern können. Weitere Informationen finden Sie im Benutzerhandbuch für Amazon Simple Storage Service. Amazon Redshift ist ein Data Warehouse-Service in der Cloud. Weitere Informationen finden Sie im Amazon Redshift Management Guide.

Voraussetzungen

Bevor Sie beginnen, müssen Sie die folgenden Schritte ausführen:

  1. Installieren und konfigurieren Sie eine Befehlszeilenschnittstelle (CLI). Weitere Informationen finden Sie unter Zugreifen AWS Data Pipeline.

  2. Stellen Sie sicher, dass die IAM-Rollen benannt DataPipelineDefaultResourceRolesind DataPipelineDefaultRoleund existieren. Die AWS Data Pipeline Konsole erstellt diese Rollen automatisch für Sie. Wenn Sie die AWS Data Pipeline Konsole nicht mindestens einmal verwendet haben, müssen Sie diese Rollen manuell erstellen. Weitere Informationen finden Sie unter IAM-Rollen für AWS Data Pipeline.

  3. Richten Sie den COPY Befehl in Amazon Redshift ein, da dieselben Optionen funktionieren müssen, wenn Sie das Kopieren innerhalb von AWS Data Pipeline Amazon Redshift durchführen. Weitere Informationen finden Sie unter Bevor Sie beginnen: Konfigurieren Sie COPY-Optionen und laden Sie Daten.

  4. Richten Sie eine Amazon Redshift-Datenbank ein. Weitere Informationen finden Sie unter Pipeline einrichten, Sicherheitsgruppe erstellen und Amazon Redshift-Cluster erstellen.