Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verschiedene Möglichkeiten, Daten in Amazon zu übertragen EMR
Amazon EMR bietet mehrere Möglichkeiten, Daten auf einen Cluster zu übertragen. Die gängigste Methode besteht darin, die Daten auf Amazon S3 hochzuladen und die integrierten Funktionen von Amazon EMR zu verwenden, um die Daten in Ihren Cluster zu laden. Sie können auch das verwenden DistributedCache Funktion von Hadoop zum Übertragen von Dateien von einem verteilten Dateisystem in das lokale Dateisystem. Die von Amazon bereitgestellte Implementierung von Hive EMR (Hive-Version 0.7.1.1 und höher) umfasst Funktionen, mit denen Sie Daten zwischen DynamoDB und einem Amazon-Cluster importieren und exportieren können. EMR Wenn Sie große Datenmengen On-Premises verarbeiten müssen, kann der AWS Direct Connect -Service nützlich sein.
Themen
- Daten aus Amazon S3 uploaden
- Daten mit AWS DataSync hochladen
- Dateien mit verteiltem Cache mit Amazon importieren EMR
- Erkennung und Verarbeitung komprimierter Dateien mit Amazon EMR
- DynamoDB-Daten mit Amazon in Hive importieren EMR
- Connect zu Daten AWS Direct Connect von Amazon her EMR
- Laden Sie große Datenmengen für Amazon hoch EMR mit AWS Snowball