Verschiedene Möglichkeiten, Daten in Amazon zu übertragen EMR - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verschiedene Möglichkeiten, Daten in Amazon zu übertragen EMR

Amazon EMR bietet mehrere Möglichkeiten, Daten auf einen Cluster zu übertragen. Die gängigste Methode besteht darin, die Daten auf Amazon S3 hochzuladen und die integrierten Funktionen von Amazon EMR zu verwenden, um die Daten in Ihren Cluster zu laden. Sie können auch das verwenden DistributedCache Funktion von Hadoop zum Übertragen von Dateien von einem verteilten Dateisystem in das lokale Dateisystem. Die von Amazon bereitgestellte Implementierung von Hive EMR (Hive-Version 0.7.1.1 und höher) umfasst Funktionen, mit denen Sie Daten zwischen DynamoDB und einem Amazon-Cluster importieren und exportieren können. EMR Wenn Sie große Datenmengen On-Premises verarbeiten müssen, kann der AWS Direct Connect -Service nützlich sein.