Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Starten einer Spark-Anwendung mithilfe der Amazon-Redshift-Integration für Apache Spark
Für die EMR Amazon-Versionen 6.4 bis 6.9 müssen Sie die --packages
Option --jars
oder verwenden, um anzugeben, welche der folgenden JAR Dateien Sie verwenden möchten. Die --jars
Option gibt Abhängigkeiten an, die lokalHDFS, in oder mithilfe von HTTP /S gespeichert sind. Weitere von der --jars
Option unterstützte Dateispeicherorte finden Sie unter Erweitertes Abhängigkeitsmanagement--packages
-Option spezifiziert Abhängigkeiten, die im öffentlichen Maven-Repository gespeichert sind.
-
spark-redshift.jar
-
spark-avro.jar
-
RedshiftJDBC.jar
-
minimal-json.jar
EMRAmazon-Versionen 6.10.0 und höher erfordern die minimal-json.jar
Abhängigkeit nicht und installieren die anderen Abhängigkeiten standardmäßig automatisch in jedem Cluster. Die folgenden Beispiele zeigen, wie Sie eine Spark-Anwendung mit der Amazon-Redshift-Integration für Apache Spark starten.