Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Starten einer Spark-Anwendung mithilfe der Amazon-Redshift-Integration für Apache Spark
Für die Amazon-EMR-Versionen 6.4 bis 6.9 müssen Sie die Option --jars oder --packages verwenden, um anzugeben, welche der folgenden JAR-Dateien Sie verwenden möchten. Die --jars Option gibt Abhängigkeiten an, die lokal, in HDFS oder mithilfe von gespeichert sind. HTTP/S Weitere Dateispeicherorte, die von der --jars Option unterstützt werden, finden Sie unter Advanced Dependency Management--packages-Option spezifiziert Abhängigkeiten, die im öffentlichen Maven-Repository gespeichert sind.
-
spark-redshift.jar -
spark-avro.jar -
RedshiftJDBC.jar -
minimal-json.jar
Amazon-EMR-Versionen 6.10.0 und höher erfordern die minimal-json.jar-Abhängigkeit nicht und installieren die anderen Abhängigkeiten standardmäßig automatisch in jedem Cluster. Die folgenden Beispiele zeigen, wie Sie eine Spark-Anwendung mit der Amazon-Redshift-Integration für Apache Spark starten.