Starten einer Spark-Anwendung mit der Amazon Redshift Redshift-Integration für Apache Spark

Um die Integration mit EMR Serverless 6.9.0 zu verwenden, übergeben Sie die erforderlichen Spark-Redshift-Abhängigkeiten mit Ihrem Spark-Job. Wird verwendet--jars, um Redshift-Connector-bezogene Bibliotheken einzubeziehen. Informationen zum Zugriff auf andere von der --jars Option unterstützte Dateispeicherorte finden Sie im Abschnitt Advanced Dependency Management der Apache Spark-Dokumentation.

spark-redshift.jar
spark-avro.jar
RedshiftJDBC.jar
minimal-json.jar

Amazon-EMR-Versionen 6.10.0 und höher erfordern die minimal-json.jar-Abhängigkeit nicht und installieren die anderen Abhängigkeiten standardmäßig automatisch in jedem Cluster. Die folgenden Beispiele zeigen, wie Sie eine Spark-Anwendung mit der Amazon Redshift Redshift-Integration für Apache Spark starten.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Spark auf Amazon Redshift verwenden

Authentifizieren Sie sich bei Amazon Redshift