Überlegungen und Einschränkungen bei der Verwendung des Spark-Connectors - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überlegungen und Einschränkungen bei der Verwendung des Spark-Connectors

Der Spark-Konnektor unterstützt eine Vielzahl von Möglichkeiten zur Verwaltung von Anmeldeinformationen, zur Konfiguration der Sicherheit und zur Verbindung mit anderen AWS Diensten. Machen Sie sich mit den Empfehlungen in dieser Liste vertraut, um eine funktionale und belastbare Verbindung zu konfigurieren.

  • Wir empfehlen die Aktivierung SSL für die JDBC Verbindung von Spark auf Amazon EMR zu Amazon Redshift.

  • Als bewährte Methode empfehlen wir Ihnen, die Anmeldeinformationen für den Amazon-Redshift-Cluster in AWS Secrets Manager zu verwalten. Ein Beispiel finden Sie unter Verwenden AWS Secrets Manager zum Abrufen von Anmeldeinformationen für die Verbindung mit Amazon Redshift.

  • Wir empfehlen, dass Sie eine IAM Rolle mit dem Parameter aws_iam_role für den Amazon Redshift Redshift-Authentifizierungsparameter übergeben.

  • Derzeit wird das Parquet-Format vom Parameter tempformat nicht unterstützt.

  • Das tempdir URI zeigt auf einen Amazon S3 S3-Standort. Dieses temporäre Verzeichnis wird nicht automatisch bereinigt und kann zusätzliche Kosten verursachen.

  • Beachten Sie die folgenden Empfehlungen für Amazon Redshift:

  • Beachten Sie die folgenden Empfehlungen für Amazon S3:

Weitere Informationen zum Verwenden des Konnektors und seiner unterstützten Parameter finden Sie in den folgenden Ressourcen: