Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verwenden Sie Apache Spark in Amazon Athena
Amazon Athena vereinfacht die interaktive Ausführung von Datenanalysen und -erkundungen mithilfe von Apache Spark, ohne dass Sie Ressourcen planen, konfigurieren oder verwalten müssen. Das Ausführen von Apache-Spark-Anwendungen auf Athena bedeutet, dass Spark-Code zur Verarbeitung übermittelt und die Ergebnisse direkt empfangen werden, ohne dass eine zusätzliche Konfiguration erforderlich ist. Sie können die vereinfachte Notebook-Oberfläche in der Amazon Athena Athena-Konsole verwenden, um Apache Spark-Anwendungen mit Python oder Athena Notebook zu entwickeln. APIs Apache Spark auf Amazon Athena ist Serverless und bietet eine automatische, bedarfsgerechte Skalierung, die sofortige Rechenleistung für wechselnde Daten-Volumes und Verarbeitungsanforderungen bereitstellt.
Amazon Athena bietet die folgenden Features:
-
Verwendung der Konsole – Übermitteln Sie Ihre Spark-Anwendungen über die Amazon-Athena-Konsole.
-
Scripting – Erstellen und debuggen Sie schnell und interaktiv Apache-Spark-Anwendungen in Python.
-
Dynamische Skalierung – Amazon Athena bestimmt automatisch die Rechen- und Arbeitsspeicherressourcen, die zum Ausführen eines Auftrags erforderlich sind, und skaliert diese Ressourcen fortlaufend entsprechend bis zu den von Ihnen angegebenen Höchstwerten. Diese dynamische Skalierung reduziert die Kosten, ohne die Geschwindigkeit zu beeinträchtigen.
-
Notebook-Erlebnis – Verwenden Sie den Athena-Notebook-Editor, um Berechnungen über eine vertraute Benutzeroberfläche zu erstellen, zu bearbeiten und auszuführen. Athena-Notebooks sind mit Jupyter Notebooks kompatibel und enthalten eine Liste von Zellen, die der Reihe nach als Berechnungen ausgeführt werden. Zelleninhalte können Code, Text, Markdown, Mathematik, Diagramme und Multimedia enthalten.
Weitere Informationen finden Sie unter Ausführen von Spark SQL auf Amazon Athena Spark
Themen
- Überlegungen und Einschränkungen
- Erste Schritte
- Notizbuchdateien verwalten
- Notizbuch-Editor
- Tabellenformate, die nicht von Hive stammen
- Unterstützung für Python-Bibliotheken
- Geben Sie eine benutzerdefinierte Konfiguration an
- Unterstützte Daten- und Speicherformate
- Überwachen Sie Apache Spark-Berechnungen
- Aktivieren Sie, dass der Anforderer Buckets bezahlt
- Aktivieren Sie die Spark-Verschlüsselung
- Kontenübergreifender Katalogzugriff
- Servicekontingente
- Athena Notizbuch APIs
- Fehlerbehebung