Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verwendung AWS Lake Formation mit Amazon Athena
Amazon Athena ist ein serverloser Abfrageservice, der Sie bei der Analyse strukturierter, halbstrukturierter und unstrukturierter Daten unterstützt, die in Amazon S3 gespeichert sind. Sie können Athena verwenden, SQL um Daten aus den CSV Datenformaten,JSON, Parquet und Avro abzufragen. Athena unterstützt SQL auch Tabellenformate wie Apache Hive, Apache
Hier sind einige häufige Anwendungsfälle, in denen Sie Lake Formation mit Athena verwenden können.
Verwenden Sie Lake Formation Formation-Berechtigungen für den Zugriff auf die Datenkatalogressourcen (Datenbank und Tabellen) von Athena. Sie können entweder die Methode der benannten Ressource oder LF-Tags verwenden, um Berechtigungen für Datenbanken und Tabellen zu definieren. Weitere Informationen finden Sie unter:
Anmerkung
Lake Formation Formation-Berechtigungen gelten nur, wenn Athena verwendet wirdSQL, um Quelldaten aus Amazon S3 und Metadaten im Datenkatalog abzufragen.
Athena Spark unterstützt keine Abfragen von Datenkatalogtabellen mit Lake Formation Formation-Berechtigungen. Lake Formation Formation-Berechtigungen unterstützen sowohl Lese- als auch Schreiboperationen für Datenbanken und Tabellen.
Anmerkung
Sie können keine Datenfilter anwenden, wenn Sie LF-Tags verwenden, um Berechtigungen für Datenkatalogressourcen zu verwalten.
Steuern Sie die AbfrageergebnisseDatenfilter in Lake Formation, indem Sie Tabellen in Ihren Amazon S3 S3-Data Lakes sichern, indem Sie Berechtigungen auf Spalten-, Zeilen- und Zellenebene gewähren. Informationen zu den Einschränkungen bei der Partitionsprojektion finden Sie im Amazon Athena Athena-Benutzerhandbuch.
Erzwingen Sie bei der Ausführung von Verbundabfragen eine differenzierte Zugriffskontrolle für die Daten, die dem SAML ansässigen Athena-Benutzer zur Verfügung stehen.
Athena JDBC und die ODBC Treiber unterstützen die Konfiguration des Verbundzugriffs auf Ihre Datenquelle mithilfe eines SAML basierten Identity Providers (IdP). Verwenden Sie Amazon, das in Lake Formation QuickSight integriert ist, mit Ihrer vorhandenen IAM Rolle oder Ihren SAML Benutzern oder Gruppen, um die Athena-Abfrageergebnisse zu visualisieren.
Anmerkung
Lake Formation Formation-Berechtigungen für SAML Benutzer und Gruppen gelten nur, wenn Sie mithilfe des JDBC ODBC Oder-Treibers Anfragen an Athena senden.
Weitere Informationen finden Sie unter Verwenden von Lake Formation und Athena JDBC und ODBC Treibern für den föderierten Zugriff auf Athena.
Anmerkung
Derzeit wird die Autorisierung des Zugriffs auf SAML Identitäten in Lake Formation in den folgenden Regionen nicht unterstützt:
-
Naher Osten (Bahrain) – me-south-1
-
Asien-Pazifik (Hongkong) – ap-east-1
-
Afrika (Kapstadt) – af-south-1
-
China (Ningxia) – cn-northwest-1
-
Asien-Pazifik (Osaka) – ap-northeast-3
-
Wird verwendetKontoübergreifender Datenaustausch in Lake Formation, um Tabellen in einem anderen Konto abzufragen.
Anmerkung
Weitere Informationen zu Einschränkungen bei der Verwendung von Lake Formation Formation-Berechtigungen für finden Sie unter Überlegungen und Einschränkungen. Views
Support für Transaktionstabellenformate
Durch die Anwendung Lake Formation Formation-Berechtigungen können Sie Ihre Transaktionsdaten in Ihren Amazon S3 S3-basierten Data Lakes sichern. In der folgenden Tabelle sind Transaktionstabellenformate aufgeführt, die in den Berechtigungen Athena und Lake Formation unterstützt werden. Lake Formation erzwingt diese Berechtigungen, wenn Athena-Benutzer ihre Abfragen ausführen.
Tabellenformat | Beschreibung und zulässige Operationen | In Athena werden Lake Formation Formation-Berechtigungen unterstützt |
---|---|---|
Apache Hudi |
Ein Format, das zur Vereinfachung der inkrementellen Datenverarbeitung und der Entwicklung von Datenleitungen verwendet wird. Athena unterstützt Erstellungs- und Lesevorgänge mit Apache Hudi-Tabellenformaten auf Amazon S3 S3-Datensätzen für die Hudi-Tabellentypen Copy on Write (CoW) und Merge On Read (MoR). Athena unterstützt keine Schreiboperationen auf Hudi-Tabellen. Verwenden Sie Athena, um Hudi-Datensätze abzufragen. |
Wird verwendetDatenfilterung und Sicherheit auf Zellebene in Lake Formation, um Hudi-Tabellen mithilfe von Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene zu sichern. |
Apache Iceberg |
Ein offenes Tabellenformat, das große Sammlungen von Dateien als Tabellen verwaltet und moderne analytische Data Lake-Operationen wie Einfügen, Aktualisieren, Löschen und Zeitreiseabfragen auf Datensatzebene unterstützt. |
Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene werden unterstützt. Derzeit unterstützt Lake Formation die Verwaltung von Berechtigungen für Schreiboperationen wie |
Linux Foundation Delta Lake |
Delta Lake ist ein Open-Source-Projekt, das bei der Implementierung moderner Data-Lake-Architekturen hilft, die üblicherweise auf Amazon S3 oder Hadoop Distributed File System () basieren. HDFS Athena unterstützt Delta-Lake-Tabellen, die mithilfe einer Symlink-basierten Manifest-Tabellendefinition AWS Glue Data Catalog aus einer Delta Lake-Tabelle erstellt wurden. Weitere Informationen finden Sie unter Delta Lake-Tabellen mithilfe von Crawlern crawlen Athena (Engine-Version 3) unterstützt das Lesen nativer Delta Lake-Tabellen. Weitere Informationen finden Sie unter Einführung der systemeigenen Unterstützung für Delta Lake-Tabellen mit AWS Glue Crawlern |
Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene werden für Symlink-Tabellen und native Delta Lake-Tabellen unterstützt. |
Weitere Ressourcen
Blogbeiträge, Videos und Workshops
-
Fragen Sie mit Amazon Athena einen Apache Hudi-Datensatz in einem Amazon S3 S3-Data Lake ab
-
Erstellen Sie einen Apache Iceberg Data Lake mit Amazon Athena, Amazon EMR und AWS Glue
Einfügen, Aktualisieren, Löschen auf Amazon S3 mit Athena und Apache Iceberg
Lake Formation-Workshop zur LF-Tag-basierten Zugangskontrolle
zum Abfragen eines Data Lakes.