Support für Transaktionstabellenformate Weitere Ressourcen

Verwendung AWS Lake Formation mit Amazon Athena

Amazon Athena ist ein serverloser Abfrageservice, der Sie bei der Analyse strukturierter, halbstrukturierter und unstrukturierter Daten unterstützt, die in Amazon S3 gespeichert sind. Sie können Athena SQL verwenden, um Daten aus den Datenformaten CSV, JSON, Parquet und Avro abzufragen. Athena SQL unterstützt auch Tabellenformate wie Apache Hive, Apache Hudi und Apache Iceberg. Athena lässt sich in die integrieren AWS Glue Data Catalog , um Metadaten Ihrer Datensätze in Amazon S3 zu speichern. Athena kann Lake Formation verwenden, um Zugriffskontrollrichtlinien für diese Datensätze zu definieren und zu verwalten.

Hier sind einige häufige Anwendungsfälle, in denen Sie Lake Formation mit Athena verwenden können.

Verwenden Sie Lake Formation Formation-Berechtigungen für den Zugriff auf die Datenkatalogressourcen (Datenbank und Tabellen) von Athena. Sie können entweder die Methode der benannten Ressource oder LF-Tags verwenden, um Berechtigungen für Datenbanken und Tabellen zu definieren. Weitere Informationen finden Sie unter:
- Erteilen von Datenbankberechtigungen mithilfe der benannten Ressourcenmethode
- Tag-basierte Zugangskontrolle von Lake Formation
Anmerkung
Lake Formation Formation-Berechtigungen gelten nur, wenn Athena SQL verwendet wird, um Quelldaten aus Amazon S3 und Metadaten im Datenkatalog abzufragen.
Athena Spark unterstützt keine Abfragen von Datenkatalogtabellen mit Lake Formation Formation-Berechtigungen. Lake Formation Formation-Berechtigungen unterstützen sowohl Lese- als auch Schreiboperationen für Datenbanken und Tabellen.

Anmerkung
Sie können keine Datenfilter anwenden, wenn Sie LF-Tags verwenden, um Berechtigungen für Datenkatalogressourcen zu verwalten.
Steuern Sie die AbfrageergebnisseDatenfilter in Lake Formation, indem Sie Tabellen in Ihren Amazon S3 S3-Data Lakes sichern, indem Sie Berechtigungen auf Spalten-, Zeilen- und Zellenebene gewähren. Informationen zu den Einschränkungen bei der Partitionsprojektion finden Sie im Amazon Athena Athena-Benutzerhandbuch.
Erzwingen Sie bei der Ausführung von Verbundabfragen eine differenzierte Zugriffskontrolle für die Daten, die dem SAML-basierten Athena-Benutzer zur Verfügung stehen.

Die JDBC- und ODBC-Treiber von Athena unterstützen die Konfiguration des Verbundzugriffs auf Ihre Datenquelle mithilfe eines SAML-basierten Identity Providers (IdP). Verwenden Sie Amazon, das in Lake Formation QuickSight integriert ist, mit Ihren vorhandenen IAM-Rollen- oder SAML-Benutzern oder -Gruppen, um Athena-Abfrageergebnisse zu visualisieren.

Anmerkung
Lake Formation Formation-Berechtigungen für SAML-Benutzer und -Gruppen gelten nur, wenn Sie mithilfe des JDBC- oder ODBC-Treibers Anfragen an Athena senden.

Weitere Informationen finden Sie unter Verwenden von Lake Formation und den Athena JDBC- und ODBC-Treibern für den Verbundzugriff auf Athena.
Anmerkung
Derzeit wird die Autorisierung des Zugriffs auf SAML-Identitäten in Lake Formation in den folgenden Regionen nicht unterstützt:
- Naher Osten (Bahrain) – me-south-1
- Asien-Pazifik (Hongkong) – ap-east-1
- Afrika (Kapstadt) – af-south-1
- China (Ningxia) – cn-northwest-1
- Asien-Pazifik (Osaka) – ap-northeast-3
Wird verwendetKontoübergreifender Datenaustausch in Lake Formation, um Tabellen in einem anderen Konto abzufragen.

Anmerkung

Weitere Informationen zu Einschränkungen bei der Verwendung von Lake Formation Formation-Berechtigungen für finden Sie unter Überlegungen und Einschränkungen. Views

Support für Transaktionstabellenformate

Durch die Anwendung Lake Formation Formation-Berechtigungen können Sie Ihre Transaktionsdaten in Ihren Amazon S3 S3-basierten Data Lakes sichern. In der folgenden Tabelle sind Transaktionstabellenformate aufgeführt, die in den Berechtigungen Athena und Lake Formation unterstützt werden. Lake Formation erzwingt diese Berechtigungen, wenn Athena-Benutzer ihre Abfragen ausführen.

Tabellenformat Beschreibung und zulässige Operationen In Athena werden Lake Formation Formation-Berechtigungen unterstützt

Tabellenformat	Beschreibung und zulässige Operationen	In Athena werden Lake Formation Formation-Berechtigungen unterstützt
Apache Hudi	Ein Format, das zur Vereinfachung der inkrementellen Datenverarbeitung und der Entwicklung von Datenleitungen verwendet wird. Athena unterstützt Erstellungs- und Lesevorgänge mit Apache Hudi-Tabellenformaten auf Amazon S3 S3-Datensätzen für die Hudi-Tabellentypen Copy on Write (CoW) und Merge On Read (MoR). Athena unterstützt keine Schreiboperationen auf Hudi-Tabellen. Verwenden Sie Athena, um Hudi-Datensätze abzufragen.	Wird verwendetDatenfilterung und Sicherheit auf Zellebene in Lake Formation, um Hudi-Tabellen mithilfe von Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene zu sichern.
Apache Iceberg	Ein offenes Tabellenformat, das große Sammlungen von Dateien als Tabellen verwaltet und moderne analytische Data Lake-Operationen wie Einfügen, Aktualisieren, Löschen und Zeitreiseabfragen auf Datensatzebene unterstützt. Weitere Informationen zur Unterstützung von Iceberg-Tabellen durch Athena finden Sie unter Iceberg-Tabellen verwenden.	Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene werden unterstützt. Derzeit unterstützt Lake Formation die Verwaltung von Berechtigungen für Schreiboperationen wie `VACUUMMERGE`, `UPDATE` und `OPTIMIZE` für Tabellen in Open Table Formats nicht.
Linux Foundation Delta Lake	Delta Lake ist ein Open-Source-Projekt, das bei der Implementierung moderner Data-Lake-Architekturen hilft, die üblicherweise auf Amazon S3 oder Hadoop Distributed File System (HDFS) basieren. Athena unterstützt Delta-Lake-Tabellen, die mithilfe einer Symlink-basierten Manifest-Tabellendefinition AWS Glue Data Catalog aus einer Delta Lake-Tabelle erstellt wurden. Weitere Informationen finden Sie unter Delta Lake-Tabellen mithilfe von Crawlern crawlen. AWS Glue Athena (Engine-Version 3) unterstützt das Lesen nativer Delta Lake-Tabellen. Weitere Informationen finden Sie unter Einführung der systemeigenen Unterstützung für Delta Lake-Tabellen mit AWS Glue Crawlern.	Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene werden für Symlink-Tabellen und native Delta Lake-Tabellen unterstützt.

Apache Hudi

Ein Format, das zur Vereinfachung der inkrementellen Datenverarbeitung und der Entwicklung von Datenleitungen verwendet wird.

Athena unterstützt Erstellungs- und Lesevorgänge mit Apache Hudi-Tabellenformaten auf Amazon S3 S3-Datensätzen für die Hudi-Tabellentypen Copy on Write (CoW) und Merge On Read (MoR). Athena unterstützt keine Schreiboperationen auf Hudi-Tabellen.

Verwenden Sie Athena, um Hudi-Datensätze abzufragen.

Wird verwendetDatenfilterung und Sicherheit auf Zellebene in Lake Formation, um Hudi-Tabellen mithilfe von Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene zu sichern.

Apache Iceberg

Ein offenes Tabellenformat, das große Sammlungen von Dateien als Tabellen verwaltet und moderne analytische Data Lake-Operationen wie Einfügen, Aktualisieren, Löschen und Zeitreiseabfragen auf Datensatzebene unterstützt.

Weitere Informationen zur Unterstützung von Iceberg-Tabellen durch Athena finden Sie unter Iceberg-Tabellen verwenden.

Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene werden unterstützt. Derzeit unterstützt Lake Formation die Verwaltung von Berechtigungen für Schreiboperationen wie VACUUMMERGE, UPDATE und OPTIMIZE für Tabellen in Open Table Formats nicht.

Linux Foundation Delta Lake

Delta Lake ist ein Open-Source-Projekt, das bei der Implementierung moderner Data-Lake-Architekturen hilft, die üblicherweise auf Amazon S3 oder Hadoop Distributed File System (HDFS) basieren.

Athena unterstützt Delta-Lake-Tabellen, die mithilfe einer Symlink-basierten Manifest-Tabellendefinition AWS Glue Data Catalog aus einer Delta Lake-Tabelle erstellt wurden.

Weitere Informationen finden Sie unter Delta Lake-Tabellen mithilfe von Crawlern crawlen. AWS Glue

Athena (Engine-Version 3) unterstützt das Lesen nativer Delta Lake-Tabellen.

Weitere Informationen finden Sie unter Einführung der systemeigenen Unterstützung für Delta Lake-Tabellen mit AWS Glue Crawlern.

Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene werden für Symlink-Tabellen und native Delta Lake-Tabellen unterstützt.

Weitere Ressourcen

Blogbeiträge, Videos und Workshops

Fragen Sie mit Amazon Athena einen Apache Hudi-Datensatz in einem Amazon S3 S3-Data Lake ab
Erstellen Sie einen Apache Iceberg Data Lake mit Amazon Athena, Amazon EMR und AWS Glue
Einfügen, Aktualisieren, Löschen auf Amazon S3 mit Athena und Apache Iceberg
Lake Formation-Workshop zur LF-Tag-basierten Zugangskontrolle zum Abfragen eines Data Lakes.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Zusammenarbeit mit anderen AWS Diensten

Amazon Redshift Spectrum