Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verwendung AWS Lake Formation mit Amazon Athena
Amazon Athena ist ein serverloser Abfrageservice, der Sie bei der Analyse strukturierter, halbstrukturierter und unstrukturierter Daten unterstützt, die in Amazon S3 gespeichert sind. Sie können Athena SQL verwenden, um Daten aus den Datenformaten CSV, JSON, Parquet und Avro abzufragen. Athena SQL unterstützt auch Tabellenformate wie Apache Hive, Apache
Hier sind einige häufige Anwendungsfälle, in denen Sie Lake Formation mit Athena verwenden können.
Verwenden Sie Lake Formation Formation-Berechtigungen für den Zugriff auf die Datenkatalogressourcen (Datenbank und Tabellen) von Athena. Sie können entweder die Methode der benannten Ressource oder LF-Tags verwenden, um Berechtigungen für Datenbanken und Tabellen zu definieren. Weitere Informationen finden Sie unter:
Anmerkung
Lake Formation Formation-Berechtigungen gelten nur, wenn Athena SQL verwendet wird, um Quelldaten aus Amazon S3 und Metadaten im Datenkatalog abzufragen.
Athena Spark unterstützt keine Abfragen von Datenkatalogtabellen mit Lake Formation Formation-Berechtigungen. Lake Formation Formation-Berechtigungen unterstützen sowohl Lese- als auch Schreiboperationen für Datenbanken und Tabellen.
Anmerkung
Sie können keine Datenfilter anwenden, wenn Sie LF-Tags verwenden, um Berechtigungen für Datenkatalogressourcen zu verwalten.
Steuern Sie die AbfrageergebnisseDatenfilter in Lake Formation, indem Sie Tabellen in Ihren Amazon S3 S3-Data Lakes sichern, indem Sie Berechtigungen auf Spalten-, Zeilen- und Zellenebene gewähren. Informationen zu den Einschränkungen bei der Partitionsprojektion finden Sie im Amazon Athena Athena-Benutzerhandbuch.
Erzwingen Sie bei der Ausführung von Verbundabfragen eine differenzierte Zugriffskontrolle für die Daten, die dem SAML-basierten Athena-Benutzer zur Verfügung stehen.
Die JDBC- und ODBC-Treiber von Athena unterstützen die Konfiguration des Verbundzugriffs auf Ihre Datenquelle mithilfe eines SAML-basierten Identity Providers (IdP). Verwenden Sie Amazon, das in Lake Formation QuickSight integriert ist, mit Ihren vorhandenen IAM-Rollen- oder SAML-Benutzern oder -Gruppen, um Athena-Abfrageergebnisse zu visualisieren.
Anmerkung
Lake Formation Formation-Berechtigungen für SAML-Benutzer und -Gruppen gelten nur, wenn Sie mithilfe des JDBC- oder ODBC-Treibers Anfragen an Athena senden.
Weitere Informationen finden Sie unter Verwenden von Lake Formation und den Athena JDBC- und ODBC-Treibern für den Verbundzugriff auf Athena.
Anmerkung
Derzeit wird die Autorisierung des Zugriffs auf SAML-Identitäten in Lake Formation in den folgenden Regionen nicht unterstützt:
-
Naher Osten (Bahrain) – me-south-1
-
Asien-Pazifik (Hongkong) – ap-east-1
-
Afrika (Kapstadt) – af-south-1
-
China (Ningxia) – cn-northwest-1
-
Asien-Pazifik (Osaka) – ap-northeast-3
-
Wird verwendetKontoübergreifender Datenaustausch in Lake Formation, um Tabellen in einem anderen Konto abzufragen.
Anmerkung
Weitere Informationen zu Einschränkungen bei der Verwendung von Lake Formation Formation-Berechtigungen für finden Sie unter Überlegungen und Einschränkungen. Views
Support für Transaktionstabellenformate
Durch die Anwendung Lake Formation Formation-Berechtigungen können Sie Ihre Transaktionsdaten in Ihren Amazon S3 S3-basierten Data Lakes sichern. In der folgenden Tabelle sind Transaktionstabellenformate aufgeführt, die in den Berechtigungen Athena und Lake Formation unterstützt werden. Lake Formation erzwingt diese Berechtigungen, wenn Athena-Benutzer ihre Abfragen ausführen.
Tabellenformat | Beschreibung und zulässige Operationen | In Athena werden Lake Formation Formation-Berechtigungen unterstützt |
---|---|---|
Apache Hudi |
Ein Format, das zur Vereinfachung der inkrementellen Datenverarbeitung und der Entwicklung von Datenleitungen verwendet wird. Athena unterstützt Erstellungs- und Lesevorgänge mit Apache Hudi-Tabellenformaten auf Amazon S3 S3-Datensätzen für die Hudi-Tabellentypen Copy on Write (CoW) und Merge On Read (MoR). Athena unterstützt keine Schreiboperationen auf Hudi-Tabellen. Verwenden Sie Athena, um Hudi-Datensätze abzufragen. |
Wird verwendetDatenfilterung und Sicherheit auf Zellebene in Lake Formation, um Hudi-Tabellen mithilfe von Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene zu sichern. |
Apache Iceberg |
Ein offenes Tabellenformat, das große Sammlungen von Dateien als Tabellen verwaltet und moderne analytische Data Lake-Operationen wie Einfügen, Aktualisieren, Löschen und Zeitreiseabfragen auf Datensatzebene unterstützt. |
Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene werden unterstützt. Derzeit unterstützt Lake Formation die Verwaltung von Berechtigungen für Schreiboperationen wie |
Linux Foundation Delta Lake |
Delta Lake ist ein Open-Source-Projekt, das bei der Implementierung moderner Data-Lake-Architekturen hilft, die üblicherweise auf Amazon S3 oder Hadoop Distributed File System (HDFS) basieren. Athena unterstützt Delta-Lake-Tabellen, die mithilfe einer Symlink-basierten Manifest-Tabellendefinition AWS Glue Data Catalog aus einer Delta Lake-Tabelle erstellt wurden. Weitere Informationen finden Sie unter Delta Lake-Tabellen mithilfe von Crawlern crawlen Athena (Engine-Version 3) unterstützt das Lesen nativer Delta Lake-Tabellen. Weitere Informationen finden Sie unter Einführung der systemeigenen Unterstützung für Delta Lake-Tabellen mit AWS Glue Crawlern |
Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene werden für Symlink-Tabellen und native Delta Lake-Tabellen unterstützt. |
Weitere Ressourcen
Blogbeiträge, Videos und Workshops
-
Fragen Sie mit Amazon Athena einen Apache Hudi-Datensatz in einem Amazon S3 S3-Data Lake ab
-
Erstellen Sie einen Apache Iceberg Data Lake mit Amazon Athena, Amazon EMR und AWS Glue
Einfügen, Aktualisieren, Löschen auf Amazon S3 mit Athena und Apache Iceberg
Lake Formation-Workshop zur LF-Tag-basierten Zugangskontrolle
zum Abfragen eines Data Lakes.