Verwendung AWS Lake Formation mit Amazon Athena - AWS Lake Formation

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwendung AWS Lake Formation mit Amazon Athena

Amazon Athena ist ein serverloser Abfrageservice, der Sie bei der Analyse strukturierter, halbstrukturierter und unstrukturierter Daten unterstützt, die in Amazon S3 gespeichert sind. Sie können Athena verwenden, SQL um Daten aus den CSV Datenformaten,JSON, Parquet und Avro abzufragen. Athena unterstützt SQL auch Tabellenformate wie Apache Hive, ApacheHudi und Apache Iceberg. Athena lässt sich in die integrieren AWS Glue Data Catalog , um Metadaten Ihrer Datensätze in Amazon S3 zu speichern. Athena kann Lake Formation verwenden, um Zugriffskontrollrichtlinien für diese Datensätze zu definieren und zu verwalten.

Hier sind einige häufige Anwendungsfälle, in denen Sie Lake Formation mit Athena verwenden können.

  • Verwenden Sie Lake Formation Formation-Berechtigungen für den Zugriff auf die Datenkatalogressourcen (Datenbank und Tabellen) von Athena. Sie können entweder die Methode der benannten Ressource oder LF-Tags verwenden, um Berechtigungen für Datenbanken und Tabellen zu definieren. Weitere Informationen finden Sie unter:

    Anmerkung

    Lake Formation Formation-Berechtigungen gelten nur, wenn Athena verwendet wirdSQL, um Quelldaten aus Amazon S3 und Metadaten im Datenkatalog abzufragen.

    Athena Spark unterstützt keine Abfragen von Datenkatalogtabellen mit Lake Formation Formation-Berechtigungen. Lake Formation Formation-Berechtigungen unterstützen sowohl Lese- als auch Schreiboperationen für Datenbanken und Tabellen.

    Anmerkung

    Sie können keine Datenfilter anwenden, wenn Sie LF-Tags verwenden, um Berechtigungen für Datenkatalogressourcen zu verwalten.

  • Steuern Sie die AbfrageergebnisseDatenfilter in Lake Formation, indem Sie Tabellen in Ihren Amazon S3 S3-Data Lakes sichern, indem Sie Berechtigungen auf Spalten-, Zeilen- und Zellenebene gewähren. Informationen zu den Einschränkungen bei der Partitionsprojektion finden Sie im Amazon Athena Athena-Benutzerhandbuch.

  • Erzwingen Sie bei der Ausführung von Verbundabfragen eine differenzierte Zugriffskontrolle für die Daten, die dem SAML ansässigen Athena-Benutzer zur Verfügung stehen.

    Athena JDBC und die ODBC Treiber unterstützen die Konfiguration des Verbundzugriffs auf Ihre Datenquelle mithilfe eines SAML basierten Identity Providers (IdP). Verwenden Sie Amazon, das in Lake Formation QuickSight integriert ist, mit Ihrer vorhandenen IAM Rolle oder Ihren SAML Benutzern oder Gruppen, um die Athena-Abfrageergebnisse zu visualisieren.

    Anmerkung

    Lake Formation Formation-Berechtigungen für SAML Benutzer und Gruppen gelten nur, wenn Sie mithilfe des JDBC ODBC Oder-Treibers Anfragen an Athena senden.

    Weitere Informationen finden Sie unter Verwenden von Lake Formation und Athena JDBC und ODBC Treibern für den föderierten Zugriff auf Athena.

    Anmerkung

    Derzeit wird die Autorisierung des Zugriffs auf SAML Identitäten in Lake Formation in den folgenden Regionen nicht unterstützt:

    • Naher Osten (Bahrain) – me-south-1

    • Asien-Pazifik (Hongkong) – ap-east-1

    • Afrika (Kapstadt) – af-south-1

    • China (Ningxia) – cn-northwest-1

    • Asien-Pazifik (Osaka) – ap-northeast-3

  • Wird verwendetKontoübergreifender Datenaustausch in Lake Formation, um Tabellen in einem anderen Konto abzufragen.

Anmerkung

Weitere Informationen zu Einschränkungen bei der Verwendung von Lake Formation Formation-Berechtigungen für finden Sie unter Überlegungen und Einschränkungen. Views

Support für Transaktionstabellenformate

Durch die Anwendung Lake Formation Formation-Berechtigungen können Sie Ihre Transaktionsdaten in Ihren Amazon S3 S3-basierten Data Lakes sichern. In der folgenden Tabelle sind Transaktionstabellenformate aufgeführt, die in den Berechtigungen Athena und Lake Formation unterstützt werden. Lake Formation erzwingt diese Berechtigungen, wenn Athena-Benutzer ihre Abfragen ausführen.

Tabellenformat Beschreibung und zulässige Operationen In Athena werden Lake Formation Formation-Berechtigungen unterstützt

Apache Hudi

Ein Format, das zur Vereinfachung der inkrementellen Datenverarbeitung und der Entwicklung von Datenleitungen verwendet wird.

Athena unterstützt Erstellungs- und Lesevorgänge mit Apache Hudi-Tabellenformaten auf Amazon S3 S3-Datensätzen für die Hudi-Tabellentypen Copy on Write (CoW) und Merge On Read (MoR). Athena unterstützt keine Schreiboperationen auf Hudi-Tabellen.

Verwenden Sie Athena, um Hudi-Datensätze abzufragen.

Wird verwendetDatenfilterung und Sicherheit auf Zellebene in Lake Formation, um Hudi-Tabellen mithilfe von Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene zu sichern.

Apache Iceberg

Ein offenes Tabellenformat, das große Sammlungen von Dateien als Tabellen verwaltet und moderne analytische Data Lake-Operationen wie Einfügen, Aktualisieren, Löschen und Zeitreiseabfragen auf Datensatzebene unterstützt.

Weitere Informationen zur Unterstützung von Iceberg-Tabellen durch Athena finden Sie unter Iceberg-Tabellen verwenden.

Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene werden unterstützt. Derzeit unterstützt Lake Formation die Verwaltung von Berechtigungen für Schreiboperationen wie VACUUMMERGE, UPDATE und OPTIMIZE für Tabellen in Open Table Formats nicht.

Linux Foundation Delta Lake

Delta Lake ist ein Open-Source-Projekt, das bei der Implementierung moderner Data-Lake-Architekturen hilft, die üblicherweise auf Amazon S3 oder Hadoop Distributed File System () basieren. HDFS

Athena unterstützt Delta-Lake-Tabellen, die mithilfe einer Symlink-basierten Manifest-Tabellendefinition AWS Glue Data Catalog aus einer Delta Lake-Tabelle erstellt wurden.

Weitere Informationen finden Sie unter Delta Lake-Tabellen mithilfe von Crawlern crawlen. AWS Glue

Athena (Engine-Version 3) unterstützt das Lesen nativer Delta Lake-Tabellen.

Weitere Informationen finden Sie unter Einführung der systemeigenen Unterstützung für Delta Lake-Tabellen mit AWS Glue Crawlern.

Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene werden für Symlink-Tabellen und native Delta Lake-Tabellen unterstützt.

Weitere Ressourcen