Verwendung AWS Lake Formation mit Amazon Athena - AWS Lake Formation

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwendung AWS Lake Formation mit Amazon Athena

Amazon Athena ist ein serverloser Abfrageservice, der Sie bei der Analyse strukturierter, halbstrukturierter und unstrukturierter Daten unterstützt, die in Amazon S3 gespeichert sind. Sie können Athena SQL verwenden, um Daten aus den Datenformaten CSV, JSON, Parquet und Avro abzufragen. Athena SQL unterstützt auch Tabellenformate wie Apache Hive, ApacheHudi und Apache Iceberg. Athena lässt sich in die integrieren AWS Glue Data Catalog , um Metadaten Ihrer Datensätze in Amazon S3 zu speichern. Athena kann Lake Formation verwenden, um Zugriffskontrollrichtlinien für diese Datensätze zu definieren und zu verwalten.

Hier sind einige häufige Anwendungsfälle, in denen Sie Lake Formation mit Athena verwenden können.

  • Verwenden Sie Lake Formation Formation-Berechtigungen für den Zugriff auf die Datenkatalogressourcen (Datenbank und Tabellen) von Athena. Sie können entweder die Methode der benannten Ressource oder LF-Tags verwenden, um Berechtigungen für Datenbanken und Tabellen zu definieren. Weitere Informationen finden Sie unter:

    Anmerkung

    Lake Formation Formation-Berechtigungen gelten nur, wenn Athena SQL verwendet wird, um Quelldaten aus Amazon S3 und Metadaten im Datenkatalog abzufragen.

    Athena Spark unterstützt keine Abfragen von Datenkatalogtabellen mit Lake Formation Formation-Berechtigungen. Lake Formation Formation-Berechtigungen unterstützen sowohl Lese- als auch Schreiboperationen für Datenbanken und Tabellen.

    Anmerkung

    Sie können keine Datenfilter anwenden, wenn Sie LF-Tags verwenden, um Berechtigungen für Datenkatalogressourcen zu verwalten.

  • Steuern Sie die AbfrageergebnisseDatenfilter in Lake Formation, indem Sie Tabellen in Ihren Amazon S3 S3-Data Lakes sichern, indem Sie Berechtigungen auf Spalten-, Zeilen- und Zellenebene gewähren. Informationen zu den Einschränkungen bei der Partitionsprojektion finden Sie im Amazon Athena Athena-Benutzerhandbuch.

  • Erzwingen Sie bei der Ausführung von Verbundabfragen eine differenzierte Zugriffskontrolle für die Daten, die dem SAML-basierten Athena-Benutzer zur Verfügung stehen.

    Die JDBC- und ODBC-Treiber von Athena unterstützen die Konfiguration des Verbundzugriffs auf Ihre Datenquelle mithilfe eines SAML-basierten Identity Providers (IdP). Verwenden Sie Amazon, das in Lake Formation QuickSight integriert ist, mit Ihren vorhandenen IAM-Rollen- oder SAML-Benutzern oder -Gruppen, um Athena-Abfrageergebnisse zu visualisieren.

    Anmerkung

    Lake Formation Formation-Berechtigungen für SAML-Benutzer und -Gruppen gelten nur, wenn Sie mithilfe des JDBC- oder ODBC-Treibers Anfragen an Athena senden.

    Weitere Informationen finden Sie unter Verwenden von Lake Formation und den Athena JDBC- und ODBC-Treibern für den Verbundzugriff auf Athena.

    Anmerkung

    Derzeit wird die Autorisierung des Zugriffs auf SAML-Identitäten in Lake Formation in den folgenden Regionen nicht unterstützt:

    • Naher Osten (Bahrain) – me-south-1

    • Asien-Pazifik (Hongkong) – ap-east-1

    • Afrika (Kapstadt) – af-south-1

    • China (Ningxia) – cn-northwest-1

    • Asien-Pazifik (Osaka) – ap-northeast-3

  • Wird verwendetKontoübergreifender Datenaustausch in Lake Formation, um Tabellen in einem anderen Konto abzufragen.

Anmerkung

Weitere Informationen zu Einschränkungen bei der Verwendung von Lake Formation Formation-Berechtigungen für finden Sie unter Überlegungen und Einschränkungen. Views

Support für Transaktionstabellenformate

Durch die Anwendung Lake Formation Formation-Berechtigungen können Sie Ihre Transaktionsdaten in Ihren Amazon S3 S3-basierten Data Lakes sichern. In der folgenden Tabelle sind Transaktionstabellenformate aufgeführt, die in den Berechtigungen Athena und Lake Formation unterstützt werden. Lake Formation erzwingt diese Berechtigungen, wenn Athena-Benutzer ihre Abfragen ausführen.

Tabellenformat Beschreibung und zulässige Operationen In Athena werden Lake Formation Formation-Berechtigungen unterstützt

Apache Hudi

Ein Format, das zur Vereinfachung der inkrementellen Datenverarbeitung und der Entwicklung von Datenleitungen verwendet wird.

Athena unterstützt Erstellungs- und Lesevorgänge mit Apache Hudi-Tabellenformaten auf Amazon S3 S3-Datensätzen für die Hudi-Tabellentypen Copy on Write (CoW) und Merge On Read (MoR). Athena unterstützt keine Schreiboperationen auf Hudi-Tabellen.

Verwenden Sie Athena, um Hudi-Datensätze abzufragen.

Wird verwendetDatenfilterung und Sicherheit auf Zellebene in Lake Formation, um Hudi-Tabellen mithilfe von Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene zu sichern.

Apache Iceberg

Ein offenes Tabellenformat, das große Sammlungen von Dateien als Tabellen verwaltet und moderne analytische Data Lake-Operationen wie Einfügen, Aktualisieren, Löschen und Zeitreiseabfragen auf Datensatzebene unterstützt.

Weitere Informationen zur Unterstützung von Iceberg-Tabellen durch Athena finden Sie unter Iceberg-Tabellen verwenden.

Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene werden unterstützt. Derzeit unterstützt Lake Formation die Verwaltung von Berechtigungen für Schreiboperationen wie VACUUMMERGE, UPDATE und OPTIMIZE für Tabellen in Open Table Formats nicht.

Linux Foundation Delta Lake

Delta Lake ist ein Open-Source-Projekt, das bei der Implementierung moderner Data-Lake-Architekturen hilft, die üblicherweise auf Amazon S3 oder Hadoop Distributed File System (HDFS) basieren.

Athena unterstützt Delta-Lake-Tabellen, die mithilfe einer Symlink-basierten Manifest-Tabellendefinition AWS Glue Data Catalog aus einer Delta Lake-Tabelle erstellt wurden.

Weitere Informationen finden Sie unter Delta Lake-Tabellen mithilfe von Crawlern crawlen. AWS Glue

Athena (Engine-Version 3) unterstützt das Lesen nativer Delta Lake-Tabellen.

Weitere Informationen finden Sie unter Einführung der systemeigenen Unterstützung für Delta Lake-Tabellen mit AWS Glue Crawlern.

Berechtigungen auf Tabellen-, Spalten-, Zeilen- und Zellenebene werden für Symlink-Tabellen und native Delta Lake-Tabellen unterstützt.

Weitere Ressourcen