Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verwendung AWS Lake Formation mit Amazon EMR
Amazon EMR ist eine flexible AWS verwaltete Cluster-Plattform, auf der Sie beliebigen benutzerdefinierten Code auf unterstützten Big-Data-Frameworks wie Hadoop Map-Reduce, Spark, Hive, Presto usw. ausführen können. Organizations nutzen Amazon auchEMR, um sowohl Batch- als auch Stream-Datenverarbeitungsanwendungen in einem stark verteilten Cluster auszuführen. Mit Apache Spark auf Amazon EMR können Sie Ihre Datentransformationen und Ihren benutzerdefinierten Code in Datenbanken und Tabellen ausführen, deren Berechtigungen von Lake Formation verwaltet werden.
Es gibt drei Optionen für die Bereitstellung von AmazonEMR:
-
EMRnein EC2
-
EMRServerlos
-
Amazon EMR auf EKS
Weitere Informationen finden Sie unter Integrieren von Amazon EMR mit Lake Formation oder Verwenden von EMR Serverless mit AWS Lake Formation für eine differenzierte Zugriffskontrolle
Support für Transaktionstabellenformate
Die EMR Amazon-Versionen 6.15.0 und höher bieten Unterstützung für die Zugriffskontrolle auf Tabellen-, Zeilen-, Spalten- und Zellenebene von Lake Formation für die Tabellenformate Apache Hudi, Apache Iceberg und Delta Lake
Einschränkungen finden Sie unter Überlegungen zu Amazon EMR with Lake Formation.
Tabellenformat | Beschreibung und zulässige Operationen | Lake Formation Formation-Berechtigungen werden in Amazon unterstützt EMR |
---|---|---|
Apache Hudi |
Ein offenes Tabellenformat, das zur Vereinfachung der inkrementellen Datenverarbeitung und der Entwicklung von Datenpipelines verwendet wird. Eine Liste der unterstützten Operationen finden Sie unter Apache Hudi und Lake Formation. |
Amazon EMR unterstützt die Zugriffskontrolle auf Tabellen-, Zeilen-, Spalten- und Zellenebene mit Apache Hudi. |
Apache Iceberg |
Ein offenes Tabellenformat, das große Sammlungen von Dateien als Tabellen verwaltet. Eine Liste der unterstützten Operationen finden Sie unter Apache Iceberg und Lake Formation. |
Amazon EMR unterstützt die Zugriffskontrolle auf Tabellen-, Zeilen-, Spalten- und Zellenebene mit Apache Iceberg. |
Linux Foundation Delta Lake |
Delta Lake ist ein Open-Source-Projekt, das bei der Implementierung moderner Data-Lake-Architekturen hilft, die üblicherweise auf Amazon S3 oder Hadoop Distributed File System () basieren. HDFS Eine Liste der unterstützten Operationen finden Sie unter Delta Lake und Lake Formation. |
Amazon EMR unterstützt die Zugriffskontrolle auf Tabellen-, Zeilen-, Spalten- und Zellenebene mit Delta Lake-Tabellen. |