Integrieren Sie Amazon EMR mit AWS Lake Formation - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Integrieren Sie Amazon EMR mit AWS Lake Formation

AWS Lake Formation ist ein verwalteter Service, der Sie dabei unterstützt, Daten in einem Amazon Simple Storage Service (S3) Data Lake zu entdecken, zu katalogisieren, zu bereinigen und zu sichern. Lake Formation bietet einen detaillierten Zugriff auf Spaltenebene auf Datenbanken und Tabellen im Glue-Datenkatalog. AWS Weitere Informationen finden Sie unter Was ist AWS Lake Formation?

Mit EMR Amazon-Version 6.7.0 und höher können Sie die auf Lake Formation basierende Zugriffskontrolle auf Spark-, Hive- und Presto-Jobs anwenden, die Sie an Amazon-Cluster senden. EMR Für die Integration mit Lake Formation müssen Sie einen EMR Cluster mit einer Runtime-Rolle erstellen. Eine Runtime-Rolle ist eine AWS Identity and Access Management (IAM) -Rolle, die Sie EMR Amazon-Jobs oder -Abfragen zuordnen. Amazon verwendet diese Rolle EMR dann für den Zugriff auf AWS Ressourcen. Weitere Informationen finden Sie unter EMRSchritte zu Runtime-Rollen für Amazon.

Wie Amazon mit Lake Formation EMR zusammenarbeitet

Nachdem Sie Amazon EMR in Lake Formation integriert haben, können Sie Abfragen an EMR Amazon-Cluster mit StepAPIoder mit SageMaker Studio ausführen. Anschließend bietet Lake Formation Zugriff auf Daten über temporäre Anmeldeinformationen für AmazonEMR. Dieser Prozess wird als Anmeldeinformationsvergabe bezeichnet. Weitere Informationen finden Sie unter Was ist AWS Lake Formation?

Im Folgenden finden Sie einen allgemeinen Überblick darüber, wie Amazon Zugriff auf Daten EMR erhält, die durch die Sicherheitsrichtlinien von Lake Formation geschützt sind.

Wie Amazon EMR auf Daten zugreift, die durch die Sicherheitsrichtlinien von Lake Formation geschützt sind
  1. Ein Benutzer sendet eine EMR Amazon-Anfrage für Daten in Lake Formation.

  2. Amazon EMR fordert temporäre Anmeldeinformationen von Lake Formation an, um den Benutzerdaten Zugriff zu gewähren.

  3. Lake Formation gibt temporäre Anmeldeinformationen zurück.

  4. Amazon EMR sendet die Abfrageanforderung zum Abrufen von Daten aus Amazon S3.

  5. Amazon EMR empfängt die Daten von Amazon S3, filtert sie und gibt Ergebnisse zurück, die auf den Benutzerberechtigungen basieren, die der Benutzer in Lake Formation definiert hat.

Weitere Informationen zum Hinzufügen von Benutzern und Gruppen zu Lake Formation-Richtlinien finden Sie unter Erteilen von Datenkatalogberechtigungen.

Voraussetzungen

Sie müssen die folgenden Anforderungen erfüllen, bevor Sie Amazon EMR und Lake Formation integrieren können:

  • Aktivieren Sie die Autorisierung von Runtime-Rollen in Ihrem EMR Amazon-Cluster.

  • Verwenden Sie den AWS Glue-Datenkatalog als Ihren Metadatenspeicher.

  • Definieren und verwalten Sie in Lake Formation Berechtigungen für den Zugriff auf Datenbanken, Tabellen und Spalten im AWS Glue Data Catalog. Weitere Informationen finden Sie unter Was ist AWS Lake Formation?