Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Voraussetzungen für die Verbindung des Datenkatalogs mit dem Hive-Metastore
Um eine Verbindung mit einem externen Apache Hive-Metastore herzustellen und Datenzugriffsberechtigungen einzurichten, müssen Sie die folgenden Anforderungen erfüllen: AWS Glue Data Catalog
Anmerkung
Wir empfehlen, dass ein Lake Formation-Administrator die AWS SAM Anwendung bereitstellt und nur ein privilegierter Benutzer die Hive-Metastore-Verbindung verwendet, um die entsprechenden Verbunddatenbanken zu erstellen.
Rollen erstellen. IAM
Um die AWS SAM Anwendung bereitzustellen
Erstellen Sie eine Rolle, die über die erforderlichen Berechtigungen für die Bereitstellung von Ressourcen (Lambda-Funktion Amazon API Gateway, IAM Rolle und AWS Glue Verbindung) verfügt, die zum Herstellen einer Verbindung zum Hive-Metastore erforderlich sind.
Um föderierte Datenbanken zu erstellen
Die folgenden Berechtigungen sind für Ressourcen erforderlich:
-
glue:CreateDatabase on resource arn:aws:glue:region:account-id:database/gluedatabasename
-
glue:PassConnection on resource arn:aws:glue:region:account-id:connection/hms_connection
-
Registrieren Sie den Amazon S3 S3-Standort bei Lake Formation.
Um Lake Formation zur Verwaltung und Sicherung der Daten in Ihrem Data Lake zu verwenden, müssen Sie den Amazon S3 S3-Standort, der die Daten für Tabellen im Hive-Metastore enthält, bei Lake Formation registrieren. Auf diese Weise kann Lake Formation Anmeldeinformationen an AWS Analysedienste wie Athena, Redshift Spectrum und Amazon weitergeben. EMR
Weitere Informationen zur Registrierung eines Amazon S3 S3-Standorts finden Sie unterHinzufügen eines Amazon S3 S3-Standorts zu Ihrem Data Lake.
Wenn Sie den Amazon S3 S3-Standort registrieren, aktivieren Sie das Kontrollkästchen Enable Data Catalog Federation, damit Lake Formation eine Rolle für den Zugriff auf Tabellen in einer Verbunddatenbank übernehmen kann.
Weitere Informationen zur Registrierung eines Datenstandorts bei Lake Formation finden Sie unterKonfigurieren Sie einen Amazon S3 S3-Standort für Ihren Data Lake.
-
Verwenden Sie die richtige EMR Amazon-Version.
Um Amazon EMR mit den verbundenen Hive-Metastore-Datenbanken verwenden zu können, benötigen Sie Hive Version 3.x oder höher und Amazon EMR Version 6.x oder höher.