Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
AWS Lake Formation verwendet die AWS Glue Data Catalog , um Metadaten für die Amazon S3 S3-Daten in Form von Datenbanken und Tabellen zu speichern. In Tabellen werden Informationen über die zugrunde liegenden Daten gespeichert, einschließlich Schemainformationen, Partitionsinformationen und Datenspeicherort. Datenbanken sind Sammlungen von Tabellen. Der Datenkatalog enthält auch Ressourcenlinks, d. h. Links zu gemeinsam genutzten Datenbanken und Tabellen in externen Konten, die für den kontenübergreifenden Zugriff auf Daten im Data Lake verwendet werden. Jedes AWS Konto hat einen Datenkatalog pro AWS Region.
Lake Formation bietet ein Rechtemodell für relationale Datenbankverwaltungssysteme (RDBMS), mit dem Sie Zugriff auf Datenbanken, Tabellen und Spalten im Datenkatalog mit zugrunde liegenden Daten in Amazon S3 gewähren oder entziehen können.
Bevor Sie sich mit den Einzelheiten des Lake Formation Formation-Genehmigungsmodells vertraut machen, sollten Sie sich die folgenden Hintergrundinformationen ansehen:
-
Von Lake Formation verwaltete Data Lakes befinden sich an bestimmten Orten in Amazon Simple Storage Service (Amazon S3).
-
Lake Formation unterhält einen Datenkatalog, der Metadaten zu Quelldaten enthält, die in Ihre Data Lakes importiert werden sollen, wie Daten in Protokollen und relationalen Datenbanken, und zu Daten in Ihren Data Lakes in Amazon S3. Die Metadaten sind in Datenbanken und Tabellen organisiert. Metadatentabellen enthalten Schema, Speicherort, Partitionierung und andere Informationen zu den Daten, die sie repräsentieren. Metadatendatenbanken sind Sammlungen von Tabellen.
-
Der Lake Formation Data Catalog ist derselbe Datenkatalog, der von verwendet wirdAWS Glue. Sie können AWS Glue Crawler verwenden, um Datenkatalogtabellen zu erstellen, und Sie können Aufträge zum AWS Glue Extrahieren, Transformieren und Laden (ETL) verwenden, um die zugrunde liegenden Daten in Ihren Data Lakes aufzufüllen.
-
Die Datenbanken und Tabellen im Datenkatalog werden als Datenkatalogressourcen bezeichnet. Tabellen im Datenkatalog werden als Metadatentabellen bezeichnet, um sie von Tabellen in Datenquellen oder tabellarischen Daten in Amazon S3 zu unterscheiden. Die Daten, auf die die Metadatentabellen in Amazon S3 oder in Datenquellen verweisen, werden als Basisdaten bezeichnet.
-
Ein Principal ist ein Benutzer oder eine Rolle, ein QuickSight Amazon-Benutzer oder eine Amazon-Gruppe, ein Benutzer oder eine Gruppe, die sich über einen SAML-Anbieter bei Lake Formation authentifiziert, oder für die kontoübergreifende Zugriffskontrolle eine AWS Konto-ID, Organisations-ID oder Organisationseinheit-ID.
-
AWS GlueCrawler erstellen Metadatentabellen, aber Sie können Metadatentabellen auch manuell mit der Lake Formation Formation-Konsole, der API oder der AWS Command Line Interface (AWS CLI) erstellen. Wenn Sie eine Metadatentabelle erstellen, müssen Sie einen Speicherort angeben. Wenn Sie eine Datenbank erstellen, ist der Speicherort optional. Tabellenspeicherorte können Amazon S3 S3-Standorte oder Datenquellenstandorte wie eine Amazon Relational Database Service (Amazon RDS) -Datenbank sein. Datenbankstandorte sind immer Amazon S3 S3-Standorte.
-
Dienste, die in Lake Formation integriert sind, wie Amazon Athena und Amazon Redshift, können auf den Datenkatalog zugreifen, um Metadaten abzurufen und die Autorisierung für laufende Abfragen zu überprüfen. Eine vollständige Liste der integrierten Dienste finden Sie unter. AWS Serviceintegrationen mit Lake Formation
Themen
- Überblick über die Genehmigungen für Lake Formation
- Referenz zu Personas und IAM Genehmigungen von Lake Formation
- Ändern der Standardeinstellungen für Ihren Data Lake
- Implizite Lake Formation Formation-Berechtigungen
- Referenz zu den Genehmigungen von Lake Formation
- Integration von IAM Identity Center
- Hinzufügen eines Amazon S3 S3-Standorts zu Ihrem Data Lake
- Hybrider Zugriffsmodus
- Datenkatalogtabellen und Datenbanken erstellen
- Daten mithilfe von Workflows in Lake Formation importieren