Verhindern, dass ein Crawler ein vorhandenes Schema ändert - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verhindern, dass ein Crawler ein vorhandenes Schema ändert

Wenn Sie nicht möchten, dass ein Crawler Aktualisierungen an vorhandenen Feldern in einer Amazon-S3-Tabellendefinition überschreibt, die Sie vorgenommen haben, wählen Sie in der Konsole die Option Add new columns only (Nur neue Spalten hinzufügen) oder legen Sie die Konfigurationsoption MergeNewColumns fest. Dies gilt für Tabellen und Partitionen, es sei denn Partitions.AddOrUpdateBehavior wurde in InheritFromTable geändert (überschrieben).

Wenn Sie nicht möchten, dass ein Tabellenschema geändert wird, wenn ein Crawler ausgeführt wird, legen Sie die Schemaänderungsrichtlinie auf LOG fest. Sie können auch eine Konfigurationsoption festlegen, die dafür sorgt, dass Partitionsschemas von der Tabelle erben.

Wenn Sie die Konfiguration des Crawlers über die Konsole vornehmen, können Sie folgenden Aktionen auswählen:

  • Änderung ignorieren und Tabelle im Data Catalog nicht aktualisieren

  • Update all new and existing partitions with metadata from the table (Aktualisieren aller neuen und vorhandenen Partitionen mit Metadaten aus der Tabelle)

Wenn Sie den Crawler mit dem konfigurierenAPI, legen Sie die folgenden Parameter fest:

  • Legen Sie das UpdateBehavior-Feld in der SchemaChangePolicy-Struktur auf LOG fest.

  • Stellen Sie das Configuration Feld mit einer Zeichenkette ein, die das folgende JSON Objekt im Crawler darstelltAPI; zum Beispiel:

    { "Version": 1.0, "CrawlerOutput": { "Partitions": { "AddOrUpdateBehavior": "InheritFromTable" } } }