Impedire a un crawler di modificare uno schema esistente - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Impedire a un crawler di modificare uno schema esistente

Se non vuoi che un crawler sovrascriva gli aggiornamenti apportati a campi esistenti in una definizione di tabella Amazon S3, scegli l'opzione Add new columns only (Aggiungi solo nuove colonne) nella console oppure imposta l'opzione di configurazione MergeNewColumns. Questa opzione si applica a tabelle e partizioni, a meno che il campo Partitions.AddOrUpdateBehavior non venga sostituito da InheritFromTable.

Se non vuoi che uno schema di tabella venga modificato in alcun modo durante l'esecuzione di un crawler, imposta la policy di modifica dello schema su LOG. Puoi anche specificare un'opzione di configurazione che imposta gli schemi delle partizioni in modo da ereditare dalla tabella.

Se stai configurando il crawler nella console, puoi scegliere tra le operazioni seguenti:

  • Ignora la modifica e non aggiornare la tabella nel catalogo dati

  • Update all new and existing partitions with metadata from the table (Aggiorna tutte le partizioni nuove ed esistenti con metadati della tabella)

Quando configurate il crawler utilizzando ilAPI, impostate i seguenti parametri:

  • Imposta il campo UpdateBehavior nella struttura SchemaChangePolicy su LOG.

  • Imposta il Configuration campo con una rappresentazione in formato stringa del seguente JSON oggetto nel crawlerAPI, ad esempio:

    { "Version": 1.0, "CrawlerOutput": { "Partitions": { "AddOrUpdateBehavior": "InheritFromTable" } } }