Empêcher un robot d'exploration de modifier un schéma existant - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Empêcher un robot d'exploration de modifier un schéma existant

Si vous ne voulez pas qu'un crawler remplace les mises à jour que vous avez apportées aux champs existants d'une définition de table Amazon S3, sélectionnez l'option sur la console Add new columns only (Ajouter uniquement de nouvelles colonnes) ou définissez l'option de configuration MergeNewColumns. Cela s'applique aux tables et aux partitions, sauf si Partitions.AddOrUpdateBehavior est remplacé par InheritFromTable.

Si vous ne voulez pas qu'un schéma de table soit modifié lorsqu'un crawler s'exécute, définissez la politique de modification du schéma sur LOG. Vous pouvez également définir une option de configuration qui définit les schémas de partition pour qu'ils héritent de la table.

Si vous configurez l'crawler sur la console, vous pouvez choisir les actions suivantes :

  • Ignorer les modifications et ne pas mettre la table à jour dans Data Catalog

  • Mettre à jour toutes les partitions nouvelles ou existantes à partir des métadonnées de la table

Lorsque vous configurez le robot d'exploration à l'aide duAPI, définissez les paramètres suivants :

  • Définissez le champ UpdateBehavior de la structure SchemaChangePolicy sur LOG.

  • Définissez le Configuration champ avec une représentation sous forme de chaîne de l'JSONobjet suivant dans le robot d'exploration API ; par exemple :

    { "Version": 1.0, "CrawlerOutput": { "Partitions": { "AddOrUpdateBehavior": "InheritFromTable" } } }