Impedindo que um rastreador altere um esquema existente - AWS Glue

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Impedindo que um rastreador altere um esquema existente

Se não quiser que um crawler substitua as atualizações feitas em campos existentes em uma definição de tabela do Amazon S3, escolha a opção no console Add new columns only (Adicionar somente novas colunas) ou defina a opção de configuração MergeNewColumns. Isso se aplica a tabelas e partições, a menos que Partitions.AddOrUpdateBehavior seja substituído por InheritFromTable.

Se você não quiser que um esquema de tabela seja alterado quando um crawler for executado, defina a política de alteração de esquema como LOG. Você também pode definir uma opção de configuração que defina esquemas de partição para herdar da tabela.

Se você estiver configurando o crawler no console, poderá escolher as seguintes ações:

  • Ignorar a alteração e não atualizar a tabela no Data Catalog

  • Update all new and existing partitions with metadata from the table (Atualizar todas as partições novas e existentes com metadados da tabela)

Ao configurar o rastreador usando oAPI, defina os seguintes parâmetros:

  • Defina o campo UpdateBehavior na estrutura SchemaChangePolicy para LOG.

  • Defina o Configuration campo com uma representação em sequência do seguinte JSON objeto no rastreadorAPI; por exemplo:

    { "Version": 1.0, "CrawlerOutput": { "Partitions": { "AddOrUpdateBehavior": "InheritFromTable" } } }