Adicionar uma coluna de identificadores - AWS Glue

Adicionar uma coluna de identificadores

Atribua um identificador numérico a cada linha no conjunto de dados.

Para adicionar um nó de transformação identificador ao diagrama do trabalho
  1. Abra o painel Recurso e escolha Identificador para adicionar uma nova transformação ao diagrama do trabalho. O nó selecionado no momento da adição do nó será o nó superior.

  2. (Opcional) Na guia Propriedades do nó, insira um nome para o nó no diagrama do trabalho. Se ainda não houver um nó pai selecionado, escolha um na lista Node parents (Nós pais) para usar como fonte de entrada para a transformação.

  3. (Opcional) Na guia Transformação, você pode personalizar o nome da nova coluna. Por padrão, ela será denominada "id".

  4. (Opcional) Se o trabalho processar e armazenar dados de forma incremental, será importante evitar que os mesmos IDs sejam reutilizados em diversas execuções do trabalho.

    Na guia Transformação, marque a opção exclusivo da caixa de seleção. Essa opção incluirá o timestamp do trabalho no identificador, tornando-o exclusivo entre as diversas execuções. Para permitir um número maior, a coluna em vez do tipo longo será um decimal.