Opções de tratamento de dados - Amazon Redshift

Opções de tratamento de dados

Este tópico descreve como configurar o Redshift Spectrum para tratar dados em formatos inesperados.

Você pode definir parâmetros de tabela ao criar tabelas externas para personalizar dados sendo consultados em tabelas externas. Do contrário, podem ocorrer erros de verificação. Para obter mais informações, consulte TABLE PROPERTIES (Propriedades de tabela) em CREATE EXTERNAL TABLE. Para ver exemplos, consulte Exemplos de tratamento de dados. Para obter uma lista de erros, consulte SVL_SPECTRUM_SCAN_ERROR.

Você pode definir as seguintes PROPRIEDADES DE TABELA ao criar tabelas externas para especificar o tratamento de entrada para dados que estão sendo consultados em tabelas externas.

  • column_count_mismatch_handling, para identificar se o arquivo contém um número menor ou maior de valores para uma linha do que o de colunas especificado na definição da tabela externa.

  • invalid_char_handling para especificar o tratamento de entrada para caracteres inválidos em colunas contendo VARCHAR, CHAR e dados de string. Quando você especifica REPLACE para invalid_char_handling, pode especificar o caractere de substituição a ser usado.

  • numeric_overflow_handling para especificar o tratamento de transbordamento de conversão em colunas contendo dados inteiros e decimais.

  • surplus_bytes_handling para especificar o tratamento de entradas para bytes excedentes em colunas que contêm dados VARBYTE.

  • surplus_char_handling para especificar o tratamento de entrada para caracteres excedentes em colunas contendo VARCHAR, CHAR e dados de string.

Você pode definir uma opção de configuração para cancelar consultas que excedam um número máximo de erros. Para obter mais informações, consulte spectrum_query_maxerror.