Carregar arquivos no Amazon S3 para usar com COPY - Amazon Redshift

Carregar arquivos no Amazon S3 para usar com COPY

Há algumas abordagens a serem adotadas ao carregar arquivos de texto para o Amazon S3:

  • Se você tiver arquivos compactados, recomendamos dividir arquivos grandes para aproveitar a vantagem do processamento paralelo no Amazon Redshift.

  • No entanto, o COPY divide automaticamente dados de arquivos grandes, descompactados e delimitados por texto para facilitar o paralelismo e distribuir efetivamente dados de arquivos grandes.

Crie um bucket do Amazon S3 para armazenar seus arquivos de dados e, em seguida, carregue os arquivos de dados para o bucket. Para obter informações sobre a criação de buckets e carregamento de arquivos, consulte Trabalhar com buckets do Amazon S3 no Guia do usuário do Amazon Simple Storage Service.

Importante

O bucket do Amazon S3 que contém os arquivos de dados deve ser criado na mesma região da AWS do seu cluster, a menos que você use a opção REGION para especificar a região em que o bucket do Amazon S3 está localizado.

Certifique-se de que os intervalos de IP do S3 sejam adicionados à sua lista de permissões. Para saber mais sobre os intervalos de IP do S3 necessários, consulte Isolamento de rede.

Você pode criar um bucket do Amazon S3 em uma região específica selecionando a região ao criar o bucket usando o console do Amazon S3 ou especificando um endpoint ao criar o bucket usando a API ou CLI do Amazon S3.

Após o carregamento de dados, verifique se os arquivos corretos estão presentes no Amazon S3.