Criar uma conexão Vertica - AWS Glue

Criar uma conexão Vertica

Pré-requisitos:

  • Um bucket ou uma pasta do Amazon S3 para usar como armazenamento temporário ao ler e escrever no banco de dados, referido por tempS3Path.

    nota

    Quando o Vertica é usado em pré-visualizações de dados de trabalhos do AWS Glue, os arquivos temporários podem não ser removidos automaticamente de tempS3Path. Para garantir a remoção de arquivos temporários, encerre diretamente a sessão de visualização de dados escolhendo Encerrar sessão no painel Visualização de dados.

    Se não for possível garantir que a sessão de visualização de dados seja encerrada diretamente, considere definir a configuração do ciclo de vida do Amazon S3 para remover dados antigos. Recomendamos remover dados com mais de 49 horas com base no runtime máximo do trabalho somado a uma margem. Para obter mais informações sobre a configuração do Amazon S3, consulte Gerenciar o ciclo de vida do armazenamento na documentação do Amazon S3.

  • Uma política do IAM com permissões apropriadas para seu caminho do Amazon S3 que você pode associar ao seu perfil de trabalho do AWS Glue.

  • Se a sua instância do Vertica estiver em uma Amazon VPC, configure a Amazon VPC para permitir que seu trabalho do AWS Glue se comunique com a instância do Vertica sem que o tráfego passe pela Internet pública.

    Na Amazon VPC, identifique ou crie uma VPC, uma Sub-rede e um Grupo de segurança que o AWS Glue usará durante a execução do trabalho. Além disso, você precisa garantir que a Amazon VPC esteja configurada para permitir o tráfego de rede entre sua instância do Vertica e esse local. Seu trabalho precisará estabelecer uma conexão TCP com a porta cliente do Vertica (por padrão, 5433). Com base no layout da rede, isso pode exigir alterações em regras do grupo de segurança, ACLs de rede, gateways de NAT e conexões de emparelhamento.

Para configurar uma conexão com o Vertica:
  1. No AWS Secrets Manager, crie um segredo usando suas credenciais do Vertica, verticaUsername e verticaPassword. Para criar um segredo no Secrets Manager, siga o tutorial disponível em Criar uma AWS Secrets Manager segredo na documentação do AWS Secrets Manager. Depois de criar o segredo, guarde o nome secreto, SecretName, para a próxima etapa.

    • Ao selecionar Pares chave/valor, crie um par para a chave user com o valor verticaUsername.

    • Ao selecionar Pares chave/valor, crie um par para a chave password com o valor verticaPassword.

  2. No console do AWS Glue, crie uma conexão seguindo as etapas em Adicionar uma conexão do AWS Glue. Depois de criar a conexão, guarde o nome da conexão, connectionName, para a próxima etapa.

    • Ao selecionar um Tipo de conexão, selecione Vertica.

    • Ao selecionar Host do Vertica, forneça o URL da sua instalação do Vertica.

    • Ao selecionar Porta do Vertica, a porta pela qual sua instalação do Vertica está disponível.

    • Ao selecionar um Segredo da AWS, forneça o secretName.

  3. Nas seguintes situações, configurações adicionais podem ser necessárias:

    • Para instâncias do Teradata hospedadas na AWS em uma Amazon VPC

      • Forneça informações de conexão da Amazon VPC à conexão do AWS Glue que define suas credenciais de segurança do Vertica. Ao criar ou atualizar sua conexão, defina VPC, Sub-rede e Grupos de segurança em Opções de rede.

Será necessário realizar as seguintes etapas antes de executar seu trabalho do AWS Glue:

  • Conceda ao perfil do IAM associado ao seu trabalho do AWS Glue permissão para tempS3Path.

  • Conceda ao perfil do IAM associada ao seu trabalho do AWS Glue permissão para ler secretName.