Há várias opções oferecidas pela AWS para configurar um destino para uma integração ETL zero. O destino pode ser um data warehouse criptografado do Amazon Redshift ou um catálogo do Amazon SageMaker Lakehouse.
Antes de selecionar o destino para a integração ETL zero, você precisa configurar um dos seguintes recursos de destino.
As opções de configuração para um destino em uma integração ETL zero incluem:
Um catálogo e banco de dados do Amazon SageMaker Lakehouse configurados com armazenamento do Amazon S3. Consulte Configurar um banco de dados do AWS Glue.
Um catálogo do Amazon SageMaker Lakehouse configurado com armazenamento gerenciado do Amazon Redshift. Consulte Configurar a integração com seu destino.
Um data warehouse do Amazon Redshift identificado por um namespace do Redshift. Consulte Configurar a integração com seu destino.
nota
Não é possível modificar o destino de uma integração ETL zero após a criação.
Configurar a integração com seu destino
Depois de selecionar sua conexão e especificar um perfil do IAM de origem, siga estas etapas ao especificar um data warehouse do Amazon Redshift:
Especifique o namespace do cluster do Redshift ou do grupo de trabalho do Redshift sem servidor ou Crie um novo namespace.
Selecione a opção Corrigir para mim do AWS Glue. Para o destino do Redshift, isso irá:
Aplicar uma entidade principal autorizada no cluster ou grupo de trabalho sem servidor do Redshift.
Aplicar um ARN de origem autorizado do Glue ao cluster do Redshift ou ao grupo de trabalho com tecnologia sem servidor.
Associar um novo grupo de parâmetros a
enable_case_sensitive_identifier = true
.
Forneça o nome da integração e escolha Criar e iniciar integração.
Quando sua integração estiver ativa, navegue até a página de detalhes da integração e escolha Criar um banco de dados com base na integração.
Finalmente, você pode navegar até o editor de consultas do Redshift e conectar ao seu banco de dados para validar o snapshot e os dados incrementais.
nota
Você só pode usar caracteres alfanuméricos minúsculos e sublinhados no nome do namespace ou do catálogo. Isso é diferente do que o Catálogo de Dados do AWS Glue permite para criar um banco de dados com qualquer nome (incluindo caracteres especiais).
Siga estas etapas ao especificar um catálogo e um banco de dados do Amazon SageMaker Lakehouse configurados com um destino de armazenamento do Amazon S3:
Registre uma integração do Redshift no catálogo no Lake Formation. Consulte Registrar clusters e namespaces do Amazon Redshift no Catálogo de Dados do AWS Glue.
Crie um catálogo federado ou gerenciado no AWS Lake Formation. Para obter mais informações, consulte: