As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Componentes do AWS DMS
Esta seção descreve os componentes internos AWS DMS e como eles funcionam juntos para realizar sua migração de dados. Entender os componentes estruturais do AWS DMS pode ajudar você a migrar dados de forma mais eficaz e fornecer uma melhor compreensão ao solucionar ou investigar problemas.
Uma AWS DMS migração consiste em cinco componentes: descoberta de bancos de dados a serem migrados, conversão automática de esquemas, instância de replicação, endpoints de origem e destino e tarefa de replicação. Você cria uma AWS DMS migração criando a instância de replicação, os endpoints e as tarefas necessárias em um. Região da AWS
- Descoberta de banco de dados
-
O DMS Fleet Advisor coleta dados de vários ambientes de banco de dados para fornecer insight da infraestrutura de dados. O DMS Fleet Advisor coleta dados do banco de dados on-premises e de servidores analíticos de um ou mais locais centrais sem a necessidade de instalá-los em todos os computadores. Atualmente, o DMS Fleet Advisor é compatível com o Microsoft SQL Server, o MySQL, o Oracle e os servidores de banco de dados PostgreSQL.
Com base nos dados descobertos na rede, o DMS Fleet Advisor cria um inventário que é possível analisar para determinar quais servidores e objetos do banco de dados devem ser monitorados. À medida que os detalhes sobre esses servidores, bancos de dados e esquemas são coletados, é possível analisar a viabilidade das migrações de banco de dados pretendidas.
- Migração de código e schema
-
A conversão do esquema DMS AWS DMS torna as migrações de banco de dados entre diferentes tipos de bancos de dados mais previsíveis. É possível utilizar a DMS Schema Conversion para avaliar a complexidade da migração para o provedor de dados de origem e usá-la para converter esquemas de banco de dados e objetos de código. É possível aplicar o código convertido ao banco de dados de destino.
Em alto nível, a DMS Schema Conversion opera com os três componentes a seguir: perfis de instância, provedores de dados e projetos de migração. Um perfil de instância especifica as configurações da rede e da segurança. Um provedor de dados armazena as credenciais de conexão do banco de dados. Um projeto de migração contém provedores de dados, um perfil de instância e regras de migração. AWS DMS usa provedores de dados e um perfil de instância para criar um processo que converte esquemas de banco de dados e objetos de código.
- Instância da replicação
-
Em um alto nível, uma instância de AWS DMS replicação é simplesmente uma instância gerenciada do Amazon Elastic Compute Cloud EC2 (Amazon) que hospeda uma ou mais tarefas de replicação.
A figura a seguir mostra um exemplo de instância de replicação que executa várias tarefas de replicação associadas.
Uma única instância de replicação pode hospedar uma ou mais tarefas de replicação, dependendo das características da migração e da capacidade do servidor de replicação. AWS DMS fornece uma variedade de instâncias de replicação para que você possa escolher a configuração ideal para seu caso de uso. Para obter mais informações sobre as diversas classes de instâncias de replicação, consulte Escolhendo a instância de replicação AWS DMS certa para sua migração.
AWS DMS cria a instância de replicação em uma EC2 instância da Amazon. Algumas das classes de instância menores são suficientes para testar o serviço ou para migrações pequenas. Se a migração envolver um grande número de tabelas ou se você pretender executar várias tarefas de replicação simultâneas, considere utilizar uma das instâncias maiores. É recomendável essa abordagem porque o AWS DMS pode consumir uma quantidade significativa de memória e de CPU.
Dependendo da classe de EC2 instância da Amazon que você selecionar, sua instância de replicação vem com 50 GB ou 100 GB de armazenamento de dados. Essa quantidade normalmente é suficiente para a maioria dos clientes. No entanto, se a migração envolve grandes transações ou um grande volume de alterações de dados, talvez deseje aumentar a alocação de armazenamento de base. A captura de dados de alteração (CDC) pode fazer com que os dados sejam gravados em disco, de acordo com a velocidade com que o destino consegue gravar as alterações. Como os arquivos de log também são gravados em disco, aumentar o nível de gravidade do registro em log também resultará em um maior consumo de armazenamento.
AWS DMS pode fornecer alta disponibilidade e suporte de failover usando uma implantação Multi-AZ. Em uma implantação Multi-AZ, provisiona e mantém AWS DMS automaticamente uma réplica em espera da instância de replicação em uma zona de disponibilidade diferente. A instância de replicação primária é replicada em sincronia para a réplica em espera. Se a instância de replicação primária falhar ou parar de responder, a instância em espera retoma qualquer tarefa em execução com o mínimo de interrupção. Como a primária está replicando constantemente seu estado para a de espera, a implantação multi-AZ implica alguma sobrecarga no desempenho.
Para obter informações mais detalhadas sobre a instância AWS DMS de replicação, consulteTrabalhando com uma instância de AWS DMS replicação.
Em vez de criar e gerenciar uma instância de replicação, você pode deixar AWS DMS provisionar sua replicação automaticamente usando AWS DMS o Serverless. Para obter mais informações, consulte Trabalhando com AWS DMS Serverless.
- Endpoint
-
AWS DMS usa um endpoint para acessar seu armazenamento de dados de origem ou destino. As informações de conexão específicas são diferentes, dependendo do seu armazenamento de dados, mas no geral deve-se fornecer as seguintes informações ao criar um endpoint.
-
Tipo de endpoint: origem ou destino.
-
Tipo de mecanismo: tipo de mecanismo do banco de dados, como Oracle ou PostgreSQL.
-
Nome do servidor — Nome do servidor ou endereço IP que AWS DMS pode ser acessado.
-
Porta: número da porta usada para conexões de servidor do banco de dados.
-
Criptografia: modo Secure Socket Layer (SSL), se o SSL for usado para criptografar a conexão.
-
Credenciais: nome de usuário e senha de uma conta com os direitos de acesso necessários.
Quando você cria um endpoint usando o AWS DMS console, o console exige que você teste a conexão do endpoint. O teste deve ser bem-sucedido antes de usar o endpoint em uma AWS DMS tarefa. Como as informações de conexão, os critérios de teste específicos são diferentes para diferentes tipos de mecanismos. No geral, o AWS DMS verifica se o banco de dados existe no determinado nome de servidor e porta, e se as credenciais fornecidas podem ser usadas para se conectar ao banco de dados com os privilégios necessários para executar uma migração. Se o teste de conexão for bem-sucedido, AWS DMS baixa e armazena as informações do esquema para uso posterior durante a configuração da tarefa. As informações de esquema podem incluir definições de tabela, definições de chave primária e definições de chave exclusiva, por exemplo.
Mais de uma tarefa de replicação pode utilizar um único endpoint. Por exemplo, é possível ter duas aplicações logicamente distintas hospedadas no mesmo banco de dados de origem que deseja migrar separadamente. Nesse caso, duas tarefas de replicação são criadas, uma para cada conjunto de tabelas de aplicações. Você pode usar o mesmo AWS DMS endpoint nas duas tarefas.
É possível personalizar o comportamento de um endpoint utilizando as configurações do endpoint. As Configurações do endpoint podem controlar vários comportamentos, como detalhes de registro em log, tamanho do arquivo e outros parâmetros. Cada tipo de mecanismo de datastore tem diferentes configurações de endpoint disponíveis. É possível encontrar as configurações específicas de endpoints para cada datastore na seção de origem e de destino do datastore. Para obter uma lista de datastores de origem e de destino compatíveis, consulte Fontes para AWS DMS e Metas para AWS DMS.
Para obter informações mais detalhadas sobre AWS DMS endpoints, consulteComo trabalhar com endpoints do AWS DMS.
-
- Tarefas de replicação
-
Você usa uma tarefa de AWS DMS replicação para mover um conjunto de dados do endpoint de origem para o endpoint de destino. A criação de uma tarefa de replicação é a última etapa necessária antes de iniciar uma migração.
Ao criar uma tarefa de replicação, especifique as seguintes configurações de tarefa:
-
Instância de replicação: a instância que hospeda e executa a tarefa
-
Endpoint de origem
-
Endpoint de destino
-
Opções de tipo de migração, conforme listadas a seguir. Para obter uma explicação completa sobre as opções do tipo de migração, consulte Criar uma tarefa.
-
Carga máxima (migração de dados existentes): se houver condições para uma interrupção longa o suficiente para copiar os dados existentes, esta será uma boa opção. Essa opção migra somente os dados do banco de dados de origem para o banco de dados de destino, criando tabelas quando necessário.
-
Carga máxima + CDC (alterações da migração dos dados existentes e da replicação contínua): esta opção executa uma carga máxima de dados enquanto captura alterações na origem. Após a carga máxima ser concluída, as alterações capturadas são aplicadas ao destino. Por fim, a aplicação de alterações alcança um estado estável. Nesse momento, é possível encerrar as aplicações, permitir que as alterações restantes sejam transmitidas até o destino e reiniciar as aplicações apontando para o destino.
-
Somente CDC (somente replicação de alterações de dados): em algumas situações, copiar os dados existentes utilizando um método diferente do AWS DMS pode ser mais eficaz. Por exemplo, em uma migração homogênea, utilizar ferramentas de exportação/importação nativas pode ser mais eficaz para o carregamento de dados em massa. Nessa situação, você pode usar AWS DMS para replicar as alterações a partir do momento em que inicia o carregamento em massa para trazer e manter seus bancos de dados de origem e destino sincronizados.
-
-
Opções de modo de preparação de tabela de destino, conforme listadas a seguir. Para obter uma explicação completa sobre os modos da tabela de destino, consulte Criar uma tarefa.
-
Não fazer nada — AWS DMS presume que as tabelas de destino foram pré-criadas no destino.
-
Solte as tabelas no alvo — AWS DMS derruba e recria as tabelas de destino.
-
Truncar: se você criou tabelas no destino, o AWS as truncará antes que a migração seja iniciada. Se nenhuma tabela existir e você selecionar essa opção, AWS DMS criará qualquer tabela ausente.
-
-
Opções do modo LOB, conforme listadas a seguir. Para obter uma explicação completa sobre os modos de LOB, consulte Configurando LOB suporte para bancos de dados de origem em uma AWS DMS tarefa.
-
Não incluir colunas LOB: as colunas LOB são excluídas da migração.
-
Modo LOB completo — Migração completa, LOBs independentemente do tamanho. AWS DMS migra por LOBs partes em partes controladas pelo parâmetro Max LOB Size. Esse modo é mais lento que o modo LOB limitado.
-
Modo LOB limitado — Trunque LOBs até o valor especificado pelo parâmetro Tamanho máximo de LOB. Esse modo é mais rápido que o modo LOB completo.
-
-
Mapeamentos de tabelas: indica as tabelas a serem migradas e como elas são migradas. Para obter mais informações, consulte Utilizar o mapeamento de tabela para especificar as configurações da tarefa.
-
Transformações de dados, conforme listadas a seguir. Para obter mais informações sobre transformações de dados, consulte Especificando regras de seleção e transformações de tabelas usando JSON.
-
Alteração de nomes de esquema, tabela e coluna.
-
Alteração de nomes de espaços de tabela (para endpoints de destino do Oracle).
-
Definição de chaves primárias e índices exclusivos no destino.
-
-
Validação de dados
-
CloudWatch Registro na Amazon
Utilize a tarefa para migrar dados do endpoint de origem para o endpoint de destino, e o processamento da tarefa acontece na instância de replicação. Especifique quais tabelas e esquemas serão migrados e qualquer processamento especial, como requisitos de registro em log, dados da tabela de controle e gerenciamento de erros.
Conceitualmente, uma tarefa de AWS DMS replicação executa duas funções distintas, conforme mostrado no diagrama a seguir.
O processo de carga máxima apresenta compreensão direta. Os dados são extraídos da origem em um modo de extração em lote e carregados diretamente no destino. Você pode especificar o número de tabelas a serem extraídas e carregadas paralelamente no AWS DMS console em Configurações avançadas.
Para obter mais informações sobre AWS DMS tarefas, consulteTrabalhar com tarefas do AWS DMS.
-
- Replicação contínua ou captura de dados de alteração (CDC)
-
Você também pode usar uma AWS DMS tarefa para capturar alterações contínuas no armazenamento de dados de origem enquanto migra seus dados para um destino. O processo de captura de alterações AWS DMS usado ao replicar alterações contínuas de um endpoint de origem coleta as alterações nos registros do banco de dados usando a API nativa do mecanismo de banco de dados.
No processo de CDC, a tarefa de replicação é projetada para transmitir as alterações da origem para o destino, utilizando buffers na memória para manter os dados em trânsito. Se os buffers na memória se esgotarem por qualquer motivo, a tarefa de replicação repassará alterações pendentes para o Cache de alteração no disco. Isso pode ocorrer, por exemplo, se AWS DMS estiver capturando alterações da fonte mais rápido do que elas podem ser aplicadas no destino. Nesse caso, você verá a latência de destino da tarefa exceder a latência de origem.
Você pode verificar isso navegando até sua tarefa no AWS DMS console e abrindo a guia Monitoramento de tarefas. Os gráficos de CDCLatency destino e de CDCLatency origem são mostrados na parte inferior da página. Se você tiver uma tarefa que mostra a latência de destino, então provavelmente há algum ajuste no endpoint de destino necessário para aumentar a taxa de aplicação.
A tarefa de replicação também utiliza armazenamento para logs de tarefas, conforme discutido anteriormente. O espaço em disco que vem pré-configurado com a instância de replicação normalmente é suficiente para o registro em log e alterações repassadas. Se precisar de espaço adicional em disco, por exemplo, ao utilizar a depuração detalhada para investigar um problema de migração, é possível modificar a instância de replicação para alocar mais espaço.