Componentes do AWS DMS - AWS Database Migration Service

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Componentes do AWS DMS

Esta seção descreve os componentes internos AWS DMS e como eles funcionam juntos para realizar sua migração de dados. Entender os componentes estruturais do AWS DMS pode ajudar você a migrar dados de forma mais eficaz e fornecer uma melhor compreensão ao solucionar ou investigar problemas.

Uma AWS DMS migração consiste em cinco componentes: descoberta de bancos de dados a serem migrados, conversão automática de esquemas, instância de replicação, endpoints de origem e destino e tarefa de replicação. Você cria uma AWS DMS migração criando a instância de replicação, os endpoints e as tarefas necessárias em um. Região da AWS

Descoberta de banco de dados

DMSO Fleet Advisor coleta dados de vários ambientes de banco de dados para fornecer informações sobre sua infraestrutura de dados. DMSO Fleet Advisor coleta dados de seu banco de dados local e servidores analíticos de um ou mais locais centrais sem a necessidade de instalá-los em todos os computadores. Atualmente, o DMS Fleet Advisor oferece suporte aos SQL servidores de SQL banco de dados Microsoft ServerSQL, My, Oracle e Postgre.

Com base nos dados descobertos em sua rede, o DMS Fleet Advisor cria um inventário que você pode revisar para determinar quais servidores e objetos de banco de dados devem ser monitorados. À medida que os detalhes sobre esses servidores, bancos de dados e esquemas são coletados, é possível analisar a viabilidade das migrações de banco de dados pretendidas.

Migração de código e schema

DMSA conversão de esquema AWS DMS torna as migrações de banco de dados entre diferentes tipos de bancos de dados mais previsíveis. Você pode usar a Conversão de DMS Esquema para avaliar a complexidade da migração para o provedor de dados de origem e, em seguida, usá-la para converter esquemas de banco de dados e objetos de código. É possível aplicar o código convertido ao banco de dados de destino.

Em um alto nível, o DMS Schema Conversion opera com os três componentes a seguir: perfis de instância, provedores de dados e projetos de migração. Um perfil de instância especifica as configurações da rede e da segurança. Um provedor de dados armazena as credenciais de conexão do banco de dados. Um projeto de migração contém provedores de dados, um perfil de instância e regras de migração. AWS DMS usa provedores de dados e um perfil de instância para criar um processo que converte esquemas de banco de dados e objetos de código.

Instância da replicação

Em um alto nível, uma instância de AWS DMS replicação é simplesmente uma instância gerenciada do Amazon Elastic Compute Cloud EC2 (Amazon) que hospeda uma ou mais tarefas de replicação.

A figura a seguir mostra um exemplo de instância de replicação que executa várias tarefas de replicação associadas.

Comece com AWS DMS

Uma única instância de replicação pode hospedar uma ou mais tarefas de replicação, dependendo das características da migração e da capacidade do servidor de replicação. AWS DMS fornece uma variedade de instâncias de replicação para que você possa escolher a configuração ideal para seu caso de uso. Para obter mais informações sobre as diversas classes de instâncias de replicação, consulte Escolhendo o certo AWS DMSinstância de replicação para sua migração.

AWS DMS cria a instância de replicação em uma EC2 instância da Amazon. Algumas das classes de instância menores são suficientes para testar o serviço ou para migrações pequenas. Se a migração envolver um grande número de tabelas ou se você pretender executar várias tarefas de replicação simultâneas, considere utilizar uma das instâncias maiores. Recomendamos essa abordagem porque AWS DMS pode consumir uma quantidade significativa de memória CPU e.

Dependendo da classe de EC2 instância da Amazon que você selecionar, sua instância de replicação vem com 50 GB ou 100 GB de armazenamento de dados. Essa quantidade normalmente é suficiente para a maioria dos clientes. No entanto, se a migração envolve grandes transações ou um grande volume de alterações de dados, talvez deseje aumentar a alocação de armazenamento de base. A captura de dados de alteração (CDC) pode fazer com que os dados sejam gravados em disco, dependendo da rapidez com que o destino possa gravar as alterações. Como os arquivos de log também são gravados em disco, aumentar o nível de gravidade do registro em log também resultará em um maior consumo de armazenamento.

AWS DMS pode fornecer alta disponibilidade e suporte de failover usando uma implantação Multi-AZ. Em uma implantação Multi-AZ, provisiona e mantém AWS DMS automaticamente uma réplica em espera da instância de replicação em uma zona de disponibilidade diferente. A instância de replicação primária é replicada em sincronia para a réplica em espera. Se a instância de replicação primária falhar ou parar de responder, a instância em espera retoma qualquer tarefa em execução com o mínimo de interrupção. Como a primária está replicando constantemente seu estado para a de espera, a implantação multi-AZ implica alguma sobrecarga no desempenho.

Para obter informações mais detalhadas sobre a instância AWS DMS de replicação, consulteTrabalhando com um AWS DMS instância de replicação.

Em vez de criar e gerenciar uma instância de replicação, você pode deixar AWS DMS provisionar sua replicação automaticamente usando AWS DMS o Serverless. Para obter mais informações, consulte Trabalhando com AWS DMS Serverless.

Endpoint

AWS DMS usa um endpoint para acessar seu armazenamento de dados de origem ou destino. As informações de conexão específicas são diferentes, dependendo do seu armazenamento de dados, mas no geral deve-se fornecer as seguintes informações ao criar um endpoint.

  • Tipo de endpoint: origem ou destino.

  • Tipo de mecanismo — Tipo de mecanismo de banco de dados, como Oracle ou PostgreSQL.

  • Nome do servidor — Nome do servidor ou endereço IP que AWS DMS pode ser acessado.

  • Porta: número da porta usada para conexões de servidor do banco de dados.

  • Criptografia — Modo Secure Socket Layer (SSL), se SSL for usado para criptografar a conexão.

  • Credenciais: nome de usuário e senha de uma conta com os direitos de acesso necessários.

Quando você cria um endpoint usando o AWS DMS console, o console exige que você teste a conexão do endpoint. O teste deve ser bem-sucedido antes de usar o endpoint em uma AWS DMS tarefa. Como as informações de conexão, os critérios de teste específicos são diferentes para diferentes tipos de mecanismos. No geral, o AWS DMS verifica se o banco de dados existe no determinado nome de servidor e porta, e se as credenciais fornecidas podem ser usadas para se conectar ao banco de dados com os privilégios necessários para executar uma migração. Se o teste de conexão for bem-sucedido, AWS DMS baixa e armazena as informações do esquema para uso posterior durante a configuração da tarefa. As informações de esquema podem incluir definições de tabela, definições de chave primária e definições de chave exclusiva, por exemplo.

Mais de uma tarefa de replicação pode utilizar um único endpoint. Por exemplo, é possível ter duas aplicações logicamente distintas hospedadas no mesmo banco de dados de origem que deseja migrar separadamente. Nesse caso, duas tarefas de replicação são criadas, uma para cada conjunto de tabelas de aplicações. Você pode usar o mesmo AWS DMS endpoint nas duas tarefas.

É possível personalizar o comportamento de um endpoint utilizando as configurações do endpoint. As Configurações do endpoint podem controlar vários comportamentos, como detalhes de registro em log, tamanho do arquivo e outros parâmetros. Cada tipo de mecanismo de datastore tem diferentes configurações de endpoint disponíveis. É possível encontrar as configurações específicas de endpoints para cada datastore na seção de origem e de destino do datastore. Para obter uma lista de datastores de origem e de destino compatíveis, consulte Fontes para AWS DMS e Metas para AWS DMS.

Para obter informações mais detalhadas sobre AWS DMS endpoints, consulteComo trabalhar com endpoints do AWS DMS.

Tarefas de replicação

Você usa uma tarefa de AWS DMS replicação para mover um conjunto de dados do endpoint de origem para o endpoint de destino. A criação de uma tarefa de replicação é a última etapa necessária antes de iniciar uma migração.

Ao criar uma tarefa de replicação, especifique as seguintes configurações de tarefa:

  • Instância de replicação: a instância que hospeda e executa a tarefa

  • Endpoint de origem

  • Endpoint de destino

  • Opções de tipo de migração, conforme listadas a seguir. Para obter uma explicação completa sobre as opções do tipo de migração, consulte Criar uma tarefa.

    • Carga máxima (migração de dados existentes): se houver condições para uma interrupção longa o suficiente para copiar os dados existentes, esta será uma boa opção. Essa opção migra somente os dados do banco de dados de origem para o banco de dados de destino, criando tabelas quando necessário.

    • Carga total + CDC (Migrar dados existentes e replicar alterações em andamento) — Essa opção executa uma carga completa de dados enquanto captura as alterações na origem. Após a carga máxima ser concluída, as alterações capturadas são aplicadas ao destino. Por fim, a aplicação de alterações alcança um estado estável. Nesse momento, é possível encerrar as aplicações, permitir que as alterações restantes sejam transmitidas até o destino e reiniciar as aplicações apontando para o destino.

    • CDCsomente (somente replicar alterações de dados) — em algumas situações, pode ser mais eficiente copiar dados existentes usando um método diferente AWS DMS de. Por exemplo, em uma migração homogênea, utilizar ferramentas de exportação/importação nativas pode ser mais eficaz para o carregamento de dados em massa. Nessa situação, você pode usar AWS DMS para replicar as alterações a partir do momento em que inicia o carregamento em massa para trazer e manter seus bancos de dados de origem e destino sincronizados.

  • Opções de modo de preparação de tabela de destino, conforme listadas a seguir. Para obter uma explicação completa sobre os modos da tabela de destino, consulte Criar uma tarefa.

    • Não fazer nada — AWS DMS presume que as tabelas de destino foram pré-criadas no destino.

    • Solte as tabelas no alvo — AWS DMS derruba e recria as tabelas de destino.

    • Truncar — Se você criou tabelas no destino, AWS DMS trunca-as antes do início da migração. Se nenhuma tabela existir e você selecionar essa opção, AWS DMS criará qualquer tabela ausente.

  • LOBopções de modo, conforme listado a seguir. Para obter uma explicação completa dos LOB modos, consulteConfigurando LOB suporte para bancos de dados de origem em uma AWS DMS tarefa.

    • Não inclua LOB colunas — LOB as colunas são excluídas da migração.

    • LOBModo completo — Migração completa, LOBs independentemente do tamanho. AWS DMS migra por LOBs partes em partes controladas pelo parâmetro Max Size. LOB Esse modo é mais lento do que usar o LOB modo limitado.

    • LOBModo limitado — LOBs Trunque até o valor especificado pelo parâmetro LOBTamanho máximo. Esse modo é mais rápido do que usar o LOB modo completo.

  • Mapeamentos de tabelas: indica as tabelas a serem migradas e como elas são migradas. Para obter mais informações, consulte Utilizar o mapeamento de tabela para especificar as configurações da tarefa.

  • Transformações de dados, conforme listadas a seguir. Para obter mais informações sobre transformações de dados, consulte Especificar a seleção de tabelas e as regras de transformação utilizando JSON.

    • Alteração de nomes de esquema, tabela e coluna.

    • Alteração de nomes de espaços de tabela (para endpoints de destino do Oracle).

    • Definição de chaves primárias e índices exclusivos no destino.

  • Validação de dados

  • CloudWatch Registro na Amazon

Utilize a tarefa para migrar dados do endpoint de origem para o endpoint de destino, e o processamento da tarefa acontece na instância de replicação. Especifique quais tabelas e esquemas serão migrados e qualquer processamento especial, como requisitos de registro em log, dados da tabela de controle e gerenciamento de erros.

Conceitualmente, uma tarefa de AWS DMS replicação executa duas funções distintas, conforme mostrado no diagrama a seguir.

Comece com AWS DMS

O processo de carga máxima apresenta compreensão direta. Os dados são extraídos da origem em um modo de extração em lote e carregados diretamente no destino. Você pode especificar o número de tabelas a serem extraídas e carregadas paralelamente no AWS DMS console em Configurações avançadas.

Para obter mais informações sobre AWS DMS tarefas, consulteTrabalhar com tarefas do AWS DMS.

Replicação contínua ou captura de dados de alteração () CDC

Você também pode usar uma AWS DMS tarefa para capturar alterações contínuas no armazenamento de dados de origem enquanto migra seus dados para um destino. O processo de captura de alterações AWS DMS usado ao replicar alterações em andamento de um endpoint de origem coleta as alterações nos registros do banco de dados usando o mecanismo nativo do banco de dados. API

No CDC processo, a tarefa de replicação foi projetada para transmitir as alterações da origem para o destino, usando buffers na memória para manter os dados em trânsito. Se os buffers na memória se esgotarem por qualquer motivo, a tarefa de replicação repassará alterações pendentes para o Cache de alteração no disco. Isso pode ocorrer, por exemplo, se AWS DMS estiver capturando alterações da fonte mais rápido do que elas podem ser aplicadas no destino. Nesse caso, você verá a latência de destino da tarefa exceder a latência de origem.

Você pode verificar isso navegando até sua tarefa no AWS DMS console e abrindo a guia Monitoramento de tarefas. Os CDCLatencySource gráficos CDCLatencyTarget e são mostrados na parte inferior da página. Se você tiver uma tarefa que mostra a latência de destino, então provavelmente há algum ajuste no endpoint de destino necessário para aumentar a taxa de aplicação.

A tarefa de replicação também utiliza armazenamento para logs de tarefas, conforme discutido anteriormente. O espaço em disco que vem pré-configurado com a instância de replicação normalmente é suficiente para o registro em log e alterações repassadas. Se precisar de espaço adicional em disco, por exemplo, ao utilizar a depuração detalhada para investigar um problema de migração, é possível modificar a instância de replicação para alocar mais espaço.