Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Componentes de AWS DMS
En esta sección se describen los componentes internos AWS DMS y cómo funcionan juntos para llevar a cabo la migración de datos. Comprender los componentes subyacentes de AWS DMS puede ayudarle a migrar datos de forma más eficiente y a proporcionar una mejor visión a la hora de solucionar problemas o de investigarlos.
Una AWS DMS migración consta de cinco componentes: la detección de las bases de datos que se van a migrar, la conversión automática de esquemas, una instancia de replicación, los puntos finales de origen y destino y una tarea de replicación. Para crear una AWS DMS migración, debe crear la instancia de replicación, los puntos finales y las tareas necesarios en un. Región de AWS
- Detección de base de datos
-
DMS Fleet Advisor recopila datos de varios entornos de bases de datos para proporcionar información sobre la infraestructura de datos. DMS Fleet Advisor recopila datos de los servidores de análisis y bases de datos en las instalaciones desde una o más ubicaciones centrales sin necesidad de instalarlos en todos los equipos. En la actualidad, DMS Fleet Advisor es compatible con los servidores de bases de datos Microsoft SQL Server, MySQL, Oracle y PostgreSQL.
A partir de los datos detectados en la red, DMS Fleet Advisor crea un inventario que puede revisar para determinar qué objetos y servidores de bases de datos debe monitorear. Según se recopila información sobre estos servidores, bases de datos y esquemas, puede analizar la viabilidad de las migraciones de bases de datos que desee realizar.
- Migración de esquemas y códigos
-
La conversión de esquemas de DMS AWS DMS hace que las migraciones de bases de datos entre diferentes tipos de bases de datos sean más predecibles. Puede utilizar la conversión de esquemas del DMS para evaluar la complejidad de la migración del proveedor de datos de origen y, a continuación, utilizarla para convertir esquemas de bases de datos y objetos de código. Puede aplicar el código convertido a la base de datos de destino.
En un nivel alto, la conversión de esquemas del DMS funciona con los tres componentes siguientes: perfiles de instancias, proveedores de datos y proyectos de migración. Un perfil de instancia especifica la configuración de red y seguridad. Un proveedor de datos almacena las credenciales de conexión a la base de datos. Un proyecto de migración contiene proveedores de datos, un perfil de instancia y reglas de migración. AWS DMS usa proveedores de datos y un perfil de instancia para diseñar un proceso que convierte los esquemas de bases de datos y los objetos de código.
- Instancia de replicación
-
En un nivel alto, una instancia de AWS DMS replicación es simplemente una instancia gestionada de Amazon Elastic Compute Cloud (Amazon EC2) que aloja una o más tareas de replicación.
La figura siguiente muestra una instancia de replicación de ejemplo que ejecuta varias tareas de replicación asociadas.
Una sola instancia de replicación puede alojar una o más tareas de replicación, según las características de la migración y la capacidad del servidor de replicación. AWS DMS proporciona una variedad de instancias de replicación para que pueda elegir la configuración óptima para su caso de uso. Para obtener más información acerca de las diversas clases de instancias de replicación, consulte Cómo elegir la instancia de replicación de AWS DMS adecuada para su migración.
AWS DMS crea la instancia de replicación en una EC2 instancia de Amazon. Algunas de las clases de instancias más pequeñas son suficientes para probar el servicio o para pequeñas migraciones. Si su migración conlleva muchas tablas, o si va a ejecutar varias tareas de replicación simultáneas, debería plantearse el uso de una de las instancias más grandes. Le recomendamos este método porque AWS DMS puede consumir una cantidad significativa de memoria y de CPU.
Según la clase de EC2 instancia de Amazon que seleccione, la instancia de replicación incluye 50 GB o 100 GB de almacenamiento de datos. Esta cantidad suele ser suficiente para la mayoría de los clientes. Sin embargo, si la migración implica grandes transacciones o un alto volumen de cambios de datos, entonces es posible que desee aumentar la asignación de almacenamiento base. La captura de datos de cambio (CDC) puede provocar que los datos se escriban en el disco, en función de la rapidez con que el destino pueda escribir los cambios. Como los archivos de registro también se escriben en el disco, el aumento del nivel de gravedad del registro también aumentará el consumo de almacenamiento.
AWS DMS puede proporcionar alta disponibilidad y soporte de conmutación por error mediante una implementación Multi-AZ. En una implementación Multi-AZ, AWS DMS aprovisiona y mantiene automáticamente una réplica en espera de la instancia de replicación en una zona de disponibilidad diferente. La instancia de replicación principal se replica sincrónicamente en la réplica en espera. Si la instancia de replicación principal falla o no responde, la instancia en espera reanuda cualquier tarea en ejecución con una interrupción mínima. Debido a que el nodo principal replica constantemente su estado a la espera, la implementación Multi-AZ incurre en algunos costos de desempeño.
Para obtener información más detallada sobre la instancia de AWS DMS replicación, consulteTrabajar con una instancia AWS DMS de replicación.
En lugar de crear y administrar una instancia de replicación, puede permitir que la replicación se AWS DMS aprovisione automáticamente mediante AWS DMS Serverless. Para obtener más información, consulte Trabajando con AWS DMS Serverless.
- Punto de conexión
-
AWS DMS utiliza un punto final para acceder al almacén de datos de origen o destino. La información de conexión específica es diferente, en función de su almacén de datos, pero en general proporcione la siguiente información al crear un punto de enlace:
-
Tipo de punto de conexión: origen o destino.
-
Tipo de motor: el tipo de motor de base de datos, como, por ejemplo, Oracle o PostgreSQL.
-
Nombre del servidor: nombre del servidor o dirección IP a la que AWS DMS puede acceder.
-
Puerto: número de puerto utilizado para conexiones de servidor de base de datos.
-
Cifrado: modo de la capa de conexión segura (SSL), si se utiliza SSL para cifrar la conexión.
-
Credenciales: nombre de usuario y contraseña de una cuenta con los derechos de acceso necesarios.
Al crear un punto final mediante la AWS DMS consola, la consola requiere que pruebe la conexión del punto final. La prueba debe realizarse correctamente antes de utilizar el punto final en una AWS DMS tarea. Al igual que la información de conexión, los criterios de prueba específicos son distintos para los distintos tipos de motor. En general, AWS DMS verifica que la base de datos existe en el nombre de servidor y puerto especificado y que las credenciales suministradas se pueden utilizar para conectarse a la base de datos con los privilegios necesarios para realizar una migración. Si la prueba de conexión se realiza correctamente, AWS DMS descarga y almacena la información del esquema para utilizarla más adelante durante la configuración de la tarea. La información de esquema puede incluir definiciones de tabla, definiciones de clave principal y definiciones de clave única, por ejemplo.
Más de una tarea de replicación puede utilizar un único punto de enlace. Por ejemplo, podría tener dos aplicaciones distintas lógicamente alojadas en la misma base de datos de origen que desea migrar por separado. En este caso, creará dos tareas de replicación, una para cada conjunto de tablas de aplicación. Puede usar el mismo AWS DMS punto final en ambas tareas.
Puede personalizar el comportamiento de un punto de conexión mediante la configuración del punto de conexión. La configuración del punto de conexión puede controlar diversos comportamientos tales como el detalle de registro, el tamaño de archivo y otros parámetros. Cada tipo de motor de almacén de datos tiene diferentes configuraciones de punto de conexión disponibles. Puede encontrar la configuración de puntos de conexión específicos para cada almacén de datos en la sección de origen o destino del almacén de datos. Para obtener una lista de los almacenes de datos de origen y de destino admitidos, consulte Fuentes de AWS DMS y Objetivos para AWS DMS.
Para obtener información más detallada sobre los AWS DMS puntos finales, consulteTrabajar con puntos finales AWS de DMS.
-
- Tareas de replicación
-
Se utiliza una tarea de AWS DMS replicación para mover un conjunto de datos del punto final de origen al punto final de destino. La creación de una tarea de replicación es el último paso que debe realizar antes de iniciar una migración.
Cuando crea una tarea de replicación, puede especificar los siguientes ajustes de la tarea:
-
Instancia de replicación: la instancia para alojar y ejecutar la tarea
-
Punto de enlace de origen
-
Punto de enlace de destino
-
Opciones de tipo de migración, tal y como se indica a continuación. Para obtener una explicación completa de las opciones de tipos de migración, consulte Creación de una tarea.
-
Carga completa (Migrar datos existentes): esta opción es buena si puede permitirse interrumpir la actividad durante el tiempo suficiente como para copiar los datos existentes. Esta opción simplemente migra los datos de la base de datos de origen a la de destino y crea tablas cuando es necesario.
-
Carga completa + CDC (Migrar datos existentes y replicar los cambios en curso): esta opción realiza una carga completa de los datos mientras captura los cambios del origen. Una vez terminada la carga completa, los cambios capturados se aplican al destino. En el tiempo debido, la aplicación de los cambios alcanzará un estado de estabilidad. En ese momento, puede cerrar las aplicaciones, dejar que los cambios restantes fluyan al destino y reiniciar después las aplicaciones que apunten al destino.
-
CDC solo (Replicar solo los cambios de datos): en algunas situaciones puede resultar más práctico copiar los datos existentes utilizando un método que no sea AWS DMS. En una migración homogénea, por ejemplo, usar herramientas nativas de exportación e importación puede ser más eficaz para cargar datos masivos. En este caso, puede replicar los cambios AWS DMS a partir del inicio de la carga masiva para sincronizar las bases de datos de origen y destino y mantenerlas sincronizadas.
-
-
Opciones de modo de preparación de tabla de destino, tal y como se indica a continuación. Para obtener una explicación completa de los modos de tabla de destino, consulte Creación de una tarea.
-
No haga nada: se AWS DMS supone que las tablas de destino se han creado previamente en el destino.
-
Coloca las tablas en el objetivo: AWS DMS coloca y recrea las tablas objetivo.
-
Truncar: si ha creado tablas en el destino, AWS DMS las trunca antes de que comience la migración. Si no existe ninguna tabla y selecciona esta opción, AWS DMS crea las tablas que falten.
-
-
Opciones de modo LOB, tal y como se indica a continuación. Para obtener una explicación completa de los modos de LOB, consulte Configurar la compatibilidad con LOB para las bases de datos de origen de una tarea AWS DMS.
-
No incluir columnas de LOB: las columnas de LOB se excluyen de la migración.
-
Modo LOB completo: la migración se completa LOBs independientemente del tamaño. AWS DMS migra por LOBs partes en fragmentos controlados por el parámetro Tamaño máximo de LOB. Este modo es más lento que utilizar el modo de LOB limitado.
-
Modo LOB limitado: se trunca LOBs hasta el valor especificado en el parámetro Tamaño máximo de LOB. Este modo es más rápido que utilizar el modo de LOB completo.
-
-
Asignaciones de tablas: indica las tablas que se van a migrar y la forma en que se migran. Para obtener más información, consulte Uso del mapeo de tablas para especificar la configuración de tareas.
-
Transformaciones de datos, tal y como se indica a continuación. Para obtener más información acerca de las transformaciones de datos, consulte Especificación de reglas de selección de tablas y transformaciones mediante JSON.
-
Cambio de nombres de esquemas, tablas y columnas.
-
Cambio de nombres de espacios de tablas (para puntos de enlace de Oracle).
-
Definición de claves primarias e índices únicos en el destino.
-
-
Validación de datos
-
CloudWatch Registro de Amazon
Utiliza la tarea para migrar datos desde el punto de enlace de origen hasta el punto de enlace de destino y el procesamiento de tareas se realiza en la instancia de replicación. Especifica qué tablas y esquemas desea migrar y cualquier procesamiento especial, como, por ejemplo, los requisitos de registro, los datos de la tabla de control y la gestión de errores.
Conceptualmente, una tarea de AWS DMS replicación realiza dos funciones distintas, como se muestra en el siguiente diagrama.
El proceso de carga completa es sencillo de comprender. Los datos se extraen desde el origen de forma masiva y se cargan directamente en el destino. Puede especificar el número de tablas que se van a extraer y cargar en paralelo en la AWS DMS consola en Configuración avanzada.
Para obtener más información sobre AWS DMS las tareas, consulteTrabajar con AWS DMS tareas.
-
- Replicación continua o captura de datos de cambio (CDC)
-
También puede utilizar una AWS DMS tarea para capturar los cambios en curso en el banco de datos de origen mientras migra los datos a un destino. El proceso de captura de cambios que se AWS DMS utiliza al replicar los cambios en curso desde un punto final de origen recopila los cambios en los registros de la base de datos mediante la API nativa del motor de base de datos.
En el proceso de CDC, la tarea de replicación está diseñada para transmitir los cambios desde el origen al destino, utilizando búferes en memoria para almacenar datos en tránsito. Si los búferes en memoria se agotan por cualquier motivo, la tarea de replicación volcará los cambios pendientes en la caché de cambio en disco. Esto podría ocurrir, por ejemplo, si AWS DMS se capturan los cambios de la fuente más rápido de lo que se pueden aplicar en el destino. En este caso, verá que la latencia de destino de la tarea supera la latencia de origen de la tarea.
Para comprobarlo, dirígete a tu tarea en la AWS DMS consola y abre la pestaña Supervisión de tareas. Los gráficos de CDCLatency destino y CDCLatency origen se muestran en la parte inferior de la página. Si tiene una tarea que muestra una latencia de destino, entonces probablemente es necesario realizar algún ajuste en el punto de enlace de destino para aumentar la tasa de aplicación.
La tarea de replicación también utiliza el almacenamiento para registros de tareas tal y como se ha explicado anteriormente. El espacio de disco que viene preconfigurado con su instancia de replicación suele ser suficiente para el registro y los cambios de volcado. Si necesita espacio en disco adicional, por ejemplo, cuando se utiliza la depuración detallada para investigar un problema de migración, puede modificar la instancia de replicación para asignar más espacio.