Migración de una base de datos de Oracle en las instalaciones a Amazon RDS para Oracle mediante Oracle Data Pump - Recomendaciones de AWS

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Migración de una base de datos de Oracle en las instalaciones a Amazon RDS para Oracle mediante Oracle Data Pump

Creado por Rizwan Wangde (AWS)

Entorno: producción

Origen: Base de datos de Oracle en las instalaciones

Destino: Amazon RDS para Oracle

Tipo R: redefinir la plataforma

Carga de trabajo: Oracle

Tecnologías: Migración; bases de datos

Servicios de AWS: AWS DMS; AWS Direct Connect; Amazon RDS

Numerosos patrones cubren la migración de bases de datos de Oracle en las instalaciones a Amazon RDS para Oracle mediante Oracle Data Pump, una utilidad nativa de Oracle que es la forma preferida de migrar grandes cargas de trabajo de Oracle. Estos patrones suelen implicar la exportación de tablas o esquemas de aplicaciones a archivos de volcado, la transferencia de los archivos de volcado a un directorio de base de datos en Amazon RDS para Oracle y, a continuación, la importación de los esquemas de aplicación y los datos de los archivos de volcado.

Con este enfoque, la migración puede tardar más en función del tamaño de los datos y del tiempo que se tarde en transferir los archivos de volcado a la instancia de Amazon RDS. Además, los archivos de volcado residen en el volumen Amazon Elastic Block Store (Amazon EBS) de la instancia de Amazon RDS, que debe ser lo suficientemente grande para la base de datos y los archivos de volcado. Si los archivos volcados se eliminan tras la importación, no se puede recuperar el espacio vacío, por lo que tendrá que pagar por el espacio no utilizado.

Este patrón mitiga estos problemas al realizar una importación directa en la instancia de Amazon RDS mediante la API de Oracle Data Pump (DBMS_DATAPUMP) a través de un enlace de base de datos. El patrón inicia una canalización de exportación e importación simultánea entre las bases de datos de origen y destino. Este patrón no requiere ajustar el tamaño de un volumen de EBS para los archivos de volcado porque no se crea ni almacena ningún archivo de volcado en el volumen. Este enfoque ahorra el costo mensual del espacio en disco no utilizado.

Requisitos previos 

  • Una cuenta de Amazon Web Services (AWS) activa.

  • Una nube privada virtual (VPC) configurada con subredes privadas en al menos dos zonas de disponibilidad, para proporcionar la infraestructura de red para la instancia de Amazon RDS.

  • Una base de datos de Oracle en un centro de datos en las instalaciones.

  • Una instancia de Oracle de Amazon RDS en una única zona de disponibilidad. El uso de una única zona de disponibilidad mejora el rendimiento de escritura durante la migración. Se puede habilitar una implementación Multi-AZ entre 24 y 48 horas antes de la transición.

  • AWS Direct Connect (recomendado para bases de datos de gran tamaño).

  • La conectividad de red y las reglas de firewall locales están configuradas para permitir una conexión entrante desde la instancia de Amazon RDS a la base de datos de Oracle en las instalaciones.

Limitaciones

  • El límite de tamaño de la base de datos en Amazon RDS para Oracle es de 64 TiB (en diciembre de 2022).

Versiones de producto

  • Base de datos de origen: base de datos de Oracle 10g, versión 1 y posteriores.

  • Base de datos de destino: para obtener la lista más reciente de versiones y ediciones compatibles en Amazon RDS, consulte Amazon RDS para Oracle en la documentación de AWS.

Pila de tecnología de origen

  • Base de datos de Oracle autoadministrada en las instalaciones o en la nube

Pila de tecnología de destino

  • Amazon RDS para Oracle

Arquitectura de destino

El siguiente diagrama muestra la arquitectura para migrar de una base de datos de Oracle en las instalaciones a Amazon RDS para Oracle en un entorno Single-AZ. Las direcciones de las flechas representan el flujo de datos en la arquitectura. El diagrama no muestra qué componente está iniciando la conexión.

""
  1. La instancia de Amazon RDS para Oracle se conecta a la base de datos de Oracle de origen en las instalaciones para realizar una migración a plena carga a través del enlace de la base de datos.

  2. AWS DMS se conecta a la base de datos de Oracle de origen en las instalaciones para realizar una replicación continua mediante la captura de datos de cambios (CDC).

  3. Los cambios de los CDC se aplican a la base de datos de Amazon RDS para Oracle.

Servicios de AWS

  • AWS Database Migration Service (AWS DMS) le permite migrar los almacenes de datos a la nube de AWS o entre combinaciones de configuraciones en la nube y en las instalaciones. Este patrón usa CDC y la configuración Replicar solo cambios de datos.

  • AWS Direct Connect vincula su red interna con una ubicación de Direct Connect a través de un cable estándar Ethernet de fibra óptica. Con esta conexión, puede crear interfaces virtuales directamente en servicios públicos de AWS omitiendo a los proveedores de servicios de Internet en su ruta de acceso a la red.

  • Amazon Relational Database Service (Amazon RDS) para Oracle le ayuda a configurar, utilizar y escalar una base de datos relacional de Oracle en la nube de AWS.

Otras herramientas

Si bien AWS Direct Connect utiliza conexiones de red privadas y dedicadas entre la red local y AWS, considere las siguientes opciones para aumentar la seguridad y el cifrado de datos de los datos en tránsito:

TareaDescripciónHabilidades requeridas

Configurar la conectividad de red desde la base de datos de destino a la base de datos de origen.

Configure el firewall y la red en las instalaciones para permitir la conexión entrante desde la instancia de Amazon RDS de destino a la base de datos de Oracle de origen en las instalaciones.

Administrador de redes, ingeniero de seguridad

Crear un usuario de base de datos con los privilegios adecuados.

Cree un usuario de base de datos en la base de datos de Oracle de origen en las instalaciones con privilegios para migrar datos entre el origen y el destino mediante Oracle Data Pump.

GRANT CONNECT to <migration_user>; GRANT DATAPUMP_EXP_FULL_DATABASE to <migration_user>; GRANT SELECT ANY TABLE to <migration_user>;
Administrador de base de datos

Prepare la base de datos en las instalaciones de origen para la migración a AWS DMS CDC.

(Opcional) Prepare la base de datos de Oracle de origen en las instalaciones para la migración a AWS DMS CDC tras finalizar la carga completa de Oracle Data Pump:

  1. Configure los privilegios adicionales necesarios para gestionar FLASHBACK durante la migración a Oracle Data Pump.

    GRANT FLASHBACK ANY TABLE to <migration_user>; GRANT FLASHBACK ARCHIVE ADMINISTER to <migration_user>;
  2. Para configurar los privilegios de cuenta de usuario necesarios en una base de datos de origen autogestionada Oracle para AWS DMS, consulte la documentación de AWS DMS.

  3. Para preparar una base de datos origen autogestionada de Oracle para los CDC mediante AWS DMS, consulte la documentación de AWS DMS.

Administrador de base de datos

Instalar y configurar SQL Developer.

Instale y configure SQL Developer para conectar y ejecutar consultas SQL en las bases de datos de origen y destino.

Administrador de base de datos, ingeniero de migraciones

Generar un script para crear los espacios de tabla.

Utilice el siguiente ejemplo de consulta SQL para generar el script en la base de datos de origen.

SELECT 'CREATE TABLESPACE ' tablespace_name ' DATAFILE SIZE 1G AUTOEXTEND ON MAXSIZE UNLIMITED;' from dba_tablespaces where tablespace_name not in ('SYSTEM', 'SYSAUX','TEMP','UNDOTBS1') order by 1;

El script se aplicará en la base de datos de destino.

Administrador de base de datos

Generar un script para crear usuarios, perfiles, roles y privilegios.

Para generar un script para crear los usuarios, perfiles, funciones y privilegios de la base de datos, utilice los scripts del documento de Oracle Support Cómo extraer DDL para usuario, incluidos los privilegios y roles mediante dbms_metadata.get_ddl (ID de documento 2739952.1) (se requiere una cuenta de Oracle).

El script se aplicará en la base de datos de destino.

Administrador de base de datos
TareaDescripciónHabilidades requeridas

Crear un enlace de base de datos a la base de datos origen y verificar la conectividad.

Para crear un enlace de base de datos a la base de datos en las instalaciones de origen, puede usar el comando de ejemplo siguiente.

CREATE DATABASE LINK link2src CONNECT TO <migration_user_account> IDENTIFIED BY <password> USING '(DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=<dns or ip address of remote db>) (PORT=<listener port>))(CONNECT_DATA=(SID=<remote SID>)))';

Para comprobar la conectividad, ejecute el comando de SQL siguiente.

select * from dual@link2src;

La conectividad es correcta si la respuesta es X.

Administrador de base de datos

Ejecute los scripts para preparar la instancia de destino.

Ejecute los scripts generados anteriormente para preparar la instancia de Amazon RDS para Oracle:

  1. Espacios de tabla

  2. Perfiles

  3. Roles

Esto ayuda a garantizar que la migración de Oracle Data Pump pueda crear los esquemas y sus objetos.

Administrador de base de datos, ingeniero de migraciones
TareaDescripciónHabilidades requeridas

Migre los esquemas necesarios.

Para migrar los esquemas necesarios de la base de datos en las instalaciones de origen a la instancia de Amazon RDS de destino, utilice el código de la sección de información adicional:

  • Para migrar un único esquema, ejecute el código 1 desde la sección de información adicional.

  • Para migrar múltiples esquemas, ejecute el código 2 desde la sección de información adicional.

Para ajustar el rendimiento de la migración, puede ajustar el número de procesos paralelos ejecutando el siguiente comando.

DBMS_DATAPUMP.SET_PARALLEL (handle => v_hdnl, degree => 4);
Administrador de base de datos

Recopile estadísticas de esquema para mejorar el rendimiento.

El comando Recopilar estadísticas del esquema devuelve las estadísticas del optimizador de consultas de Oracle recopiladas para los objetos de la base de datos. Con esta información, el optimizador puede seleccionar el mejor plan de ejecución para cualquier consulta relacionada con estos objetos.

EXECUTE DBMS_STATS.GATHER_SCHEMA_STATS(ownname => '<schema_name>');
Administrador de base de datos
TareaDescripciónHabilidades requeridas

Capturar el SCN en la base de datos en las instalaciones de origen de Oracle.

Capture el número de cambio del sistema (SCN) en la base de datos de Oracle en las instalaciones de origen. Debe utilizar el SCN para la importación a plena carga y como punto de partida para la replicación de los CDC.

Para generar el SCN actual de la base de datos de origen, introduzca la siguiente instrucción SQL.

SELECT current_scn FROM V$DATABASE;
Administrador de base de datos

Realizar la migración a plena carga de los esquemas.

Para migrar los esquemas necesarios (FULL LOAD) de la base de datos en las instalaciones de origen a la instancia de Amazon RDS de destino, haga lo siguiente:

  • Para migrar un único esquema, ejecute el código 3 desde la sección de información adicional.

  • Para migrar múltiples esquemas, ejecute el código 4 desde la sección de información adicional.

En el código, sustituya <CURRENT_SCN_VALUE_IN_SOURCE_DATABASE> por el SCN que capturó de la base de datos de origen.

DBMS_DATAPUMP.SET_PARAMETER (handle => v_hdnl, name => 'FLASHBACK_SCN', value => <CURRENT_SCN_VALUE_IN_SOURCE_DATABASE>);

Para ajustar el rendimiento de la migración, puede configurar el número de procesos paralelos ejecutando el siguiente comando.

DBMS_DATAPUMP.SET_PARALLEL (handle => v_hdnl, degree => 4);
Administrador de base de datos

Deshabilitar los desencadenadores en los esquemas migrados.

Antes de comenzar la tarea AWS DMS solo de CDC, desactive los TRIGGERS en los esquemas migrados.

Administrador de base de datos

Recopile estadísticas de esquema para mejorar el rendimiento.

El comando Recopilar estadísticas del esquema devuelve las estadísticas del optimizador de consultas de Oracle recopiladas para los objetos de la base de datos. Con esta información, el optimizador puede seleccionar el mejor plan de ejecución para cualquier consulta relacionada con estos objetos.

EXECUTE DBMS_STATS.GATHER_SCHEMA_STATS(ownname => '<schema_name>');
Administrador de base de datos

Utilizar AWS DMS para realizar una replicación continua desde el origen hasta el destino.

Utilice AWS DMS para realizar una replicación continua desde la base de datos de Oracle de origen a la instancia de Amazon RDS para Oracle de destino.

Para obtener más información, consulte Cómo crear tareas de replicación continua mediante AWS DMS y la entrada del blog Cómo trabajar con el soporte nativo para CDC en AWS DMS.

Administrador de base de datos, ingeniero de migraciones
TareaDescripciónHabilidades requeridas

Habilitar la opción Multi-AZ en la instancia 48 horas antes de la transición.

Si se trata de una instancia de producción, recomendamos habilitar la implementación Multi-AZ en la instancia de Amazon RDS para ofrecer las ventajas de la alta disponibilidad (HA) y la recuperación de desastres (DR).

Administrador de base de datos, ingeniero de migraciones

Detenga la tarea AWS DMS solo de CDC (si CDC estaba activado).

  1. Asegúrese de que la latencia de origen y la latencia de destino en las CloudWatch métricas de Amazon de la tarea de AWS DMS muestren 0 segundos.

  2. Detenga la tarea AWS DMS solo de CDC.

Administrador de base de datos

Habilitar los desencadenadores.

Habilite los DESENCADENADORES que desactivó antes de crear la tarea de los CDC.

Administrador de base de datos

AWS

Documentación de Oracle

Código 1: migración a plena carga solo, esquema de aplicación única

DECLARE v_hdnl NUMBER; BEGIN v_hdnl := DBMS_DATAPUMP.OPEN(operation => 'IMPORT', job_mode => 'SCHEMA', remote_link => '<DB LINK Name to Source Database>', job_name => null); DBMS_DATAPUMP.ADD_FILE( handle => v_hdnl, filename => 'import_01.log', directory => 'DATA_PUMP_DIR', filetype => dbms_datapump.ku$_file_type_log_file); DBMS_DATAPUMP.METADATA_FILTER(v_hdnl,'SCHEMA_EXPR','IN (''<schema_name>'')'); -- To migrate one selected schema DBMS_DATAPUMP.METADATA_FILTER (hdnl, 'EXCLUDE_PATH_EXPR','IN (''STATISTICS'')'); -- To prevent gathering Statistics during the import DBMS_DATAPUMP.SET_PARALLEL (handle => v_hdnl, degree => 4); -- Number of parallel processes performing export and import DBMS_DATAPUMP.START_JOB(v_hdnl); END; /

Código 2: migración a plena solo, esquemas de aplicación múltiples

DECLARE v_hdnl NUMBER; BEGIN v_hdnl := DBMS_DATAPUMP.OPEN(operation => 'IMPORT', job_mode => 'SCHEMA', remote_link => '<DB LINK Name to Source Database>', job_name  => null); DBMS_DATAPUMP.ADD_FILE( handle => v_hdnl, filename => 'import_01.log', directory => 'DATA_PUMP_DIR', filetype => dbms_datapump.ku$_file_type_log_file); DBMS_DATAPUMP.METADATA_FILTER (v_hdnl, 'SCHEMA_LIST', '''<SCHEMA_1>'',''<SCHEMA_2>'', ''<SCHEMA_3>'''); -- To migrate multiple schemas DBMS_DATAPUMP.METADATA_FILTER (v_hdnl, 'EXCLUDE_PATH_EXPR','IN (''STATISTICS'')'); -- To prevent gathering Statistics during the import DBMS_DATAPUMP.SET_PARALLEL (handle => v_hdnl, degree => 4); -- Number of parallel processes performing export and import DBMS_DATAPUMP.START_JOB(v_hdnl); END; /

Código 3: migración a plena carga antes de una tarea solo de CDC, esquema de aplicación única

DECLARE v_hdnl NUMBER; BEGIN v_hdnl := DBMS_DATAPUMP.OPEN(operation => 'IMPORT', job_mode => 'SCHEMA', remote_link => '<DB LINK Name to Source Database>', job_name => null); DBMS_DATAPUMP.ADD_FILE( handle => v_hdnl, filename => 'import_01.log', directory => 'DATA_PUMP_DIR', filetype => dbms_datapump.ku$_file_type_log_file); DBMS_DATAPUMP.METADATA_FILTER(v_hdnl,'SCHEMA_EXPR','IN (''<schema_name>'')'); -- To migrate one selected schema DBMS_DATAPUMP.METADATA_FILTER (v_hdnl, 'EXCLUDE_PATH_EXPR','IN (''STATISTICS'')'); -- To prevent gathering Statistics during the import DBMS_DATAPUMP.SET_PARAMETER (handle => v_hdnl, name => 'FLASHBACK_SCN', value => <CURRENT_SCN_VALUE_IN_SOURCE_DATABASE>); -- SCN required for AWS DMS CDC only task. DBMS_DATAPUMP.SET_PARALLEL (handle => v_hdnl, degree => 4); -- Number of parallel processes performing export and import DBMS_DATAPUMP.START_JOB(v_hdnl); END; /

Código 4: migración a plena carga antes de una tarea solo de CDC, esquemas de aplicación múltiples

DECLARE v_hdnl NUMBER; BEGIN v_hdnl := DBMS_DATAPUMP.OPEN (operation => 'IMPORT', job_mode  => 'SCHEMA', remote_link => '<DB LINK Name to Source Database>', job_name => null); DBMS_DATAPUMP.ADD_FILE (handle => v_hdnl, filename => 'import_01.log', directory => 'DATA_PUMP_DIR', filetype => dbms_datapump.ku$_file_type_log_file); DBMS_DATAPUMP.METADATA_FILTER (v_hdnl, 'SCHEMA_LIST', '''<SCHEMA_1>'',''<SCHEMA_2>'', ''<SCHEMA_3>'''); -- To migrate multiple schemas DBMS_DATAPUMP.METADATA_FILTER (v_hdnl, 'EXCLUDE_PATH_EXPR','IN (''STATISTICS'')'); -- To prevent gathering Statistics during the import DBMS_DATAPUMP.SET_PARAMETER (handle => v_hdnl, name => 'FLASHBACK_SCN', value => <CURRENT_SCN_VALUE_IN_SOURCE_DATABASE>); -- SCN required for AWS DMS CDC only task. DBMS_DATAPUMP.SET_PARALLEL (handle => v_hdnl, degree => 4); -- Number of parallel processes performing export and import DBMS_DATAPUMP.START_JOB(v_hdnl); END; /

Escenario en el que un enfoque de migración mixto puede funcionar mejor

En raras ocasiones, en las que la base de datos de origen contiene tablas con millones de filas y columnas LOBSEGMENT de gran tamaño, este patrón ralentizará la migración. Oracle migra los LOBSEGMENTs a través del enlace de red de uno en uno. Extrae una sola fila (junto con los datos de la columna LOB) de la tabla de origen e inserta la fila en la tabla de destino, repitiendo el proceso hasta que se migren todas las filas. Oracle Data Pump a través del enlace de la base de datos no admite los mecanismos de carga masiva o de carga por ruta directa para LobSegments.

En las siguientes situaciones, se recomienda:

  • Omitir las tablas identificadas durante la migración de Oracle Data Pump añadiendo el siguiente filtro de metadatos.

    dbms_datapump.metadata_filter(handle =>h1, name=>'NAME_EXPR', value => 'NOT IN (''TABLE_1'',''TABLE_2'')');
  • Utilizar una tarea de AWS DMS (migración a plena carga, con replicación de CDC si es necesaria) para migrar las tablas identificadas. AWS DMS extraerá varias filas de la base de datos de Oracle de origen y las insertará en un lote en la instancia de Amazon RDS de destino, lo que mejora el rendimiento.