

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Realizar una migración de datos de gran tamaño con AWS DataSync
<a name="datasync-large-migration"></a>

Las migraciones de datos a gran escala pueden implicar la transferencia de volúmenes importantes de datos que abarcan millones de archivos u objetos en varios formatos. AWS DataSync simplifica estas transferencias complejas al gestionar la programación, la supervisión, el cifrado y la verificación de los datos.

## ¿Qué es una migración de datos a gran escala?
<a name="datasync-large-migration-definition"></a>

Una migración de datos a gran escala suele implicar la transferencia de terabytes o más de datos distribuidos en diversos orígenes hacia un nuevo entorno de almacenamiento de destino (en este caso, AWS). Estas migraciones requieren una planificación cuidadosa y coordinación dentro de la organización para trasladar los datos de forma satisfactoria y, al mismo tiempo, minimizar la interrupción del negocio.

DataSync puede simplificar estas migraciones, que suelen ser de naturaleza compleja. Algunas de las ventajas de utilizarlas DataSync para la migración son las siguientes:
+ Administración automatizada de los procesos de transferencia de datos y de la infraestructura necesaria para transferencias de datos seguras y de alto rendimiento.
+ End-to-end seguridad, que incluye el cifrado y la validación de la integridad de los datos, para garantizar que sus datos lleguen de forma segura, intacta y lista para su uso.
+ Un protocolo de red diseñado específicamente y una arquitectura paralela y con múltiples subprocesos que aceleran las migraciones.

## Etapas clave de una migración de datos a gran escala
<a name="datasync-large-migration-stages"></a>

Por lo general, es posible desglosar una migración de gran escala en las siguientes etapas:
+ **(Etapa 1) Planificación de la migración de datos**: en esta etapa, se busca comprender el motivo de la migración y el tipo de datos con los que se trabaja. Las actividades de planificación incluyen:
  + Comprender por qué se desea migrar 
  + Formar un equipo que ayude en todos los aspectos de la migración
  + Identificar las ubicaciones de los datos, los formatos y los patrones de uso
  + Evaluar los recursos de hardware disponibles y los requisitos de red (si la migración se realiza desde un centro de datos en las instalaciones)
  + Realice pruebas de concepto (POC) DataSync para estimar los plazos de migración, planificar los plazos de transición y hacerse una idea de cómo debe configurarse DataSync
+ **(Etapa 2): Implementación de la migración de datos a gran escala**: en este punto, se valida el plan y se inicia la migración. Las actividades de implementación incluyen:
  + Validar el plan de migración
  + Ejecutar transiciones por fases que incluyan la supervisión y la verificación de las transferencias de datos según lo esperado
  + Optimizar y ajustar según sea necesario entre cada transición
  + Limpiar los recursos no utilizados una vez finalizado el proceso

## Recursos adicionales
<a name="review-migration-data-resources"></a>

AWS Prescriptive Guidance cuenta con los siguientes recursos que pueden ayudarle a planificar e implementar una migración de gran tamaño. Utilice esta guía para comprender cómo DataSync puede funcionar en el contexto de procesos y actividades de migración comunes. 
+ [Grandes migraciones a la nube AWS](https://aws.amazon.com/prescriptive-guidance/large-migrations/?large-migration-strategies.sort-by=item.additionalFields.sortText&large-migration-strategies.sort-order=desc&large-migration-playbooks.sort-by=item.additionalFields.sortText&large-migration-playbooks.sort-order=desc&large-migration-patterns.sort-by=item.additionalFields.sortText&large-migration-patterns.sort-order=desc)
+ [Estrategia y mejores prácticas para migraciones de AWS gran tamaño](https://docs.aws.amazon.com/prescriptive-guidance/latest/strategy-large-scale-migrations/welcome.html)
+ [Migre sistemas de archivos compartidos en una migración AWS grande](https://docs.aws.amazon.com/prescriptive-guidance/latest/patterns/migrate-shared-file-systems-in-an-aws-large-migration.html): este recurso incluye un **libro de trabajo de SFS-Discovery** que puede descargar y usar para planificar una migración a nivel de recurso compartido de archivos.

# Etapa 1: Planificación de la migración de datos a gran escala
<a name="datasync-large-migraton-stage-1"></a>

La planificación es esencial cuando se migra un conjunto de datos grande. Debe comprender los datos que va a migrar, sus motivaciones para la migración y cómo AWS DataSync puede ayudarlo a llevar sus datos a donde los desea.

**Topics**
+ [Recopilación de requisitos para la migración](gathering-migration-requirements.md)
+ [Ejecutando una DataSync prueba de concepto](datasync-large-migration-poc.md)
+ [Estimación de los plazos de migración](datasync-large-migration-timelines.md)

# Recopilación de requisitos para la migración
<a name="gathering-migration-requirements"></a>

El primer paso en una migración de datos a gran escala requiere recopilar una variedad de información en la organización.

Esta información ayuda a crear un [proceso](https://docs.aws.amazon.com/prescriptive-guidance/latest/strategy-large-scale-migrations/process.html) de migración, que en el caso de migraciones a gran escala puede incluir múltiples transferencias y procedimientos de transición (realizados en [oleadas](https://docs.aws.amazon.com/prescriptive-guidance/latest/application-portfolio-assessment-guide/wave-planning.html)) desde el origen hasta el almacenamiento de destino.

## Comprender por qué se desea migrar
<a name="define-migration-goals-why"></a>

Antes de poder empezar a migrar a AWS, debe comprender claramente por qué está migrando sus datos. Esto ayuda a abordar desafíos comunes de la migración, como cumplir plazos, administrar recursos y coordinar equipos.

Si se necesita ayuda para determinar las motivaciones de la migración, responda a las siguientes preguntas:
+ ¿Se busca liberar espacio de almacenamiento en las instalaciones?
+ ¿Se deben cumplir plazos de contratos de soporte de hardware?
+ ¿Se trata de una salida de un centro de datos?
+ ¿Cuál es el cronograma de la migración?
+ ¿Se transfieren datos desde otro almacenamiento en la nube?
+ ¿Se migran conjuntos de datos parciales o completos?
+ ¿La migración tiene fines de archivado?
+ ¿Las aplicaciones o los usuarios requieren acceso regular a estos datos?

## Análisis de la logística
<a name="define-migration-goals-logistics"></a>

Aborde algunos aspectos logísticos básicos relacionados con el entorno de almacenamiento, la migración y la organización.

1. Obtenga una comprensión básica de la infraestructura de almacenamiento de datos actual.

1. [Compruebe si necesita un DataSync agente.](do-i-need-datasync-agent.md) Por ejemplo, se requiere un agente si la transferencia se realiza desde almacenamiento en las instalaciones.

1. Si se necesita un agente, asegúrese de comprender los [requisitos del agente](agent-requirements.md):
   + Un agente se puede ejecutar como una máquina virtual (VM) en VMware ESXi, una máquina virtual basada en el kernel (KVM) de Linux o hipervisores de Microsoft Hyper-V. También puede implementar un agente como una instancia de Amazon EC2 dentro de AWS.
   + Las migraciones a gran escala suelen requerir un uso intensivo de memoria. Asegúrese de que el agente disponga de suficiente memoria RAM.

1. Identifique a las partes interesadas clave de los equipos de dirección, redes, almacenamiento y TI que deben participar en la migración. Esto puede incluir:
   + Designe un [líder de subproceso único](https://docs.aws.amazon.com/prescriptive-guidance/latest/strategy-large-scale-migrations/people.html) dedicado al proyecto y a sus resultados.
   + Determine quién es responsable de la titularidad y la clasificación de los datos que se migran.
   + Identifique quién administra su fuente y quién administrará eventualmente el servicio AWS de almacenamiento al que está migrando.
   + Descubra quién creará y administrará cualquier otro proceso para sus datos una vez que estén disponibles. AWS

1. Establezca canales de comunicación entre departamentos.

1. Cree un plan de reversión para contingencias.

1. Documente el proceso completo de migración, incluidas las oleadas, la validación y los procedimientos de transición. Use este recurso como manual de procedimientos para toda la migración. Actualizará este proceso a medida que se planifique e implemente la migración.

## Revisión de los datos que se migran
<a name="review-migration-data"></a>

Trabaje con los equipos de almacenamiento y de aplicaciones para analizar las características de los datos que se migran. Esta información le ayuda a determinar una estrategia de migración que pueda utilizar DataSync.

**Contents**
+ [Determinación de los patrones de uso de los datos](#review-migration-data-usage)
+ [Identificación de la estructura y el diseño de los datos](#review-migration-data-structure)
+ [Documentación de recursos compartidos y carpetas](#review-migration-data-document-shares)
+ [Análisis de los tamaños de archivo](#review-migration-data-file-sizes)

### Determinación de los patrones de uso de los datos
<a name="review-migration-data-usage"></a>
+ En el caso de los datos de uso activo con modificaciones frecuentes, planifique varias oleadas de transferencias incrementales a fin de evitar interrupciones en las operaciones del negocio.
+ En el caso de los datos de solo lectura que se pueden considerar de archivo, es posible que no sea necesario planificar oleadas.
+ Si existe una combinación de patrones de uso de datos, planifique oleadas que migren estos distintos conjuntos de datos por separado. Por ejemplo, puede definir una oleada para los datos de archivo y dedicar el resto de las oleadas a la migración de los datos activos.

### Identificación de la estructura y el diseño de los datos
<a name="review-migration-data-structure"></a>
+ Determine si los datos están organizados por periodos de tiempo (año, mes, día) u otros patrones.
+ Use esta estructura de organización para planificar las oleadas de la migración. Por ejemplo, puede migrar los datos de archivo correspondientes a un año completo durante una sola oleada.

### Documentación de recursos compartidos y carpetas
<a name="review-migration-data-document-shares"></a>
+ Cree un inventario de los recursos compartidos y las carpetas (incluidos los recuentos de archivos u objetos de cada uno).
+ Identifique los recursos compartidos y las carpetas con conjuntos de datos activos. Es posible que estos requieran transferencias incrementales durante la migración.
+ Revise las [DataSync cuotas](datasync-limits.md). Esto puede ayudarle a planificar cómo particionar el conjunto de datos durante la configuración DataSync.

### Análisis de los tamaños de archivo
<a name="review-migration-data-file-sizes"></a>
+ Se espera un mayor rendimiento de transferencia de datos para archivos de mayor tamaño (MB o GB) en comparación con archivos más pequeños (KB).
+ Si trabaja con muchos archivos más pequeños, espere más operaciones de metadatos en su sistema de almacenamiento y un menor rendimiento de datos. DataSyncrealiza estas operaciones al comparar y verificar las ubicaciones de origen y destino.

## Identificación de los requisitos de almacenamiento
<a name="determine-storage-requirements"></a>

Para elegir un servicio AWS de almacenamiento compatible para migrar sus datos, debe evaluar las características y el rendimiento del sistema de almacenamiento de origen.

Esta información también puede ayudarlo a [programar las transferencias](task-scheduling.md) a fin de minimizar el impacto en las operaciones del negocio durante la migración.

**Contents**
+ [Determinación de la compatibilidad del almacenamiento de origen](#determine-storage-requirements-protocols)
+ [Revisión de los requisitos de conservación de metadatos](#determine-storage-requirements-metadata)
+ [Recopilación de métricas de rendimiento del almacenamiento de origen](#determine-storage-requirements-performance)
+ [Elegir un servicio de AWS almacenamiento de destino](#determine-storage-requirements-destination)

### Determinación de la compatibilidad del almacenamiento de origen
<a name="determine-storage-requirements-protocols"></a>

DataSync puede funcionar con una variedad de sistemas de almacenamiento que permiten el acceso a través de clientes de almacenamiento de objetos compatibles con NFS, SMB, HDFS y S3. 

Si vas a migrar desde otro almacenamiento en la nube, comprueba que funcione con ese DataSync proveedor. Para obtener una lista de ubicaciones de origen compatibles, consulte [¿Dónde puedo transferir mis datos AWS DataSync?](working-with-locations.md)

### Revisión de los requisitos de conservación de metadatos
<a name="determine-storage-requirements-metadata"></a>

DataSync puede conservar los metadatos de tus archivos u objetos durante una transferencia. La forma en que se conservan los metadatos depende de las ubicaciones de transferencia y de si dichas ubicaciones usan tipos de metadatos similares.

DataSync en algunos casos, necesita permisos adicionales para conservar los metadatos de los archivos, como las listas de acceso discrecional de NTFS ()DACLs.

Para obtener más información, consulte [Comprender cómo se DataSync gestionan los metadatos de archivos y objetos](metadata-copied.md).

### Recopilación de métricas de rendimiento del almacenamiento de origen
<a name="determine-storage-requirements-performance"></a>

Mida la línea base de operaciones de entrada/salida por segundo (IOPS) y el rendimiento del disco durante cargas de trabajo promedio y de pico en el almacenamiento de origen. La transferencia de datos supone una I/O sobrecarga para los sistemas de almacenamiento de origen y destino.

Compare estos datos de rendimiento con las especificaciones del sistema de almacenamiento para determinar los recursos de rendimiento disponibles.

### Elegir un servicio de AWS almacenamiento de destino
<a name="determine-storage-requirements-destination"></a>

En este punto, es posible que tenga una idea de qué servicio de AWS almacenamiento es adecuado para sus datos. De lo contrario, los patrones de uso de los datos y el rendimiento del almacenamiento son dos aspectos clave que conviene considerar al tomar la decisión. Por ejemplo, podría considerar Amazon S3 si tiene datos archivados y Amazon FSx o Amazon EFS para los datos activos.

Para ayudarle a decidir el almacenamiento basado en objetos o archivos adecuado para sus datos, consulte [Elegir un servicio AWS de almacenamiento](https://docs.aws.amazon.com/decision-guides/latest/storage-on-aws-how-to-choose/choosing-aws-storage-service.html).

## Determinación de los requisitos de red
<a name="datasync-migration-network-requirements"></a>

Para migrar sus datos DataSync, debe establecer conexiones de red entre el almacenamiento de origen, el agente y AWS. También es necesario planificar suficiente ancho de banda de la red e infraestructura.

Trabaje con los ingenieros de red y los administradores de almacenamiento para identificar los siguientes requisitos de red.

**Contents**
+ [Evaluación del ancho de banda de la red disponible](#datasync-migration-network-bandwidth)
+ [¿Está considerando las opciones para conectar su red a AWS](#datasync-migration-network-connection-options)
+ [Selección de un punto de conexión de servicio para la comunicación del agente](#datasync-migration-network-service-endpoint)
+ [Planificación de una infraestructura de red suficiente](#datasync-migration-network-interfaces)

### Evaluación del ancho de banda de la red disponible
<a name="datasync-migration-network-bandwidth"></a>

El ancho de banda de la red disponible influye en las velocidades de transferencia y en la duración total de la migración. Si la transferencia se realiza desde un sistema de almacenamiento en las instalaciones, realice lo siguiente: 
+ Trabaje con el equipo de red para determinar el uso promedio y máximo del ancho de banda. 
+ Identifique intervalos de tiempo en los que sea posible transferir datos y evitar interrupciones en las operaciones diarias. Esto permite definir cuándo se llevarán a cabo las oleadas de migración y las transiciones.

Puede controlar cuánto ancho de banda DataSync utiliza. Para obtener más información, consulte [Establecer límites de ancho de banda para su tarea AWS DataSync](configure-bandwidth.md).

Dado que las transferencias desde almacenamiento en otras nubes se suelen realizar a través de Internet público, por lo general existen menos restricciones y consideraciones de ancho de banda en este tipo de transferencias.

### ¿Está considerando las opciones para conectar su red a AWS
<a name="datasync-migration-network-connection-options"></a>

Ten en cuenta las siguientes opciones para establecer la conectividad de red para tu DataSync transferencia:
+ **Direct Connect**- Revise los [ejemplos de arquitectura y enrutamiento](direct-connect-architecture.md) para usar Direct Connect with DataSync. Puedes monitorizar la actividad de Direct Connect a través de [Amazon CloudWatch](https://docs.aws.amazon.com/directconnect/latest/UserGuide/monitoring-cloudwatch.html).
+ **VPN**: [AWS Site-to-Site VPN](https://docs.aws.amazon.com/vpn/latest/s2svpn/VPC_VPN.html) ofrece hasta 1,25 Gbps de rendimiento por túnel.
+ **Internet público**: póngase en contacto con el proveedor de servicios de Internet para obtener datos de uso de red.

### Selección de un punto de conexión de servicio para la comunicación del agente
<a name="datasync-migration-network-service-endpoint"></a>

DataSync los agentes utilizan los [puntos finales del servicio](choose-service-endpoint.md) para comunicarse con el DataSync servicio. El tipo de punto de conexión que se utilice depende de la forma en que se establezca conexión entre la red y AWS

### Planificación de una infraestructura de red suficiente
<a name="datasync-migration-network-interfaces"></a>

Para cada tarea de transferencia que cree, genera y administra DataSync automáticamente la infraestructura de red para las transferencias de datos. Esta infraestructura se conoce como *interfaces de red* o *interfaces de red elásticas*, que son componentes de red lógicos dentro de una nube privada virtual (VPC) de Amazon y representan tarjetas de red virtuales. Para obtener más información, consulte la [https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/using-eni.html](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/using-eni.html).

Cada interfaz de red usa una única dirección IP en la subred de VPC de destino. Para asegurarse de contar con suficiente infraestructura de red para la migración, realice lo siguiente:
+ Anote la cantidad de [interfaces de red](required-network-interfaces.md) que DataSync se crearán para su ubicación de DataSync destino.
+ Asegúrese de que la subred tenga suficientes direcciones IP para sus DataSync tareas. Por ejemplo, una tarea que usa un agente requiere cuatro direcciones IP. Si se crean cuatro tareas para la migración, esto significa que se necesitan 16 direcciones IP disponibles en la subred. 

# Ejecutando una DataSync prueba de concepto
<a name="datasync-large-migration-poc"></a>

La ejecución de una prueba de concepto (POC) le AWS DataSync ayuda a validar los siguientes aspectos de la planificación de la migración de datos:
+ Verificar la conectividad de red entre las ubicaciones de origen y destino.
+ Valide la configuración inicial de DataSync la tarea.
+ Medir el desempeño de la transferencia de datos.
+ Estimar los plazos de migración.
+ Definir los criterios de éxito con las partes interesadas clave que participan en la migración.

## Introducción a la prueba de concepto
<a name="datasync-large-migration-poc-getting-started"></a>

1. Cree su DataSync agente:

   1. [Implemente el agente](deploy-agents.md).

   1. [Seleccione un punto de conexión de servicio](choose-service-endpoint.md) para el agente.

   1. [Activación del agente](activate-agent.md).

   1. [Verifique las conexiones de red del agente](test-agent-connections.md).

1. Seleccione un subconjunto pequeño de datos que represente los datos que se migran.

   Por ejemplo, si el almacenamiento de origen incluye una combinación de archivos grandes y pequeños, el subconjunto de datos que se transfiera en la prueba de concepto debe reflejar esa combinación. Esto le proporciona una comprensión preliminar del rendimiento de los sistemas de almacenamiento, su red y DataSync.

1. Cree una ubicación DataSync de origen para su sistema de almacenamiento [local](transferring-on-premises-storage.md) u [otro sistema de almacenamiento en la nube](transferring-other-cloud-storage.md).

1. Cree una ubicación de DataSync destino para su [servicio AWS de almacenamiento.](transferring-aws-storage.md)

1. [Cree una tarea DataSync de transferencia](create-task-how-to.md) con un [filtro](filtering.md) que solo transfiera su subconjunto de datos.

1. [Comience su DataSync tarea.](run-task.md)

1. Recopile métricas de rendimiento de la transferencia mediante la supervisión de lo siguiente:
   + El rendimiento de datos y de archivos de la ejecución de la tarea. Puede hacerlo a través de la DataSync consola o la [DescribeTaskExecution](https://docs.aws.amazon.com/datasync/latest/userguide/API_DescribeTaskExecution.html)operación. Si se utiliza `DescribeTaskExecution`, estas métricas se calculan de la siguiente manera:
     + **Rendimiento de datos**: se divide `BytesWritten` entre `TransferDuration`
     + **Rendimiento de archivos**: se divide `FilesTransferred` entre `TransferDuration`
   + Utilización del almacenamiento de origen y destino. Trabaje estrechamente con los administradores de almacenamiento para obtener esta información.
   + Uso de la red

1. Verifique los datos transferidos en la ubicación de destino:
   + Revise sus CloudWatch registros para ver si hay errores en la ejecución de las tareas.
   + Verifique que los permisos y los metadatos se conserven en la ubicación de destino.
   + Confirme que las aplicaciones y los usuarios puedan acceder a los datos de destino según lo previsto.
   + Aborde cualquier problema que se presente. Para obtener más información, consulte [Solución de AWS DataSync problemas](troubleshooting-datasync.md).

1. Ejecute la tarea unas cuantas veces más para tener una idea del tiempo que lleva DataSync  preparar, transferir y verificar los datos. (Para obtener más información, consulte [Estados de ejecución de las tareas](run-task.md#understand-task-execution-statuses)).

   Si ejecutas una tarea más de una vez, de forma DataSync predeterminada, realiza una transferencia incremental y copia solo los datos que han cambiado con respecto a la ejecución anterior de la tarea.

   Si bien es probable que el tiempo de transferencia sea más corto para las transferencias incrementales, siempre DataSync preparará la transferencia de la misma manera escaneando y comparando las ubicaciones para identificar qué desea transferir. Puede usar estos tiempos de preparación para [estimar los plazos de transición](datasync-large-migration-timelines.md#datasync-large-migration-cutover-timelines) de la migración.

1. Si es necesario, actualice el plan de migración en función de lo aprendido durante la prueba de concepto (POC).

# Estimación de los plazos de migración
<a name="datasync-large-migration-timelines"></a>

Con la información recopilada hasta este punto, es posible estimar cuánto tiempo tomará la migración mediante AWS DataSync.

## Estimación de los plazos de transferencia de datos
<a name="datasync-large-migration-transfer-timelines"></a>

Puede estimar el tiempo que se tarda en DataSync transferir sus datos en función de la siguiente información que recopiló durante la recopilación de los requisitos de migración y su DataSync prueba de concepto (POC):
+ [Ancho de banda de la red disponible](gathering-migration-requirements.md#datasync-migration-network-bandwidth)
+ Métricas de utilización del almacenamiento de origen y de destino
+ [Métricas de rendimiento de su POC DataSync ](datasync-large-migration-poc.md)

**Para estimar el plazo de transferencia de datos**

1. Compare el rendimiento de datos y de archivos obtenido en la prueba de concepto (POC) con el ancho de banda de la red disponible.

1. Si su rendimiento es inferior al ancho de banda disponible (por ejemplo, 300 MiB/s para un rendimiento con un ancho de banda de red de 10 Gbps), considere la posibilidad de dividir el conjunto de datos en varias tareas para maximizar el uso del ancho de banda.

   DataSync tiene algunas opciones para particionar el conjunto de datos. Para obtener más información, consulte [Aceleración de la migración con particionamiento de datos](datasync-large-migration-data-partitioning.md).

1. Calcule cuántos días dura una transferencia mediante la siguiente fórmula, que proporciona un tiempo de transferencia mínimo teórico:

   ```
   (DATA_SIZE * 8 bits per byte)/(CIRCUIT * NETWORK_UTILIZATION percentage * 3600 seconds per hour * AVAILABLE_HOURS) = Number of days
   ```

   Al usar esta fórmula, sustituya los siguientes valores por los suyos propios:
   + `DATA_SIZE`: la cantidad de datos que se migran (expresada en bytes).
   + `CIRCUIT`: el ancho de banda de la red disponible (expresado en bits por segundo).
   + `NETWORK_UTILIZATION`: el porcentaje de la red que se utiliza.
   + `AVAILABLE_HOURS`: el número de horas operativas disponibles cada día.

   Por ejemplo, una migración con 100 TB de datos, una conexión a Internet de 1 Gbps, un 80 % de utilización de la red y disponibilidad de 24 horas al día se calcularía de la siguiente manera:

   `(100,000,000,000,000 bytes * 8) / (1,000,000,000 bps * 0.80 * 3600 * 24) = 11.57 days`

   En este caso, la migración tardaría casi 12 días antes de tener en cuenta las condiciones reales.

1. Ajuste la duración de transferencia calculada para reflejar las condiciones reales, como las siguientes:
   + Fluctuaciones del rendimiento de la red
   + Variaciones en el rendimiento de almacenamiento
   + Tiempo de inactividad entre oleadas de migración

## Estimación de los plazos de transición
<a name="datasync-large-migration-cutover-timelines"></a>

Si se migran conjuntos de datos activos, es probable que se requieran transiciones para no interrumpir las operaciones del negocio.

No subestime el tiempo que requieren las transiciones. En migraciones de gran escala, no es inusual que las actividades de transición representen hasta el 30 % del tiempo total de la migración.

1. Evalúe si es necesario realizar transiciones por oleadas para reducir la cantidad de datos analizados en busca de cambios incrementales.

   Una estrategia para lograrlo consiste en realizar la transición de conjuntos de datos particionados según recursos compartidos, carpetas o sistemas de almacenamiento.

1. Revisa cuánto tiempo se tarda normalmente en DataSync preparar, transferir y verificar los datos durante la POC.

   Preste especial atención a las duraciones de preparación de las ejecuciones de las tareas. Para obtener esta información, ejecute la [DescribeTaskExecution](https://docs.aws.amazon.com/datasync/latest/userguide/API_DescribeTaskExecution.html)operación y, a continuación, compruebe el valor del [PrepareDuration](https://docs.aws.amazon.com/datasync/latest/userguide/API_TaskExecutionResultDetail.html#DataSync-Type-TaskExecutionResultDetail-PrepareDuration)tiempo de duración (en milisegundos).

1. Estime cuánto tiempo puede requerir una transición mediante la medición de la diferencia de tiempo entre tareas paralelas.

   Para obtener más información sobre tareas paralelas, consulte [Aceleración de la migración con particionamiento de datos](datasync-large-migration-data-partitioning.md).

1. Use la estimación de la transición para programar las transiciones. Estas, en esencia, son intervalos de mantenimiento durante los cuales los datos de origen no se pueden modificar.

## Siguientes pasos
<a name="estimate-cutover-timelines-next-steps"></a>

Tras estimar los plazos, ya se encuentra en condiciones de comenzar la implementación de la migración.

# Etapa 2: Implementación de la migración de datos a gran escala
<a name="datasync-large-migraton-stage-2"></a>

Con la información que recopiló durante la planificación, puede empezar AWS DataSync a utilizarla para migrar a su nuevo sistema de almacenamiento. Si aún no lo ha hecho, se recomienda revisar los [recursos de la Guía prescriptiva de AWS para migraciones a gran escala](datasync-large-migration.md#review-migration-data-resources).

**Topics**
+ [Aceleración de la migración con particionamiento de datos](datasync-large-migration-data-partitioning.md)
+ [Ejecutar las tareas de transferencia DataSync](datasync-large-migration-running-tasks.md)
+ [Supervisión de las transferencias](datasync-large-migration-monitoring.md)

# Aceleración de la migración con particionamiento de datos
<a name="datasync-large-migration-data-partitioning"></a>

En el caso de una migración a gran escala, recomendamos particionar el conjunto de datos con varias DataSync tareas. El particionamiento de los datos de origen en varias tareas (y, posiblemente, agentes) permite paralelizar las transferencias y reducir el plazo de la migración.

La partición también te ayuda a mantenerte dentro de DataSync [las cuotas](datasync-limits.md) y simplifica la supervisión y la depuración de tus tareas. 

El siguiente diagrama muestra cómo puede utilizar varias DataSync tareas y agentes para transferir datos desde la misma ubicación de almacenamiento de origen. En este escenario, cada tarea se centra en una carpeta específica en la ubicación de origen. Para obtener más información y ejemplos sobre estos enfoques, consulte [Cómo acelerar las transferencias de datos con arquitecturas AWS DataSync escalables](https://aws.amazon.com/blogs/storage/how-to-accelerate-your-data-transfers-with-aws-datasync-scale-out-architectures/).

![\[Un diagrama que muestra un enfoque DataSync para particionar los datos de origen a fin de acelerar una migración a gran escala.\]](http://docs.aws.amazon.com/es_es/datasync/latest/userguide/images/datasync-partition-by-folder.png)


## Particionamiento del conjunto de datos por carpeta o prefijo
<a name="configure-task-by-folder"></a>

Al crear la ubicación de DataSync origen, puede especificar una carpeta, un directorio o un prefijo desde el que DataSync leer. Por ejemplo, si se migra un recurso compartido de archivos con directorios de nivel superior, puede crear varias ubicaciones que especifiquen rutas de directorio diferentes. A continuación, puede utilizar estas ubicaciones para ejecutar varias DataSync tareas durante la migración.

## Particionamiento del conjunto de datos mediante filtros
<a name="configure-task-with-filters"></a>

Puede aplicar [filtros](filtering.md) para incluir o excluir datos de la ubicación de origen en una transferencia. En el contexto de una migración a gran escala, los filtros pueden ayudar a delimitar las tareas a partes específicas del conjunto de datos.

Por ejemplo, si se migran datos de archivo organizados por año, puede crear un filtro de inclusión que coincida con un año específico o con varios años. También puede modificar el filtro cada vez que se ejecute la tarea para que coincida con un año diferente.

## Particionamiento del conjunto de datos mediante manifiestos
<a name="configure-task-with-manifest"></a>

Un [manifiesto](transferring-with-manifest.md) es una lista de archivos u objetos que DataSync deseas transferir. Con un manifiesto, DataSync no es necesario leer todo lo que hay en la ubicación de origen para determinar qué se va a transferir.

Puede crear manifiestos a partir de los inventarios de su almacenamiento de origen o mediante enfoques basados en eventos (por ejemplo, consulte [Implementación AWS DataSync con cientos de millones de objetos](https://aws.amazon.com/blogs/storage/implementing-aws-datasync-with-hundreds-of-millions-of-objects/)). También puede usar un manifiesto diferente cada vez que inicie una tarea, lo que permite transferir distintos conjuntos de datos con la misma tarea.

# Ejecutar las tareas de transferencia DataSync
<a name="datasync-large-migration-running-tasks"></a>

Durante cada una de las oleadas de migración, la transferencia de datos suele seguir el mismo proceso general:

1. Ejecutar una transferencia inicial completa de los datos.

1. Verificar los datos en el destino.

1. Ejecutar transferencias incrementales para cualquier dato que haya cambiado desde la transferencia inicial.

1. Operaciones de transición hacia la ubicación de destino

1. Revise los resultados de la transición.

## Ejecución de las tareas
<a name="datasync-large-migration-running-tasks-how-to"></a>

Es probable que tengas que ejecutar las tareas de DataSync transferencia durante el horario laboral para minimizar el tiempo total de migración. En estas situaciones, es habitual ejecutar una transferencia inicial completa, seguida de transferencias incrementales que tienen en cuenta los cambios en la ubicación de origen realizados por usuarios y aplicaciones.

Para evitar problemas relacionados con la red durante el horario laboral, puede limitar la cantidad de ancho de banda que utilizan las tareas. Para obtener más información, consulte [Establecer límites de ancho de banda para su tarea AWS DataSync](configure-bandwidth.md).

1. Ejecución de una transferencia inicial completa:

   1. [Comienza tu DataSync tarea](run-task.md) (o tareas si las ejecutas en paralelo).

   1. Supervise el progreso y el rendimiento de las ejecuciones de la tarea.

   1. Verifique que los datos se hayan transferido conforme a lo esperado (por ejemplo, que se conserven los metadatos de los archivos).

1. Ejecución de transferencias incrementales:

   1. [Programe las tareas](task-scheduling.md) para que se ejecuten de forma periódica.

   1. Supervise las ejecuciones de las tareas y corrija los errores si se presentan.

## Realización de la transición
<a name="datasync-migration-cutting-over-how-to"></a>

Tras completar las transferencias iniciales e incrementales, puede iniciar el proceso de las operaciones de transición hacia la ubicación de destino.

1. Inicie el periodo de mantenimiento programado.

1. Actualice el sistema de almacenamiento de origen para que sea de solo lectura para aplicaciones y usuarios.

1. Ejecute las transferencias incrementales finales para copiar los deltas restantes entre las ubicaciones de origen y destino.

1. Realiza una validación exhaustiva de los datos (por ejemplo, revisando CloudWatch los registros y los [informes de tareas](task-reports.md)).

1. Cambie las aplicaciones y los usuarios al nuevo entorno de la ubicación de destino.

1. Pruebe la funcionalidad de las aplicaciones y asegúrese de que los usuarios puedan acceder a los datos en la ubicación de destino.

1. Programe una reunión retrospectiva para revisar la transferencia con los equipos de migración. Plantee las siguientes preguntas de muestra para el análisis:
   + ¿La transición se realizó correctamente? En caso contrario, ¿cuál fue el problema?
   + ¿Se utilizó todo el ancho de banda disponible?
   + ¿Se utilizaron plenamente los sistemas de almacenamiento de origen y destino?
   + ¿Es posible obtener un mayor rendimiento de datos mediante tareas adicionales?
   + ¿Es necesario planificar un periodo de mantenimiento más largo?

1. Si es necesario, actualice el plan de migración antes de iniciar la siguiente oleada.

# Supervisión de las transferencias
<a name="datasync-large-migration-monitoring"></a>

AWS DataSync proporciona varias opciones de supervisión para ayudarte a validar y depurar tu transferencia.

## Monitoriza tus transferencias con métricas CloudWatch
<a name="datasync-migration-monitoring-cloudwatch-metrics"></a>

Puedes crear CloudWatch paneles personalizados con métricas de la ejecución de tus DataSync tareas. Para obtener más información, consulte [Supervisión de transferencias de datos con métricas de Amazon CloudWatch](monitor-datasync.md).

## Supervisión de transferencias de con informes de tareas
<a name="datasync-migration-monitoring-task-reports"></a>

Si se transfieren millones de archivos u objetos, conviene considerar el uso de informes de tareas. Los informes de tareas proporcionan información detallada sobre lo que se DataSync intenta transferir, omitir, verificar y eliminar durante la ejecución de una tarea. Para obtener más información, consulte [Supervisión de las transferencias de datos con informes de tareas](task-reports.md).

También puede visualizar sus informes de tareas mediante AWS servicios como AWS Glue Amazon Athena y Amazon Quick. Para obtener más información, consulte [Blog de almacenamiento de AWS](https://aws.amazon.com/blogs/storage/derive-insights-from-aws-datasync-task-reports-using-aws-glue-amazon-athena-and-amazon-quicksight/).

## Supervise sus transferencias con Logs CloudWatch
<a name="datasync-migration-monitoring-cloudwatch-logs"></a>

Como mínimo, se recomienda configurar la tarea para que registre información básica y errores de transferencia. Para obtener más información, consulte [Supervisión de las transferencias de datos con Amazon CloudWatch Logs](configure-logging.md).