Solución de la desduplicación de datos
Use la siguiente información como ayuda para solucionar algunos problemas comunes al configurar y usar la desduplicación de datos.
Temas
La desduplicación de datos no funciona
Para ver el estado actual de la desduplicación, ejecute el comando Get-FSxDedupStatus
de PowerShell para ver el estado de finalización de los trabajos de desduplicación más recientes. Si una o más tareas fallan, es posible que no vea un aumento en la capacidad de almacenamiento libre del sistema de archivos.
La razón más común por la que fallan las tareas de desduplicación es la falta de memoria.
Microsoft recomienda
disponer de forma óptima de 1 GB de memoria por cada 1 TB de datos lógicos (o un mínimo de 350 MB por 1 TB de datos lógicos). Utilice la tabla de rendimiento de Amazon FSx para determinar la memoria asociada a la capacidad de rendimiento del sistema de archivos, y asegurarse de que los recursos de memoria sean suficientes para el tamaño de los datos. Si no es así, debe aumentar la capacidad de rendimiento del sistema de archivos hasta un nivel que cumpla con los requisitos de memoria de 1 GB por 1 TB de datos lógicos. Las tareas de desduplicación se configuran con la asignación de memoria predeterminada del 25% que recomienda Windows. Esto significa que, para un sistema de archivos con 32 GB de memoria, habrá 8 GB disponibles para la desduplicación. La asignación de memoria es configurable (mediante el comando
Set-FSxDedupSchedule
con el parámetro–Memory
). Tenga en cuenta que el uso de una mayor asignación de memoria para la desduplicación puede afectar al rendimiento del sistema de archivos.Puede modificar la configuración de las tareas de desduplicación para reducir la cantidad de memoria requerida. Por ejemplo, puede restringir la optimización para que se solo ejecute en tipos de archivos o carpetas específicos, o puede establecer un mínimo para el tamaño y la antigüedad de los archivos que se van a optimizar. También, recomendamos establecer una configuración para que las tareas de desduplicación se ejecuten durante los períodos de inactividad, cuando la carga del sistema de archivos sea mínima.
También, es posible que se produzcan errores si las tareas de desduplicación no tienen tiempo suficiente para completarse. Es posible que tenga que cambiar la duración máxima de las tareas, como se describe en Modificar un programa de deduplicación de datos.
Si las tareas de desduplicación estuvieron fallando durante un tiempo prolongado, y se cambiaron los datos del sistema de archivos durante este período, es posible que las tareas de desduplicación posteriores requieran más recursos para completarse correctamente por primera vez.
Los valores de desduplicación se establecen en 0 de forma inesperada
De manera inesperada, los valores del SavedSpace
y la OptimizedFilesSavingsRate
se encuentran en 0, en un sistema de archivos en el cual configuró la desduplicación de datos.
Esto puede ocurrir durante el proceso de optimización del almacenamiento cuando se aumenta la capacidad de almacenamiento del sistema de archivos. Al aumentar la capacidad de almacenamiento de un sistema de archivos, Amazon FSx cancela las tareas de desduplicación de los datos existentes durante el proceso de optimización del almacenamiento, que migra los datos de los discos antiguos a los discos nuevos de mayor tamaño. Amazon FSx reanuda la desduplicación de datos en el sistema de archivos una vez finalizado la tarea de optimización del almacenamiento. Para obtener más información sobre el aumento de la capacidad de almacenamiento y la optimización, consulte Administración de la capacidad de almacenamiento.
Aunque se eliminan los archivos, no se libera espacio en el sistema de archivos
El comportamiento esperado de la desduplicación de datos es el siguiente: si los datos que se eliminaron eran una forma de ahorro de espacio realizado por la desduplicación, entonces realmente se liberará espacio en el sistema de archivos cuando se ejecute la recopilación de elementos no utilizados.
Una práctica que puede resultarle útil consiste en programar la ejecución de la recopilación de elementos no utilizados para inmediatamente después de eliminar un gran número de archivos. Una vez finalizada la recopilación de elementos no utilizados, puede volver a establecer la programación de dicha recopilación a la configuración original. Esto garantiza que pueda ver el espacio de que generan las eliminaciones de forma inmediata.
Use el siguiente procedimiento para configurar la recopilación de elementos no utilizados para que se ejecute en 5 minutos.
Para comprobar que la desduplicación de datos esté habilitada, utilice el comando
Get-FSxDedupStatus
. Para obtener más información acerca del comando y el resultado esperado, consulte Visualización de la cantidad de espacio ahorrado.-
Utilice lo siguiente para programar la ejecución de la recopilación de elementos no utilizados dentro de 5 minutos.
$FiveMinutesFromNowUTC = ((get-date).AddMinutes(5)).ToUniversalTime() $DayOfWeek = $FiveMinutesFromNowUTC.DayOfWeek $Time = $FiveMinutesFromNowUTC.ToString("HH:mm") Invoke-Command -ComputerName ${RPS_ENDPOINT} -ConfigurationName FSxRemoteAdmin -ScriptBlock { Set-FSxDedupSchedule -Name "WeeklyGarbageCollection" -Days $Using:DayOfWeek -Start $Using:Time -DurationHours 9 }
-
Una vez que se haya ejecutado la recopilación de elementos no utilizados, y se haya liberado espacio, restablezca la programación a su configuración original.