Observaciones sobre la exportación de un clúster de base de datos
Utilice las siguientes secciones para obtener información sobre las limitaciones, las convenciones de nomenclatura de archivos y la conversión y el almacenamiento de datos al exportar datos de clústeres de bases de datos a Amazon S3.
Temas
Limitaciones
La exportación de datos de clústeres de base de datos a Amazon S3 tiene las siguientes limitaciones:
-
No puede ejecutar varias tareas de exportación para el mismo clúster de base de datos simultáneamente. Esto es cierto para las exportaciones completas y parciales.
-
Puede tener hasta cinco tareas de exportación de instantáneas de base de datos en curso por Cuenta de AWS.
-
Los clústeres de base de datos de Aurora Serverless v1 no admiten la exportación a S3.
-
Aurora MySQL y Aurora PostgreSQL admiten exportaciones a S3 solo para el modo de motor aprovisionado.
-
Las exportaciones a S3 no admiten prefijos S3 que contengan dos puntos (:).
-
Los siguientes caracteres en la ruta del archivo S3 se convierten en guiones bajos (_) durante la exportación:
\ ` " (space)
-
Si una base de datos, esquema o tabla tiene caracteres en su nombre distintos del siguiente, no se admite la exportación parcial. Sin embargo, puede exportar todo el clúster de base de datos.
-
Letras latinas (A–Z)
-
Dígitos (0–9)
-
Símbolo de dólar ($)
-
Guion bajo (_)
-
-
No se admiten espacios ( ) ni determinados caracteres en los nombres de columna de las tablas de bases de datos. Las tablas con los siguientes caracteres en los nombres de columna se omiten durante la exportación:
, ; { } ( ) \n \t = (space)
-
Las tablas con barras diagonales (/) en el nombre se omiten durante la exportación.
-
Las tablas temporales y no registradas de Aurora PostgreSQL se omiten durante la exportación.
-
Si los datos contienen un objeto grande, como un BLOB o CLOB, cercano o superior a 500 MB, se producirá un error en la exportación.
-
Si una tabla contiene una fila grande cercana o superior a 2 GB, la tabla se omite durante la exportación.
-
Para exportaciones parciales, la lista
ExportOnly
tiene un tamaño máximo de 200 KB. -
Es muy recomendable que utilice un nombre exclusivo para cada tarea de exportación. Si no utiliza un nombre de tarea exclusivo, es posible que aparezca el siguiente mensaje de error como el que sigue:
exportTaskAlreadyExistsFault: Se ha producido un error (exportTaskAlReadyExists) al llamar a la operación StartExportTask: la tarea de exportación con ID
xxxxx
ya existe. -
Dado que es posible que se omitan algunas tablas, le recomendamos que verifique los recuentos de filas y tablas de los datos después de la exportación.
Convención de nomenclatura de archivos
Los datos exportados para tablas específicas se almacenan en el formato
, donde el prefijo base es el siguiente:base_prefix
/files
export_identifier
/database_name
/schema_name
.table_name
/
Por ejemplo:
export-1234567890123-459/rdststcluster/mycluster.DataInsert_7ADB5D19965123A2/
Los archivos de salida utilizan la siguiente convención de nomenclatura, donde partition_index
es alfanumérico:
partition_index
/part-00000-random_uuid
.format-based_extension
Por ejemplo:
1/part-00000-c5a881bb-58ff-4ee6-1111-b41ecff340a3-c000.gz.parquet a/part-00000-d7a881cc-88cc-5ab7-2222-c41ecab340a4-c000.gz.parquet
La convención de nomenclatura de archivos está sujeta a cambios. Por lo tanto, cuando lea tablas de destino, recomendamos que lea todo lo que hay dentro del prefijo base de la tabla.
Formato de almacenamiento y conversión de datos
Cuando exporta un clúster de base de datos a un bucket de Amazon S3, Amazon Aurora convierte, exporta y almacena los datos con el formato Parquet. Para obtener más información, consulte Conversión de datos al exportar a un bucket de Amazon S3.