Exportación de datos del clúster de base de datos a Amazon S3
Puede exportar datos desde un clúster de base de datos de Amazon Aurora activo a un bucket de Amazon S3. El proceso de exportación se ejecuta en segundo plano y no afecta al rendimiento del clúster de la base de datos activa.
De forma predeterminada, se exportan todos los datos del clúster de base de datos. Sin embargo, también puede optar por exportar conjuntos específicos de bases de datos, esquemas o tablas.
Amazon Aurora clona el clúster de base de datos, extrae los datos del clon y los almacena en un bucket de Amazon S3. Los datos se almacenan en formato Apache Parquet comprimido y consistente. Los archivos individuales de Parquet suelen tener un tamaño de entre 1 y 10 MB.
El rendimiento más rápido que se puede obtener al exportar datos de instantáneas para las versiones 2 y 3 de Aurora MySQL no se aplica a la exportación de datos de clústeres de bases de datos. Para obtener más información, consulte Exportación de datos de instantánea del clúster de bases de datos a Amazon S3.
Se le cobrará por exportar todo el clúster de base de datos, ya exporte todos los datos o parte de ellos. Para obtener más información, consulte la Página de precios de Amazon Aurora
Después de exportar los datos, puede analizar los datos exportados directamente con herramientas como Amazon Athena o Amazon Redshift Spectrum. Para obtener más información sobre cómo utilizar Athena para leer los datos de Parquet, consulte Parquet SerDe en Guía del usuario de Amazon Athena. Para obtener más información sobre cómo utilizar Redshift Spectrum para leer datos de Parquet, vea Uso de COPY con formatos de datos de columnas en la Guía para desarrolladores de bases de datos Amazon Redshift.
La disponibilidad de las características varía según las versiones específicas de cada motor de base de datos y entre Regiones de AWS. Para obtener más información sobre la disponibilidad en versiones y regiones de la exportación de datos de clústeres de base de datos a S3, consulte Regiones y motores de base de datos Aurora admitidos para exportar datos del clúster a Amazon S3.
Utilice el siguiente proceso para exportar datos de clústeres de base de datos a un bucket de Amazon S3. Para obtener más detalles, consulte las siguientes secciones.
Información general de la exportación de datos de un clúster de base de datos
-
Identifique el clúster de base de datos cuyos datos desea exportar.
-
Configure el acceso al bucket de Amazon S3.
Un bucket es un contenedor de objetos o archivos de Amazon S3. Para proporcionar la información necesario para obtener acceso a un bucket, siga los siguientes pasos:
-
Identifique el bucket de S3 al que se van a exportar los datos del clúster de base de datos. El bucket de S3; debe estar en la misma región de AWS que el clúster de base de datos. Para obtener más información, consulte Identificación del bucket de Amazon S3 para exportación.
-
Cree un rol de AWS Identity and Access Management (IAM) que conceda a la tarea de exportación del clúster de base de datos acceso al bucket de S3. Para obtener más información, consulte Proporcionar acceso a un bucket de Amazon S3 mediante un rol de IAM.
-
-
Cree una AWS KMS key de cifrado simétrica para el cifrado del lado del servidor. La tarea de exportación del clúster utiliza la clave KMS para configurar el cifrado del lado del servidor de AWS KMS al escribir los datos de exportación en S3.
La política de clave KMS debe incluir los permisos
kms:CreateGrant
ykms:DescribeKey
. Para obtener más información acerca del uso de claves KMS en Amazon Aurora, consulte Administración de AWS KMS key.Además, si tiene una instrucción deny en la política de claves KMS, asegúrese de excluir explícitamente la entidad principal del servicio de AWS
export.rds.amazonaws.com
.Puede utilizar una clave de KMS en su cuenta de AWS o puede utilizar una clave KMS en diversas cuentas. Para obtener más información, consulte Uso de un AWS KMS key en diversas cuentas.
-
Exporte el clúster de base de datos a Amazon S3 mediante la consola o el comando
start-export-task
de la CLI. Para obtener más información, consulte Creación de tareas de exportación del clúster de base de datos. -
Para obtener acceso a los datos exportados al bucket de Amazon S3, consulte Carga, descarga y administración de objetos en la Guía del usuario de Amazon Simple Storage Service.
En las siguientes secciones, descubrirá el proceso de configuración, exportación, monitorización, cancelación y resolución de problemas para tareas de exportación de clústeres de base de datos.
Temas
- Observaciones sobre la exportación de un clúster de base de datos
- Configuración del acceso a un bucket de Amazon S3
- Creación de tareas de exportación del clúster de base de datos
- Supervisión de tareas de exportación del clúster de base de datos
- Cancelación de una tarea de exportación de un clúster de base de datos
- Resolución de problemas en las exportaciones de clústeres de base de datos