View a markdown version of this page

Integración compatible con Aurora PostgreSQL con Amazon S3 - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Integración compatible con Aurora PostgreSQL con Amazon S3

Amazon Simple Storage Service (Amazon S3) es un servicio de almacenamiento de objetos que proporciona un almacenamiento de datos escalable, duradero, de alta disponibilidad y rentable. La edición compatible con PostgreSQL de Amazon Aurora se integra con Amazon S3 a través de la aws_s3 extensión, que proporciona acceso directo de lectura y escritura a los buckets de S3. Esta integración facilita el intercambio de datos, incluida la ingesta de datos, las copias de seguridad y otras operaciones relacionadas con los datos.

Casos de uso y pasos de alto nivel de aws_s3

Los casos de uso de alto nivel y las ventajas más comunes de la integración con Amazon S3 son los siguientes:

  • Ingesta de datos desde Amazon S3 ‒ Utilice la aws_s3 extensión para cargar datos de valores separados por comas (CSV), JSON u otros formatos de archivo almacenados en Amazon S3 directamente en una tabla compatible con Aurora PostgreSQL. Esto resulta especialmente útil para los procesos de ingesta de datos por lotes, los flujos de trabajo de ETL (extracción, transformación y carga) o las migraciones de datos.

  • Exportación de datos a Amazon S3 ‒ Exporte datos de tablas compatibles con Aurora PostgreSQL a CSV, JSON u otros formatos de archivo y almacene los datos en Amazon S3. Esto resulta útil para archivar datos, hacer copias de seguridad o compartirlos con otros sistemas o servicios.

  • Consulta de datos directamente desde Amazon S3 ‒ Consulte los datos almacenados en archivos CSV o JSON en Amazon S3 directamente desde su base de datos compatible con Aurora PostgreSQL sin cargar los datos en tablas. Esto resulta útil para el análisis de datos de una sola vez o para el procesamiento exploratorio de datos.

  • Backup y restauración: utilice Amazon S3 como destino de backup para sus bases de datos compatibles con Aurora PostgreSQL. Esto proporciona una capa adicional de protección de datos y, si es necesario, puede restaurar las bases de datos desde las copias de seguridad de Amazon S3.

Para integrar su clúster de base de datos compatible con Aurora PostgreSQL con un bucket de S3, siga los siguientes pasos de alto nivel:

  1. Conéctese a su clúster compatible con PostgreSQL de Aurora mediante un cliente PostgreSQL y cree la extensión: aws_s3

    create extension aws_s3
  2. Configure el acceso a un bucket de S3 y a las funciones necesarias. Para ver los pasos detallados, consulte la AWS documentación.

  3. Utilice una consulta psql para importar o exportar los datos de la base de datos:

    • Para importar el archivo de Amazon S3 a una tabla compatible con Aurora PostgreSQL, ejecute los siguientes comandos:

      SELECT aws_s3.table_import_from_s3( 'Table_Name', '', '(format text)', aws_commons.create_s3_uri('S3_BUCKETNAME', 'FileName.dat','Region-Name') );
    • Para exportar el archivo a Amazon S3 desde la tabla compatible con Aurora PostgreSQL, ejecute el siguiente comando:

      SELECT * FROM aws_s3.query_export_to_s3('TABLE_NAME', aws_commons.create_s3_uri('S3_BUCKETNAME', 'FileName.dat', 'Region-Name') );
    • Para exportar a Amazon S3 mediante una consulta SQL, ejecute el siguiente comando:

      SELECT * FROM aws_s3.query_export_to_s3('SELECT * FROM data_table', aws_commons.create_s3_uri('S3_BUCKETNAME', 'FileName.dat', 'Region-Name') );