Replique los cambios de la base de datos en las tablas Iceberg de Apache con Amazon Data Firehose - Amazon Data Firehose

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Replique los cambios de la base de datos en las tablas Iceberg de Apache con Amazon Data Firehose

nota

Firehose admite la base de datos como fuente en todas las regiones excepto en Regiones de AWSChina y Asia Pacífico (Malasia). AWS GovCloud (US) Regions Esta función está en versión preliminar y está sujeta a cambios. No la utilice para sus cargas de trabajo de producción.

Las organizaciones utilizan bases de datos relacionales para almacenar y recuperar datos transaccionales que están optimizados para interactuar muy rápidamente con una o varias filas de datos a la vez. No están optimizadas para consultar grandes conjuntos de datos agregados. Las organizaciones trasladan los datos transaccionales de las bases de datos relacionales a los almacenes de datos analíticos, como lagos de datos, almacenes de datos y otras herramientas para casos de uso de análisis y aprendizaje automático. Para mantener los almacenes de datos analíticos sincronizados con las bases de datos relacionales, se utiliza un patrón de diseño denominado captura de datos de cambios (CDC) que permite capturar todos los cambios en las bases de datos en tiempo real. Cuando los datos se modifican a través INSERT o DELETE en una base de datos de origen, esos CDC cambios deben transmitirse de forma continua sin afectar al rendimiento de las bases de datos. UPDATE

Firehose proporciona una easy-to-use end-to-end solución sencilla para replicar los cambios de las SQL bases de datos My SQL y Postgre en tablas Iceberg de Apache. Con esta función, Firehose le permite seleccionar bases de datos, tablas y columnas específicas que desea que Firehose capture en eventos. CDC Si aún no tienes Iceberg Tables, puedes optar por Firehose para crear Iceberg Tables. Firehose crea bases de datos y tablas con el mismo esquema que en las tablas de bases de datos relacionales. Una vez creada la transmisión, Firehose toma una copia inicial de los datos de las tablas y los escribe en Apache Iceberg Tables. Una vez completada la copia inicial, Firehose inicia la captura continua de los CDC cambios en tiempo real en sus bases de datos y los replica en Apache Iceberg Tables. Si opta por la evolución del esquema, Firehose evoluciona su esquema de Iceberg Table en función de los cambios de esquema en sus bases de datos relacionales.