Replica le modifiche del database su Apache Iceberg Tables con Amazon Data Firehose - Amazon Data Firehose

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Replica le modifiche del database su Apache Iceberg Tables con Amazon Data Firehose

Nota

Firehose supporta il database come fonte in tutte le regioni tranne Regioni AWSCina e Asia Pacifico (Malesia). AWS GovCloud (US) Regions Questa funzionalità è disponibile in anteprima ed è soggetta a modifiche. Non utilizzatela per i vostri carichi di lavoro di produzione.

Le organizzazioni utilizzano database relazionali per archiviare e recuperare dati transazionali ottimizzati per interagire molto rapidamente con una o poche righe di dati alla volta. Non sono ottimizzati per l'interrogazione di grandi set di dati aggregati. Organizations trasferiscono i dati transazionali dai database relazionali agli archivi di dati analitici come data lake, data warehouse e altri strumenti per casi d'uso di analisi e machine learning. Per mantenere sincronizzati gli archivi di dati analitici con i database relazionali, viene utilizzato un modello di progettazione chiamato change data capture (CDC) che consente di acquisire tutte le modifiche ai database in tempo reale. Quando i dati vengono modificati attraverso INSERT o DELETE in un database di origine, tali CDC modifiche devono essere trasmesse in streaming continuo senza influire sulle prestazioni dei database. UPDATE

Firehose fornisce una easy-to-use end-to-end soluzione semplice per replicare le modifiche dai SQL database My e SQL Postgre in Apache Iceberg Tables. Con questa funzionalità, Firehose consente di selezionare database, tabelle e colonne specifici che Firehose deve registrare negli eventi. CDC Se non disponi già di Iceberg Tables, puoi attivare Firehose per creare Iceberg Tables. Firehose crea database e tabelle utilizzando lo stesso schema delle tabelle dei database relazionali. Una volta creato lo stream, Firehose prende una copia iniziale dei dati nelle tabelle e li scrive su Apache Iceberg Tables. Una volta completata la copia iniziale, Firehose avvia l'acquisizione continua delle CDC modifiche in tempo reale nei database e le replica su Apache Iceberg Tables. Se optate per l'evoluzione dello schema, Firehose evolve lo schema della tabella Iceberg in base alle modifiche dello schema nei database relazionali.