Replica le modifiche del database su Apache Iceberg Tables con Amazon Data Firehose

Nota

Firehose supporta il database come fonte in tutte le regioni tranne Regioni AWSCina e Asia Pacifico (Malesia). AWS GovCloud (US) Regions Questa funzionalità è disponibile in anteprima ed è soggetta a modifiche. Non utilizzatela per i vostri carichi di lavoro di produzione.

Le organizzazioni utilizzano database relazionali per archiviare e recuperare dati transazionali ottimizzati per interagire molto rapidamente con una o poche righe di dati alla volta. Non sono ottimizzati per l'interrogazione di grandi set di dati aggregati. Organizations trasferiscono i dati transazionali dai database relazionali agli archivi di dati analitici come data lake, data warehouse e altri strumenti per casi d'uso di analisi e machine learning. Per mantenere sincronizzati gli archivi di dati analitici con i database relazionali, viene utilizzato un modello di progettazione chiamato change data capture (CDC) che consente di acquisire tutte le modifiche ai database in tempo reale. Quando i dati vengono modificati attraverso INSERT o DELETE in un database di origine, tali CDC modifiche devono essere trasmesse in streaming continuo senza influire sulle prestazioni dei database. UPDATE

Firehose fornisce una easy-to-use end-to-end soluzione semplice per replicare le modifiche dai SQL database My e SQL Postgre in Apache Iceberg Tables. Con questa funzionalità, Firehose consente di selezionare database, tabelle e colonne specifici che Firehose deve registrare negli eventi. CDC Se non disponi già di Iceberg Tables, puoi attivare Firehose per creare Iceberg Tables. Firehose crea database e tabelle utilizzando lo stesso schema delle tabelle dei database relazionali. Una volta creato lo stream, Firehose prende una copia iniziale dei dati nelle tabelle e li scrive su Apache Iceberg Tables. Una volta completata la copia iniziale, Firehose avvia l'acquisizione continua delle CDC modifiche in tempo reale nei database e le replica su Apache Iceberg Tables. Se optate per l'evoluzione dello schema, Firehose evolve lo schema della tabella Iceberg in base alle modifiche dello schema nei database relazionali.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Comprendi i tipi di dati supportati

Considerazioni e limitazioni