Utilizzo delle integrazioni Zero-ETL di Amazon RDS con Amazon Redshift (anteprima) - Amazon Relational Database Service

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo delle integrazioni Zero-ETL di Amazon RDS con Amazon Redshift (anteprima)

Questa è la documentazione preliminare per le integrazioni Zero-ETL di Amazon RDS con Amazon Redshift, che è in versione di anteprima. La documentazione e la funzionalità sono soggette a modifiche. Consigliamo di utilizzare questa caratteristica solo in ambienti di test e non in ambienti di produzione. Per i termini e condizioni dell'anteprima, consulta la sezione su beta e anteprime nei AWS termini del servizio.

L'integrazione Zero-ETL di Amazon RDS con Amazon Redshift consente di eseguire operazioni di analisi e machine learning (ML) quasi in tempo reale utilizzando Amazon Redshift su petabyte di dati transazionali di RDS. L'estrazione, la trasformazione e il caricamento (ETL) è il processo di combinazione di dati provenienti da più fonti in un ampio data warehouse centrale.

Un'integrazione zero-ETL rende i dati del cluster in tempo reale. Una volta che i dati sono in Amazon Redshift, puoi potenziare i tuoi carichi di lavoro di analisi, ML e intelligenza artificiale utilizzando le funzionalità integrate di Amazon Redshift, come l'apprendimento automatico, le viste materializzate, la condivisione dei dati, l'accesso federato a più data store e data lake e integrazioni con Amazon, Amazon e altri. SageMaker QuickSight Servizi AWS

Per creare un'integrazione zero-ETL, specifichi un database RDS, un cluster come origine e un data warehouse Amazon Redshift come destinazione. L'integrazione replica i dati dal database di origine nel data warehouse di destinazione.

Il diagramma seguente illustra questa funzionalità.

Integrazione Zero-ETL

L'integrazione monitora lo stato della pipeline dei dati ed esegue il ripristino in caso di problemi quando possibile. Puoi creare integrazioni da più database RDS (cluster Aurora ) in un unico spazio dei nomi Amazon Redshift, che ti consente di ricavare informazioni su più applicazioni.

Vantaggi

Le integrazioni Zero-ETL di RDS con Amazon Redshift offrono i seguenti vantaggi:

  • Ti consentono di ottenere approfondimenti di tipo olistico da più origini dati.

  • Eliminano la necessità di creare e gestire pipeline dei dati complesse che eseguono operazioni di estrazione, trasformazione e caricamento (ETL). Le integrazioni Zero-ETL forniscono e gestiscono le pipeline per te, eliminando le sfide legate alla loro creazione e gestione.

  • Ti consentono di ridurre il carico e i costi operativi e di concentrarti sul miglioramento delle applicazioni.

  • Consenti di sfruttare le funzionalità di analisi e ML di Amazon Redshift per ricavare informazioni dettagliate da dati transazionali e di altro tipo, per rispondere efficacemente a eventi critici e urgenti.

Concetti chiave

Per iniziare a utilizzare le integrazioni Zero-ETL, tieni presente i seguenti concetti:

Integrazione

Una pipeline di dati completamente gestita che replica automaticamente i dati e gli schemi transazionali da un un data warehouse Amazon Redshift.

Il cluster del database RDS da cui vengono replicati i dati. È possibile specificare un'istanza DB Single-AZ o Multi-AZ.

Data warehouse di destinazione

Si tratta del data warehouse di Amazon Redshift in cui viene eseguita la replica dei dati. Esistono due tipi di data warehouse: un data warehouse con cluster con provisioning e un data warehouse serverless. Un data warehouse con cluster con provisioning è costituito da un insieme di risorse di calcolo denominate nodi, strutturate in un gruppo denominato cluster. Un data warehouse serverless è composto da un gruppo di lavoro che archivia le risorse di calcolo e da un spazio dei nomi che ospita gli oggetti e gli utenti del database. Entrambi i data warehouse utilizzano un motore Amazon Redshift e contengono uno o più database.

I scrivere sulla stessa destinazione.

Per ulteriori informazioni sui nodi principali e sui nodi di calcolo, consulta Architettura del sistema di data warehouse nella Guida per sviluppatori di database di Amazon Redshift.

Limitazioni dell'anteprima

Le seguenti limitazioni si applicano alle integrazioni Zero-ETL di RDS con Amazon Redshift.

Limitazioni generali

  • Il del database di origine deve trovarsi nella stessa regione del data warehouse Amazon Redshift di destinazione.

  • Non puoi rinominare un se dispone di integrazioni esistenti.

  • Non è possibile eliminare un esistenti. Devi prima eliminare tutte le integrazioni associate.

  • Non è possibile eliminare un'integrazione se il database di origine è interrotto.

  • Amazon RDS supporta solo implementazioni di istanze DB Single-AZ e Multi-AZ come fonti di integrazione. Attualmente non supporta i cluster DB Multi-AZ.

  • Le integrazioni zero-ETL attualmente non supportano il filtraggio dei dati.

  • Se il di database è all'origine di una distribuzione blu/verde, gli ambienti blu e verde non possono avere integrazioni zero-ETL esistenti durante lo switchover. Occorre eliminare l'integrazione, eseguire lo switchover e poi ricrearla.

  • Non è possibile creare un'integrazione per un database di origine in cui viene creata attivamente un'altra integrazione.

  • Durante la fase iniziale della creazione di un'integrazione o quando una tabella viene risincronizzata, il seeding dei dati dall'origine alla destinazione può richiedere 20-25 minuti o più, a seconda delle dimensioni del database di origine. Questo ritardo può portare a un aumento del ritardo di replica.

  • Alcuni tipi di dati non sono supportati. Per ulteriori informazioni, consulta Differenze tra i tipi di dati tra i database RDS e Amazon Redshift.

  • I riferimenti a chiavi esterne con aggiornamenti di tabella predefiniti non sono supportati. In particolare, ON DELETE le ON UPDATE regole non sono supportate con CASCADESET NULL, e SET DEFAULT le azioni. Se si tenta di creare o aggiornare una tabella con tali riferimenti a un'altra tabella, la tabella entrerà in uno stato di errore.

  • ALTER TABLE La tabella non sarà disponibile per l'interrogazione durante la risincronizzazione. Per ulteriori informazioni, consulta Una o più tabelle Amazon Redshift richiedono una risincronizzazione.

  • Le transazioni XA non sono supportate.

  • Gli identificatori di oggetto, inclusi il nome del database, il nome della tabella, i nomi delle colonne e altri, possono contenere solo caratteri alfanumerici, numeri, $ e _ (carattere di sottolineatura).

Limitazioni di RDS per MySQL

  • Il database di origine deve eseguire RDS for MySQL versione 8.0.32 o successiva.

  • Le integrazioni Zero-ETL si basano sui log binari MySQL (binlog) per acquisire le modifiche continue dei dati. Non utilizzare il filtraggio dei dati basato su binlog, poiché può causare incongruenze tra i database di origine e di destinazione.

  • Le tabelle di sistema, le tabelle temporanee e le viste di RDS for MySQL non vengono replicate su Amazon Redshift.

  • Le integrazioni Zero-ETL sono supportate solo per i database configurati per l'utilizzo del motore di storage InnoDB.

  • I cluster DB di origine non possono essere configurati con Certificate Authority (CA). rds-ca-ecc384-g1

Limitazioni di Amazon Redshift

Per un elenco delle limitazioni di Amazon Redshift relative alle integrazioni zero-ETL, consulta Considerazioni nella Amazon Redshift Management Guide.

Quote

Sul tuo account sono disponibili le seguenti quote relative alle integrazioni Zero-ETL di RDS con Amazon Redshift. Salvo dove diversamente specificato, ogni quota fa riferimento a una Regione specifica.

Nome Predefinito Descrizione
Integrazioni 100 Numero totale di integrazioni all'interno di un  Account AWS.
Integrazioni per data warehouse di destinazione 50 Numero di integrazioni che inviano dati a un unico data warehouse Amazon Redshift di destinazione.
Integrazioni per istanza di origine 1

Inoltre, Amazon Redshift pone determinati limiti al numero di tabelle consentite in ogni istanza database o nodo del cluster. Per ulteriori informazioni, consulta Quote e limiti in Amazon Redshift nella Guida alla gestione di Amazon Redshift.

Regioni supportate

Le integrazioni Zero-ETL di RDS con Amazon Redshift sono disponibili in un sottoinsieme di. Regioni AWS Per un elenco delle regioni supportate, consultare Regioni e motori DB supportati per le integrazioni Zero-ETL di Amazon RDS con Amazon Redshift.