Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Utilizzo delle integrazioni Zero-ETL di Amazon RDS con Amazon Redshift (anteprima)
Questa è la documentazione preliminare per le integrazioni Zero-ETL di Amazon RDS con Amazon Redshift, che è in versione di anteprima. La documentazione e la funzionalità sono soggette a modifiche. Consigliamo di utilizzare questa caratteristica solo in ambienti di test e non in ambienti di produzione. Per i termini e condizioni dell'anteprima, consulta la sezione su beta e anteprime nei AWS termini del servizio |
L'integrazione Zero-ETL di Amazon RDS con Amazon Redshift consente di eseguire operazioni di analisi e machine learning (ML) quasi in tempo reale utilizzando Amazon Redshift su petabyte di dati transazionali di RDS. L'estrazione, la trasformazione e il caricamento (ETL) è il processo di combinazione di dati provenienti da più fonti in un ampio data warehouse centrale.
Un'integrazione zero-ETL rende i dati del cluster in tempo reale. Una volta che i dati sono in Amazon Redshift, puoi potenziare i tuoi carichi di lavoro di analisi, ML e intelligenza artificiale utilizzando le funzionalità integrate di Amazon Redshift, come l'apprendimento automatico, le viste materializzate, la condivisione dei dati, l'accesso federato a più data store e data lake e integrazioni con Amazon, Amazon e altri. SageMaker QuickSight Servizi AWS
Per creare un'integrazione zero-ETL, specifichi un database RDS, un cluster come origine e un data warehouse Amazon Redshift come destinazione. L'integrazione replica i dati dal database di origine nel data warehouse di destinazione.
Il diagramma seguente illustra questa funzionalità.
![Integrazione Zero-ETL](images/zero-etl-integrations.png)
L'integrazione monitora lo stato della pipeline dei dati ed esegue il ripristino in caso di problemi quando possibile. Puoi creare integrazioni da più database RDS (cluster Aurora ) in un unico spazio dei nomi Amazon Redshift, che ti consente di ricavare informazioni su più applicazioni.
Argomenti
- Vantaggi
- Concetti chiave
- Limitazioni dell'anteprima
- Quote
- Regioni supportate
- Guida introduttiva alle integrazioni Zero-ETL di Amazon RDS con Amazon Redshift
- Creazione di integrazioni Zero-ETL di Amazon RDS con Amazon Redshift
- Aggiungere dati a un database RDS di origine (cluster ) e interrogarli in Amazon Redshift
- Visualizzazione e monitoraggio delle integrazioni Zero-ETL di Amazon RDS con Amazon Redshift
- Eliminazione delle integrazioni Zero-ETL di Amazon RDS con Amazon Redshift
- Risoluzione dei problemi delle integrazioni Zero-ETL di Amazon RDS con Amazon Redshift
Vantaggi
Le integrazioni Zero-ETL di RDS con Amazon Redshift offrono i seguenti vantaggi:
-
Ti consentono di ottenere approfondimenti di tipo olistico da più origini dati.
-
Eliminano la necessità di creare e gestire pipeline dei dati complesse che eseguono operazioni di estrazione, trasformazione e caricamento (ETL). Le integrazioni Zero-ETL forniscono e gestiscono le pipeline per te, eliminando le sfide legate alla loro creazione e gestione.
-
Ti consentono di ridurre il carico e i costi operativi e di concentrarti sul miglioramento delle applicazioni.
-
Consenti di sfruttare le funzionalità di analisi e ML di Amazon Redshift per ricavare informazioni dettagliate da dati transazionali e di altro tipo, per rispondere efficacemente a eventi critici e urgenti.
Concetti chiave
Per iniziare a utilizzare le integrazioni Zero-ETL, tieni presente i seguenti concetti:
- Integrazione
-
Una pipeline di dati completamente gestita che replica automaticamente i dati e gli schemi transazionali da un un data warehouse Amazon Redshift.
-
Il cluster del database RDS da cui vengono replicati i dati. È possibile specificare un'istanza DB Single-AZ o Multi-AZ.
- Data warehouse di destinazione
-
Si tratta del data warehouse di Amazon Redshift in cui viene eseguita la replica dei dati. Esistono due tipi di data warehouse: un data warehouse con cluster con provisioning e un data warehouse serverless. Un data warehouse con cluster con provisioning è costituito da un insieme di risorse di calcolo denominate nodi, strutturate in un gruppo denominato cluster. Un data warehouse serverless è composto da un gruppo di lavoro che archivia le risorse di calcolo e da un spazio dei nomi che ospita gli oggetti e gli utenti del database. Entrambi i data warehouse utilizzano un motore Amazon Redshift e contengono uno o più database.
I scrivere sulla stessa destinazione.
Per ulteriori informazioni sui nodi principali e sui nodi di calcolo, consulta Architettura del sistema di data warehouse nella Guida per sviluppatori di database di Amazon Redshift.
Limitazioni dell'anteprima
Le seguenti limitazioni si applicano alle integrazioni Zero-ETL di RDS con Amazon Redshift.
Limitazioni generali
-
Il del database di origine deve trovarsi nella stessa regione del data warehouse Amazon Redshift di destinazione.
-
Non puoi rinominare un se dispone di integrazioni esistenti.
-
Non è possibile eliminare un esistenti. Devi prima eliminare tutte le integrazioni associate.
-
-
Non è possibile eliminare un'integrazione se il database di origine è interrotto.
-
Amazon RDS supporta solo implementazioni di istanze DB Single-AZ e Multi-AZ come fonti di integrazione. Attualmente non supporta i cluster DB Multi-AZ.
-
Le integrazioni zero-ETL attualmente non supportano il filtraggio dei dati.
-
Se il di database è all'origine di una distribuzione blu/verde, gli ambienti blu e verde non possono avere integrazioni zero-ETL esistenti durante lo switchover. Occorre eliminare l'integrazione, eseguire lo switchover e poi ricrearla.
-
Non è possibile creare un'integrazione per un database di origine in cui viene creata attivamente un'altra integrazione.
-
Durante la fase iniziale della creazione di un'integrazione o quando una tabella viene risincronizzata, il seeding dei dati dall'origine alla destinazione può richiedere 20-25 minuti o più, a seconda delle dimensioni del database di origine. Questo ritardo può portare a un aumento del ritardo di replica.
-
Alcuni tipi di dati non sono supportati. Per ulteriori informazioni, consulta Differenze tra i tipi di dati tra i database RDS e Amazon Redshift.
-
I riferimenti a chiavi esterne con aggiornamenti di tabella predefiniti non sono supportati. In particolare,
ON DELETE
leON UPDATE
regole non sono supportate conCASCADE
SET NULL
, eSET DEFAULT
le azioni. Se si tenta di creare o aggiornare una tabella con tali riferimenti a un'altra tabella, la tabella entrerà in uno stato di errore. -
ALTER TABLE
La tabella non sarà disponibile per l'interrogazione durante la risincronizzazione. Per ulteriori informazioni, consulta Una o più tabelle Amazon Redshift richiedono una risincronizzazione. -
Le transazioni XA non sono supportate.
-
Gli identificatori di oggetto, inclusi il nome del database, il nome della tabella, i nomi delle colonne e altri, possono contenere solo caratteri alfanumerici, numeri, $ e _ (carattere di sottolineatura).
Limitazioni di RDS per MySQL
-
Il database di origine deve eseguire RDS for MySQL versione 8.0.32 o successiva.
-
Le integrazioni Zero-ETL si basano sui log binari MySQL (binlog) per acquisire le modifiche continue dei dati. Non utilizzare il filtraggio dei dati basato su binlog, poiché può causare incongruenze tra i database di origine e di destinazione.
-
Le tabelle di sistema, le tabelle temporanee e le viste di RDS for MySQL non vengono replicate su Amazon Redshift.
-
Le integrazioni Zero-ETL sono supportate solo per i database configurati per l'utilizzo del motore di storage InnoDB.
-
I cluster DB di origine non possono essere configurati con Certificate Authority (CA).
rds-ca-ecc384-g1
Limitazioni di Amazon Redshift
Per un elenco delle limitazioni di Amazon Redshift relative alle integrazioni zero-ETL, consulta Considerazioni nella Amazon Redshift Management Guide.
Quote
Sul tuo account sono disponibili le seguenti quote relative alle integrazioni Zero-ETL di RDS con Amazon Redshift. Salvo dove diversamente specificato, ogni quota fa riferimento a una Regione specifica.
Nome | Predefinito | Descrizione |
---|---|---|
Integrazioni | 100 | Numero totale di integrazioni all'interno di un Account AWS. |
Integrazioni per data warehouse di destinazione | 50 | Numero di integrazioni che inviano dati a un unico data warehouse Amazon Redshift di destinazione. |
Integrazioni per istanza di origine | 1 |
Inoltre, Amazon Redshift pone determinati limiti al numero di tabelle consentite in ogni istanza database o nodo del cluster. Per ulteriori informazioni, consulta Quote e limiti in Amazon Redshift nella Guida alla gestione di Amazon Redshift.
Regioni supportate
Le integrazioni Zero-ETL di RDS con Amazon Redshift sono disponibili in un sottoinsieme di. Regioni AWS Per un elenco delle regioni supportate, consultare Regioni e motori DB supportati per le integrazioni Zero-ETL di Amazon RDS con Amazon Redshift.