Guida introduttiva alle integrazioni Zero-ETL di Amazon RDS con Amazon Redshift - Amazon Relational Database Service

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Guida introduttiva alle integrazioni Zero-ETL di Amazon RDS con Amazon Redshift

Questa è la documentazione preliminare per le integrazioni Zero-ETL di Amazon RDS con Amazon Redshift, che è in versione di anteprima. La documentazione e la funzionalità sono soggette a modifiche. Consigliamo di utilizzare questa caratteristica solo in ambienti di test e non in ambienti di produzione. Per i termini e condizioni dell'anteprima, consulta la sezione su beta e anteprime nei AWS termini del servizio.

Prima di creare un'integrazione zero-ETL con Amazon Redshift, configura il database RDS, il cluster Aurora le autorizzazioni richiesti. Durante la configurazione, dovrai completare i seguenti passaggi:

Dopo aver completato questi passaggi, passa alla sezione Creazione di integrazioni Zero-ETL di Amazon RDS con Amazon Redshift.

Fase 1: creazione di un gruppo di parametri del DB personalizzato

Le integrazioni Zero-ETL di Amazon RDS con Amazon Redshift richiedono valori specifici per i parametri DB che controllano la registrazione binaria (binlog). Per configurare la registrazione binaria, devi prima creare un gruppo di parametri DB personalizzato e quindi associarlo al database di origine.

Crea un gruppo di parametri DB personalizzato con le seguenti impostazioni . Per istruzioni sulla creazione di un gruppo di parametri, consulta Utilizzo di gruppi di parametri DB in un'istanza DB.

  • binlog_format=ROW

  • binlog_row_image=full

  • binlog_checksum=NONE

Inoltre, assicurati che il parametro binlog_row_value_options non sia impostato su PARTIAL_JSON.

Passaggio 2: selezionare o creare un cluster del database di origine

Dopo aver creato un gruppo di parametri del DB personalizzato, scegli o crea un cluster RDS per l'istanza database MySQL Single-AZ o Multi-AZ Aurora MySQL o Aurora DB. Questo di database sarà l'origine della replica dei dati su Amazon Redshift.

Il di database deve eseguire RDS for MySQL versione 8.0.32 o successiva, Aurora MySQL versione 3.05 (compatibile con MySQL 8.0.32) o successiva o . Per istruzioni su come creare un

In Configurazione aggiuntiva, modifica il gruppo di parametri predefinito del DB con il gruppo di parametri personalizzato creato nel passaggio precedente.

Nota

Per istruzioni, consulta Riavvio di un'istanza database.

Inoltre, assicurati che i backup automatici siano abilitati sul database. Per ulteriori informazioni, consulta Abilitazione dei backup automatici.

Fase 3: creazione di un data warehouse Amazon Redshift di destinazione

Dopo aver creato il del database di origine, devi creare e configurare un data warehouse di destinazione in Amazon Redshift. Il data warehouse deve soddisfare i seguenti requisiti:

  • Creato in anteprima

    • Per creare un'anteprima del cluster con provisioning, scegli Crea cluster di anteprima dal banner sulla dashboard dei cluster con provisioning. Per ulteriori informazioni, consulta Creazione di un cluster di anteprima.

      Quando crei il cluster, imposta Traccia anteprima su preview_2023.

    • Per creare un'anteprima del gruppo di lavoro Redshift Serverless, scegli Crea gruppo di lavoro di anteprima dal banner sulla dashboard Serverless. Per ulteriori informazioni, consulta Creazione di un gruppo di lavoro di anteprima.

  • Utilizzando un tipo di nodo RA3 (ra3.xlplusra3.4xlarge, ora3.16xlarge) con almeno due nodi o Redshift Serverless.

  • Deve essere crittografato (se si utilizza un cluster con provisioning). Per ulteriori informazioni, consulta Crittografia dei database di Amazon Redshift.

Per istruzioni su come creare un data warehouse, consulta Creazione di un cluster per i cluster con provisioning o Creazione di un gruppo di lavoro con uno spazio dei nomi per Redshift Serverless.

Abilitazione della distinzione tra maiuscole e minuscole nel data warehouse

Affinché l'integrazione venga eseguita correttamente, il parametro di distinzione tra maiuscole e minuscole (enable_case_sensitive_identifier) deve essere abilitato per il data warehouse. Per impostazione predefinita, la distinzione tra maiuscole e minuscole è disabilitata su tutti i cluster con provisioning e sui gruppi di lavoro Redshift serverless.

Per abilitare la distinzione tra maiuscole e minuscole, esegui i seguenti passaggi a seconda del tipo di data warehouse:

  • Cluster con provisioning: per abilitare la distinzione tra maiuscole e minuscole su un cluster con provisioning, crea un gruppo di parametri personalizzato con il parametro enable_case_sensitive_identifier abilitato. Poi, associa il gruppo di parametri al cluster. Per istruzioni, consulta Gestione di gruppi di parametri mediante la console o Configurazione dei valori di parametro mediante AWS CLI.

    Nota

    Ricordati di riavviare il cluster dopo aver associato il gruppo di parametri personalizzati.

  • Gruppo di lavoro serverless: per abilitare la distinzione tra maiuscole e minuscole su un gruppo di lavoro SRedshift Serverless, è necessario utilizzare la AWS CLI. La console Amazon Redshift attualmente non supporta la modifica dei valori dei parametri Redshift Serverless. Invia la seguente richiesta di aggiornamento al gruppo di lavoro:

    aws redshift-serverless update-workgroup \ --workgroup-name target-workgroup \ --config-parameters parameterKey=enable_case_sensitive_identifier,parameterValue=true

    Non è necessario riavviare un gruppo di lavoro dopo aver modificato i valori dei parametri.

Configura l'autorizzazione per il data warehouse

Dopo aver creato un data warehouse, è necessario configurare il database RDS di origine cluster come fonte di integrazione autorizzata. Per istruzioni, consulta Configurazione dell'autorizzazione per il data warehouse Amazon Redshift.

Passaggi successivi

Con un database RDS di origine, un cluster e un data warehouse di destinazione Amazon Redshift, ora puoi creare un'integrazione zero-ETL e replicare i dati. Per istruzioni, consultare Creazione di integrazioni Zero-ETL di Amazon RDS con Amazon Redshift.