Migrazione a un cluster HSM crittografato - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Migrazione a un cluster HSM crittografato

Per migrare un cluster non crittografato in un cluster crittografato utilizzando un modulo di sicurezza hardware (HSM), è necessario creare un nuovo cluster crittografato e spostare i dati nel nuovo cluster. Non è possibile migrare a un cluster HSM crittografato modificando il cluster.

Per migrare da un cluster non crittografato a un cluster HSM -encrypted, devi prima scaricare i dati dal cluster di origine esistente. Ricarica quindi i dati in un nuovo cluster di destinazione con l'impostazione di crittografia scelta. Per ulteriori informazioni sull'avvio di un cluster crittografato, consultare Crittografia dei database di Amazon Redshift.

Durante il processo di migrazione, il cluster di origine è disponibile per query di sola lettura fino all'ultima fase. L'ultima fase consiste nel rinominare i cluster di destinazione e di origine, scambiando gli endpoint in modo che il traffico venga instradato al nuovo cluster di destinazione. Il cluster di destinazione non è disponibile fino al riavvio successivo alla ridenominazione. Durante il trasferimento dei dati, sospendi qualsiasi caricamento dei dati e altre operazioni di scrittura nel cluster di origine.

Preparativi per la migrazione
  1. Identifica tutti i sistemi dipendenti che interagiscono con Amazon Redshift, ad esempio strumenti di business intelligence (BI) e sistemi di estrazione, trasformazione e caricamento (ETL).

  2. Identificare le query di convalida per testare la migrazione.

    Ad esempio, è possibile usare la query seguente per trovare il numero di tabelle definite dall'utente.

    select count(*) from pg_table_def where schemaname != 'pg_catalog';

    La query seguente restituisce un elenco di tutte le tabelle definite dall'utente e il numero di righe in ogni tabella.

    select "table", tbl_rows from svv_table_info;
  3. Scegliere un buon momento per la migrazione. Per trovare un momento in cui l'utilizzo del cluster è più basso, monitora i parametri del cluster come CPU l'utilizzo e il numero di connessioni al database. Per ulteriori informazioni, consulta Visualizzazione di dati di prestazioni dei cluster.

  4. Rimuovere le tabelle inutilizzate.

    Per creare un elenco di tabelle che indichi anche il numero di volte in cui sono state eseguite query su ogni tabella, eseguire la query seguente.

    select database, schema, table_id, "table", round(size::float/(1024*1024)::float,2) as size, sortkey1, nvl(s.num_qs,0) num_qs from svv_table_info t left join (select tbl, perm_table_name, count(distinct query) num_qs from stl_scan s where s.userid > 1 and s.perm_table_name not in ('Internal worktable','S3') group by tbl, perm_table_name) s on s.tbl = t.table_id where t."schema" not in ('pg_internal');
  5. Avviare un nuovo cluster crittografato.

    Usare lo stesso numero di porta del cluster di destinazione come cluster di origine. Per ulteriori informazioni sull'avvio di un cluster crittografato, consultare Crittografia dei database di Amazon Redshift.

  6. Configurare il processo di scaricamento e caricamento.

    Puoi utilizzare l'utilità di scaricamento/copia di Amazon Redshift per semplificare la migrazione di dati tra cluster. L'utilità esporta dati dal cluster di origine a una posizione in Amazon S3. I dati vengono crittografati con. AWS KMS L'utilità importa quindi automaticamente i dati nella destinazione. Facoltativamente, è possibile usare l'utilità per eseguire la pulizia di Amazon S3 al termine della migrazione.

  7. Eseguire un test per verificare il processo e determinare il periodo di tempo per cui sospendere le operazioni di scrittura.

    Durante le operazioni di scaricamento e caricamento dei dati, mantenere la coerenza dei dati sospendendo il caricamento dei dati e altre operazioni di scrittura. Usando una delle tabelle di dimensioni maggiori, eseguire il processo di scaricamento e caricamento per stimare i tempi.

  8. Creare oggetti di database, come schemi, viste e tabelle. Per aiutarti a generare le istruzioni necessarie in Data Definition Language (DDL), puoi utilizzare gli script presenti AdminViewsnel AWS GitHub repository.

Per eseguire la migrazione del cluster
  1. Arresta tutti i ETL processi sul cluster di origine.

    Per verificare che non siano in corso operazioni di scrittura, utilizza la console di gestione Amazon Redshift per monitorare la scrittura. IOPS Per ulteriori informazioni, consulta Visualizzazione di dati di prestazioni dei cluster.

  2. Eseguire le query di convalida identificate in precedenza per raccogliere informazioni sul cluster di origine non crittografato prima della migrazione.

  3. (Facoltativo) Crea una coda di gestione del carico di lavoro (WLM) per utilizzare il massimo delle risorse disponibili sia nel cluster di origine che in quello di destinazione. Ad esempio, creare una coda denominata data_migrate e configurarla con memoria al 95% e simultaneità 4. Per ulteriori informazioni, consultare Routing di query su code basate su gruppi di utenti e gruppi di query nella Guida per gli sviluppatori di database di Amazon Redshift.

  4. Utilizzando la data_migrate coda, esegui il. UnloadCopyUtility

    Monitora il COPY processo UNLOAD e utilizzando la console Amazon Redshift.

  5. Eseguire di nuovo le query di convalida e verificare che i risultati corrispondano a quelli del cluster di origine.

  6. Rinominare i cluster di origine e di destinazione per scambiare gli endpoint. Per evitare interruzioni, eseguire questa operazione al di fuori dell'orario di ufficio.

  7. Verifica di poterti connettere al cluster di destinazione utilizzando tutti i tuoi SQL client, ad esempio strumenti ETL di reporting.

  8. Arrestare il cluster di origine non crittografato.