Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Panoramica della condivisione di dati
Con Amazon Redshift, puoi condividere in modo sicuro dati in tempo reale tra cluster Amazon Redshift, semplificando i flussi di lavoro di condivisione dei dati e riducendo la necessità di processi complessi di estrazione, trasformazione e caricamento (). ETL La condivisione dei dati consente di condividere dati in tempo reale tra cluster Amazon Redshift, abilitando l'accesso in tempo reale ai dati più recenti senza la necessità di copiare o replicare i dati. Gli amministratori di database, gli analisti di dati e gli ingegneri dei dati potrebbero essere interessati a questa funzionalità per semplificare l'accesso ai dati e la collaborazione all'interno o tra team e organizzazioni. Consente casi d'uso come la condivisione di dati di produzione in tempo reale con i team di analisi, la fornitura di report in tempo reale su fonti di dati distribuite e la semplificazione della governance dei dati controllando centralmente le autorizzazioni di accesso. Le seguenti sezioni tratteranno i dettagli della configurazione e della gestione della condivisione dei dati in Amazon Redshift.
Con la condivisione dei dati, puoi condividere in modo sicuro e semplice dati in tempo reale tra cluster Amazon Redshift.
Per informazioni su come iniziare a lavorare con la condivisione dei dati e gestire le condivisioni di dati utilizzando il, consulta. AWS Management ConsoleGestione delle attività di condivisione dati
Casi d'uso per la condivisione dei dati per Amazon Redshift
La condivisione dei dati di Amazon Redshift è particolarmente utile per questi casi d'uso:
-
Supporto di diversi tipi di carichi di lavoro critici per l'azienda: utilizza un cluster centralizzato di estrazione, trasformazione e caricamento (ETL) che condivide i dati con più cluster di business intelligence (BI) o analitici. Questo approccio fornisce isolamento del carico di lavoro in lettura e storno di addebito per singoli carichi di lavoro. È possibile ridimensionare e scalare il singolo calcolo del carico di lavoro in base ai requisiti di prezzo e prestazioni specifici del carico di lavoro.
-
Abilitazione della collaborazione tra gruppi: abilitare la collaborazione continua tra team e gruppi di business per analisi più ampie, data science e analisi di impatto tra più prodotti.
-
Fornire dati come servizio: condividere i dati come servizio nell'intera organizzazione.
-
Condivisione dei dati tra ambienti: condividere i dati tra ambienti di sviluppo, test e produzione. È possibile migliorare l'agilità del team condividendo i dati a diversi livelli di granularità.
-
Licenza di accesso ai dati in Amazon Redshift: elenca i set di dati Amazon Redshift nel catalogo che AWS Data Exchange i clienti possono trovare, sottoscrivere e richiedere in pochi minuti.
Casi d'uso di condivisione dei dati e accesso in scrittura (anteprima)
La condivisione dei dati per le scritture ha diversi casi d'uso importanti:
-
Aggiorna i dati di origine aziendali relativi al produttore: puoi condividere i dati come servizio all'interno dell'organizzazione, ma in questo modo i consumatori possono anche eseguire azioni sui dati di origine. Ad esempio, possono restituire up-to-date valori o confermare la ricezione dei dati. Questi sono solo un paio di possibili casi d'uso aziendali.
Inserisci record aggiuntivi sul produttore: i consumatori possono aggiungere record ai dati di origine originali. Questi possono essere contrassegnati come provenienti dal consumatore, se necessario.
Per informazioni specifiche su come eseguire operazioni di scrittura su un datashare, vedere Condivisione dell'accesso in scrittura ai dati (anteprima).
Condivisione dei dati a diversi livelli in Amazon Redshift
Con Amazon Redshift, è possibile condividere i dati a diversi livelli. Questi livelli includono database, schemi, tabelle, viste (incluse viste regolari, con associazione tardiva e materializzata) e funzioni SQL definite dall'utente (). UDFs È possibile creare più unità di condivisione dati per un dato database. Una unità di condivisione dati può contenere oggetti provenienti da più schemi nel database in cui viene creata la condivisione.
Grazie a questa flessibilità nella condivisione dei dati, si ottiene un controllo degli accessi a grana fine. È possibile personalizzare questo controllo per diversi utenti e aziende che hanno bisogno di accedere ai dati di Amazon Redshift.
Gestione della coerenza per la condivisione dei dati in Amazon Redshift
Amazon Redshift offre coerenza transazionale su tutti i cluster di produttori e consumatori up-to-date e condivide visualizzazioni coerenti dei dati con tutti i consumatori.
È possibile aggiornare continuamente i dati nel cluster producer. Tutte le query su un cluster di consumer all'interno di una transazione leggono lo stesso stato dei dati condivisi. Amazon Redshift non prende in considerazione i dati che sono stati modificati da un'altra transazione nel cluster di producer di cui è stato eseguito il commit dopo l'inizio della transazione sul cluster di consumer. Dopo il commit della modifica dei dati nel cluster producer, le nuove transazioni nel cluster consumer possono eseguire immediatamente una query sui dati aggiornati.
L'elevata coerenza elimina i rischi di report aziendali a bassa affidabilità che potrebbero contenere risultati non validi durante la condivisione dei dati. Questo fattore è particolarmente importante per l'analisi finanziaria o dove i risultati potrebbero essere utilizzati per preparare set di dati che vengono utilizzati per addestrare modelli di machine learning.