Panoramica di Amazon Redshift Spectrum

In questo argomento viene descritto nei dettagli come utilizzare Redshift Spectrum per leggere in modo efficiente da Amazon S3.

Nota

Le istanze Amazon Redshift DC2 e RA3 utilizzano Redshift Spectrum per eseguire query di data lake su una flotta di server dedicati all'esterno del cluster. Le istanze RG di Amazon Redshift e Amazon Redshift Serverless includono un motore di query Data Lake integrato che viene eseguito sulle risorse di elaborazione proprie del cluster. Per informazioni, consulta Interrogazione del data lake.

Amazon Redshift Spectrum si trova su dei server Amazon Redshift dedicati indipendenti dal cluster. Amazon Redshift trasmette al livello Redshift Spectrum molte attività che richiedono un'importante capacità di calcolo, come l'aggregazione e il filtraggio di predicati. Le query di Redshift Spectrum utilizzano quindi una capacità di elaborazione del cluster molto inferiore rispetto alle altre query. Redshift Spectrum consente inoltre un dimensionamento intelligente. In base alle richieste delle query, Redshift può potenzialmente utilizzare migliaia di istanze per beneficiare dell'elaborazione MPP (Massive Parallel Processing).

Per creare le tabelle di Redshift Spectrum, è necessario definire la struttura dei file e registrare quest'ultimi come tabelle in un catalogo dati esterno. Il catalogo dati esterno può essere AWS Glue il catalogo dati fornito con Amazon Athena o il tuo metastore Apache Hive. È possibile creare e gestire le tabelle esterne da Amazon Redshift utilizzando comandi DDL (data definition language) o qualsiasi altro strumento che si connette al catalogo di dati esterno. Le modifiche al catalogo di dati esterno sono immediatamente disponibili per tutti i cluster Amazon Redshift.

Inoltre, se lo desideri, puoi partizionare le tabelle esterne in una o più colonne. Questa operazione può consentire di migliorare le prestazioni, Il miglioramento si verifica in quanto l'ottimizzatore di query di Amazon Redshift elimina le partizioni che non contengono dati per la query.

Le viste materializzate delle tabelle Spectrum possono migliorare notevolmente i costi e le prestazioni. Per ulteriori informazioni, consulta Viste materializzate per le tabelle di data lake esterne in Amazon Redshift Spectrum.

Dopo la definizione delle tabelle di Redshift Spectrum, è possibile sottoporle a query e join esattamente come con qualunque altra tabella Amazon Redshift. Redshift Spectrum non supporta le operazioni di aggiornamento sulle tabelle esterne. Puoi aggiungere tabelle Redshift Spectrum a più cluster Amazon Redshift e interrogare gli stessi dati su Amazon S3 da qualsiasi cluster nella stessa regione. AWS Quando si aggiornano i file di dati Amazon S3, i dati diventano immediatamente disponibili per query da qualsiasi cluster Amazon Redshift.

Il catalogo AWS Glue dati a cui accedi potrebbe essere crittografato per aumentare la sicurezza. Se il AWS Glue catalogo è crittografato, è necessaria la chiave AWS Key Management Service (AWS KMS) AWS Glue per accedere al AWS Glue catalogo. AWS Glue la crittografia del catalogo non è disponibile in tutte le AWS regioni. Per un elenco delle AWS regioni supportate, consulta Encryption and Secure Access AWS Glue nella AWS Glue Developer Guide.Per ulteriori informazioni sulla crittografia del catalogo AWS Glue dati, consulta Encrypting Your AWS Glue Data Catalog nella Guida per gli AWS Glue sviluppatori.

Nota

Non è possibile visualizzare i dettagli per le tabelle Redshift Spectrum che utilizzano le stesse risorse utilizzate per le tabelle Amazon Redshift standard come PG_TABLE_DEF, STV_TBL_PERM, PG_CLASS o information_schema. Se il tuo strumento di business intelligence o di analisi non riconosce le tabelle esterne Redshift Spectrum, configura l'applicazione per eseguire la query su SVV_EXTERNAL_TABLES e SVV_EXTERNAL_COLUMNS.

Regioni di Amazon Redshift Spectrum

Redshift Spectrum è disponibile Regioni AWS dove è disponibile Amazon Redshift, se non diversamente specificato nella documentazione specifica della regione. Per Regione AWS la disponibilità nelle aree commerciali, consulta Endpoints di servizio per l'API Redshift nel. Riferimenti generali di Amazon Web Services

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Amazon Redshift Spectrum

Limitazioni di Amazon Redshift Spectrum