Caricamento di uno shapefile in Amazon Redshift - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Caricamento di uno shapefile in Amazon Redshift

È possibile utilizzare il COPY comando per importare gli shapefile Esri archiviati in Amazon S3 nelle tabelle Amazon Redshift. Uno shapefile memorizza le informazioni sulla posizione geometrica e sugli attributi delle caratteristiche geografiche in un formato vettoriale. Il formato shapefile può descrivere spazialmente oggetti spaziali quali punti, linee e poligoni. Per ulteriori informazioni su uno shapefile, consultare Shapefile in Wikipedia.

Il COPY comando supporta il parametro del formato dei dati. SHAPEFILE Per impostazione predefinita, la prima colonna dello shapefile è una colonna GEOMETRY o IDENTITY. Tutte le colonne successive seguono l'ordine specificato nello shapefile. Tuttavia, non è necessario che la tabella di destinazione abbia questo layout esatto perché è possibile utilizzare la mappatura delle COPY colonne per definire l'ordine. Per informazioni sul COPY comando shapefile support, vedere. SHAPEFILE

In alcuni casi, la dimensione della geometria risultante potrebbe essere maggiore del massimo per la memorizzazione di una geometria in Amazon Redshift. In tal caso, è possibile utilizzare l'COPYopzione SIMPLIFY o SIMPLIFY AUTO semplificare le geometrie durante l'ingestione come segue:

  • Specificare SIMPLIFY tolerance per semplificare tutte le geometrie durante l'importazione dati utilizzando l'algoritmo Ramer-Douglas-Peucker e la tolleranza specificata.

  • Specificare SIMPLIFY AUTO senza tolleranza per semplificare solo le geometrie che sono più grandi della dimensione massima utilizzando l'algoritmo Ramer-Douglas-Peucker. Questo approccio calcola la tolleranza minima sufficientemente grande da memorizzare l'oggetto entro il limite di dimensione massima.

  • Specificare SIMPLIFY AUTO max_tolerance per semplificare solo le geometrie che sono più grandi della dimensione massima utilizzando l'algoritmo Ramer-Douglas-Peucker e la tolleranza calcolata automaticamente. Questo approccio assicura che la tolleranza non superi la tolleranza massima.

Per informazioni sulle dimensioni massime di un valore di dati GEOMETRY, consultare Considerazioni sull'utilizzo dei dati spaziali con Amazon Redshift.

In alcuni casi, la tolleranza è sufficientemente bassa che il record non può ridursi al di sotto della dimensione massima di un valore di dati GEOMETRY. In questi casi, è possibile utilizzare l'MAXERRORopzione del COPY comando per ignorare tutti o fino a un certo numero di errori di ingestione.

Il COPY comando supporta anche il caricamento GZIP degli shapefile. Per fare ciò, specifica il COPY GZIP parametro. Con questa opzione, tutti i componenti shapefile devono essere compressi in modo indipendente e condividere lo stesso suffisso di compressione.

Se con lo shapefile esiste un file di descrizione della proiezione (.prj), Redshift lo utilizza per determinare l'id () del sistema di riferimento spaziale. SRID Se SRID è valido, alla geometria risultante viene assegnato questo valore. SRID Se il SRID valore associato alla geometria di input non esiste, la geometria risultante ha il SRID valore zero. È possibile disabilitare il rilevamento automatico dell'ID del sistema di riferimento spaziale a livello di sessione utilizzando SET read_srid_on_shapefile_ingestion su OFF.

Eseguire query sul sistema SYS_SPATIAL_SIMPLIFYSVL_SPATIAL_SIMPLIFY per visualizzare quali record sono stati semplificati, insieme alla tolleranza calcolata. Quando si specificaSIMPLIFY tolerance, questa vista contiene un record per ogni COPY operazione. In caso contrario, contiene un record per ogni geometria semplificata. Per ulteriori informazioni, consulta SYS_SPATIAL_SIMPLIFY o SVL_SPATIAL_SIMPLIFY.

Per esempi di caricamento di uno shapefile, consultare Caricamento di uno shapefile in Amazon Redshift.