Consulta de datos geoespaciales - Amazon Athena

Consulta de datos geoespaciales

Los datos geoespaciales contienen identificadores que especifican la posición geográfica de un objeto. Este tipo de datos puede corresponder a informes meteorológicos, direcciones de mapas, tweets con posiciones geográficas, ubicaciones de almacenes y rutas de líneas aéreas. Los datos geoespaciales desempeñan un papel importante en el análisis, los informes y las previsiones de negocio.

Los identificadores geoespaciales, como la latitud y la longitud, le permiten convertir cualquier dirección postal en un conjunto de coordenadas geográficas.

¿Qué es una consulta geoespacial?

Las consultas geoespaciales son tipos de consultas SQL especializadas admitidas en Athena. Se diferencian de las consultas SQL que no son espaciales en lo siguiente:

  • Utilizan los siguientes tipos de datos geométricos especializados: point, line, multiline, polygon y multipolygon.

  • Expresan relaciones entre tipos de datos geométricos como distance, equals, crosses, touches, overlaps, disjoint y otros.

Con las consultas geoespaciales en Athena, puede ejecutar las siguientes operaciones y otras similares:

  • Encontrar la distancia entre dos puntos.

  • Comprobar si un área (polígono) contiene otra área.

  • Comprobar si una línea cruza o toca otra línea u otro polígono.

Por ejemplo, para obtener un tipo de datos geométricos point a partir de valores de tipo double para las coordenadas geográficas del Monte Rainier en Athena, utilice la función geoespacial ST_Point (longitude, latitude), como en el siguiente ejemplo.

ST_Point(-121.7602, 46.8527)

Formatos de los datos de entrada y tipos de datos geométricos

Para utilizar funciones geoespaciales en Athena, introduzca los datos en formato WKT o bien utilice el SerDe JSON de Hive. También puede utilizar los tipos de datos geométricos compatibles con Athena.

Formatos de los datos de entrada

Para gestionar las consultas geoespaciales, Athena admite datos de entrada con los siguientes formatos de datos:

  • WKT (Well-known Text). En Athena, WKT se representa como varchar(x) o un tipo de datos string.

  • Datos geoespaciales con codificación JSON. Para analizar archivos JSON con datos geoespaciales y crear tablas para ellos, Athena utiliza el SerDe JSON de Hive. Para obtener más información sobre el uso de este SerDe en Athena, consulte Bibliotecas de SerDe JSON.

Tipos de datos geométricos

Para gestionar las consultas geoespaciales, Athena admite los siguientes tipos de datos geométricos especializados:

  • point

  • line

  • polygon

  • multiline

  • multipolygon