Consulta de datos geoespaciales
Los datos geoespaciales contienen identificadores que especifican la posición geográfica de un objeto. Este tipo de datos puede corresponder a informes meteorológicos, direcciones de mapas, tweets con posiciones geográficas, ubicaciones de almacenes y rutas de líneas aéreas. Los datos geoespaciales desempeñan un papel importante en el análisis, los informes y las previsiones de negocio.
Los identificadores geoespaciales, como la latitud y la longitud, le permiten convertir cualquier dirección postal en un conjunto de coordenadas geográficas.
¿Qué es una consulta geoespacial?
Las consultas geoespaciales son tipos de consultas SQL especializadas admitidas en Athena. Se diferencian de las consultas SQL que no son espaciales en lo siguiente:
-
Utilizan los siguientes tipos de datos geométricos especializados:
point
,line
,multiline
,polygon
ymultipolygon
. -
Expresan relaciones entre tipos de datos geométricos como
distance
,equals
,crosses
,touches
,overlaps
,disjoint
y otros.
Con las consultas geoespaciales en Athena, puede ejecutar las siguientes operaciones y otras similares:
-
Encontrar la distancia entre dos puntos.
-
Comprobar si un área (polígono) contiene otra área.
-
Comprobar si una línea cruza o toca otra línea u otro polígono.
Por ejemplo, para obtener un tipo de datos geométricos point
a partir de valores de tipo double
para las coordenadas geográficas del Monte Rainier en Athena, utilice la función geoespacial ST_Point (longitude, latitude)
, como en el siguiente ejemplo.
ST_Point(-121.7602, 46.8527)
Formatos de los datos de entrada y tipos de datos geométricos
Para utilizar funciones geoespaciales en Athena, introduzca los datos en formato WKT o bien utilice el SerDe JSON de Hive. También puede utilizar los tipos de datos geométricos compatibles con Athena.
Formatos de los datos de entrada
Para gestionar las consultas geoespaciales, Athena admite datos de entrada con los siguientes formatos de datos:
-
WKT (Well-known Text). En Athena, WKT se representa como
varchar(x)
o un tipo de datosstring
. -
Datos geoespaciales con codificación JSON. Para analizar archivos JSON con datos geoespaciales y crear tablas para ellos, Athena utiliza el SerDe JSON de Hive
. Para obtener más información sobre el uso de este SerDe en Athena, consulte Bibliotecas de SerDe JSON.
Tipos de datos geométricos
Para gestionar las consultas geoespaciales, Athena admite los siguientes tipos de datos geométricos especializados:
-
point
-
line
-
polygon
-
multiline
-
multipolygon