Os dados geoespaciais contêm identificadores que especificam uma posição geográfica para um objeto. Entre os exemplos desse tipo de dados estão previsões do tempo, rotas em mapa, tweets com posições geográficas, locais de lojas e rotas aéreas. Os dados geoespaciais têm uma função importante na analytics comercial, na geração de relatórios e na previsão.
Os identificadores geoespaciais, como latitude e longitude, permitem converter qualquer endereço postal em um conjunto de coordenadas geográficas.
O que é uma consulta geoespacial?
As consultas geoespaciais são tipos especializados de consultas SQL disponíveis no Athena. Elas diferem de consultas SQL não espaciais das seguintes maneiras:
-
Usando os seguintes tipos de dados de geometria especializados:
point
,line
,multiline
,polygon
emultipolygon
. -
Expressando relacionamentos entre tipos de dados, como geometria
distance
,equals
,crosses
,touches
,overlaps
,disjoint
e outros.
Com as consultas geoespaciais no Athena, você pode executar estas e outras operações semelhantes:
-
Encontrar a distância entre dois pontos.
-
Verificar se uma área (polígono) contém outra.
-
Verifique se uma linha cruza ou toca outra linha ou polígono.
Por exemplo, para obter um tipo de dados de geometria point
de valores do tipo double
para as coordenadas geográficas do Monte Rainier no Athena, use a função geoespacial ST_Point (longitude, latitude)
, como no exemplo a seguir.
ST_Point(-121.7602, 46.8527)
Formatos de dados de entrada e tipos de dados de geometria
Para usar as funções geoespaciais no Athena, insira os dados no formato WKT ou use o SerDe JSON do Hive. Você também pode usar os tipos de dados de geometria disponíveis no Athena.
Formatos de dados de entrada
Para processar as consultas geoespaciais, o Athena permite a entrada de dados nestes formatos:
-
Well-Known Text (WKT – Texto bem conhecido). No Athena, o WKT é representado como um tipo de dados
varchar(x)
oustring
. -
Dados geoespaciais codificados por JSON. Para analisar arquivos JSON com dados geoespaciais e criar tabelas para eles, o Athena usa o SerDe JSON do Hive
. Para obter mais informações sobre como usar esse SerDe no Athena, consulte Bibliotecas SerDe JSON.
Tipos de dados de geometria
Para processar as consultas geoespaciais, o Athena aceita os seguintes tipos de dados de geometria especializados:
-
point
-
line
-
polygon
-
multiline
-
multipolygon
Funções geoespaciais aceitas
Para obter informações sobre as funções geoespaciais no mecanismo Athena versão 3, consulte Geospatial functions