Configurar o Athena para usar um conector de metastore do Hive implantado
Depois de implantar um conector de origem dos dados do Lambda em sua conta, como AthenaHiveMetastoreFunction
, você pode configurar o Athena para usá-lo. Para isso, crie um nome de origem dos dados que faça referência a sua metastore externa do Hive para usar em suas consultas do Athena.
Para conectar o Athena ao metastore do Hive usando uma função do Lambda existente
Abra o console do Athena em https://console.aws.amazon.com/athena/
. Se o painel de navegação do console não estiver visível, escolha o menu de expansão à esquerda.
-
Escolha Data sources (Origens de dados).
-
Na página Data sources (Origens de dados), escolha Create data source (Criar origem dos dados).
-
Na página Choose a data source (Escolher uma origem dos dados), em Data sources (Origens de dados), escolha S3 - Apache Hive metastore.
-
Escolha Próximo.
-
Na seção Data source details (Detalhes da origem dos dados), em Data source name (Nome da origem dos dados), insira o nome que deseja usar em suas instruções SQL ao consultar a origem dos dados pelo Athena (por exemplo,
MyHiveMetastore
). O nome pode ter até 127 caracteres e deve ser exclusivo na sua conta. Ele não poderá ser alterado após a criação. Os caracteres válidos são a-z, A-Z, 0-9, _ (sublinhado), @ (arroba) e - (hífen). Os nomesawsdatacatalog
,hive
,jmx
esystem
são reservados pelo Athena e não podem ser usados como nomes de origens dos dados. -
Na seção Connection details (Detalhes da conexão), use a caixa Select or enter a Lambda function (Selecionar ou inserir uma função do Lambda) para escolher o nome da função que você acabou de criar. O ARN da função do Lambda é exibido.
-
(Opcional) Para Tags, adicione pares de chave-valor a associar com essa origem dos dados. Para obter mais informações sobre tags, consulte Marcar recursos do Athena com tags.
-
Escolha Próximo.
-
Na página Review and create (Revisar e criar), analise os detalhes da origem dos dados e escolha Create data source (Criar origem dos dados).
-
A seção Data source details (Detalhes da origem dos dados) da página de sua origem dos dados mostra informações sobre o novo conector.
Agora você poderá usar o Data source name (Nome da origem dos dados) especificado para fazer referência ao metastore do Hive em suas consultas SQL no Athena.
Nas consultas SQL, use a seguinte sintaxe de exemplo, substituindo
ehms-catalog
pelo nome da origem dos dados especificada anteriormente.SELECT * FROM ehms-catalog.CustomerData.customers
-
Para visualizar, editar ou excluir as fontes de dados criadas, consulte Gerenciar suas fontes de dados.