Configurar o Athena para usar um conector de metastore do Hive implantado - Amazon Athena

Configurar o Athena para usar um conector de metastore do Hive implantado

Depois de implantar um conector de origem dos dados do Lambda em sua conta, como AthenaHiveMetastoreFunction, você pode configurar o Athena para usá-lo. Para isso, crie um nome de origem dos dados que faça referência a sua metastore externa do Hive para usar em suas consultas do Athena.

Para conectar o Athena ao metastore do Hive usando uma função do Lambda existente
  1. Abra o console do Athena em https://console.aws.amazon.com/athena/.

  2. Se o painel de navegação do console não estiver visível, escolha o menu de expansão à esquerda.

    Escolha o menu de expansão.
  3. Escolha Data sources (Origens de dados).

  4. Na página Data sources (Origens de dados), escolha Create data source (Criar origem dos dados).

  5. Na página Choose a data source (Escolher uma origem dos dados), em Data sources (Origens de dados), escolha S3 - Apache Hive metastore.

  6. Escolha Próximo.

  7. Na seção Data source details (Detalhes da origem dos dados), em Data source name (Nome da origem dos dados), insira o nome que deseja usar em suas instruções SQL ao consultar a origem dos dados pelo Athena (por exemplo, MyHiveMetastore). O nome pode ter até 127 caracteres e deve ser exclusivo na sua conta. Ele não poderá ser alterado após a criação. Os caracteres válidos são a-z, A-Z, 0-9, _ (sublinhado), @ (arroba) e - (hífen). Os nomes awsdatacatalog, hive, jmx e system são reservados pelo Athena e não podem ser usados como nomes de origens dos dados.

  8. Na seção Connection details (Detalhes da conexão), use a caixa Select or enter a Lambda function (Selecionar ou inserir uma função do Lambda) para escolher o nome da função que você acabou de criar. O ARN da função do Lambda é exibido.

  9. (Opcional) Para Tags, adicione pares de chave-valor a associar com essa origem dos dados. Para obter mais informações sobre tags, consulte Marcar recursos do Athena com tags.

  10. Escolha Próximo.

  11. Na página Review and create (Revisar e criar), analise os detalhes da origem dos dados e escolha Create data source (Criar origem dos dados).

  12. A seção Data source details (Detalhes da origem dos dados) da página de sua origem dos dados mostra informações sobre o novo conector.

    Agora você poderá usar o Data source name (Nome da origem dos dados) especificado para fazer referência ao metastore do Hive em suas consultas SQL no Athena.

    Nas consultas SQL, use a seguinte sintaxe de exemplo, substituindo ehms-catalog pelo nome da origem dos dados especificada anteriormente.

    SELECT * FROM ehms-catalog.CustomerData.customers
  13. Para visualizar, editar ou excluir as fontes de dados criadas, consulte Gerenciar suas fontes de dados.