

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Consultando HealthOmics dados analíticos
<a name="analytics-query-data"></a>

**Importante**  
AWS HealthOmics lojas de variantes e lojas de anotações não estão mais abertas a novos clientes. Os clientes atuais podem continuar usando o serviço normalmente. Para obter mais informações, consulte [AWS HealthOmics alteração na disponibilidade da loja de variantes e da loja de anotações](variant-store-availability-change.md).

Você pode realizar consultas em seus armazenamentos de variantes usando o AWS Lake Formation Amazon Athena ou o Amazon EMR. Antes de executar qualquer consulta, conclua os procedimentos de configuração (descritos nas seções a seguir) para Lake Formation e Amazon Athena.

Para obter informações sobre o Amazon EMR, consulte [Tutorial: Introdução ao Amazon](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-gs.html) EMR

Para lojas de variantes criadas após 26 de setembro de 2024, HealthOmics particiona a loja por ID de amostra. Esse particionamento significa que HealthOmics usa o ID de amostra para otimizar o armazenamento das informações da variante. As consultas que usam informações de amostra como filtros retornarão os resultados mais rapidamente, pois a consulta digitaliza menos dados. 

HealthOmics usa amostra IDs como nomes de arquivo de partição. Antes de ingerir dados, verifique se o ID da amostra contém dados de PHI. Se isso acontecer, altere a ID da amostra antes de ingerir os dados. Para obter mais informações sobre qual conteúdo incluir e não incluir na amostra IDs, consulte as orientações na página da web de [conformidade com a AWS HIPAA](https://aws.amazon.com/compliance/hipaa-compliance).

**Topics**
+ [Configurando o Lake Formation para usar HealthOmics](setting-up-lf.md)
+ [Configurando o Athena para consultas](analytics-setting-up-athena.md)
+ [Executando consultas em lojas de HealthOmics variantes](analytics-run-queries.md)

# Configurando o Lake Formation para usar HealthOmics
<a name="setting-up-lf"></a>

**Importante**  
AWS HealthOmics lojas de variantes e lojas de anotações não estão mais abertas a novos clientes. Os clientes atuais podem continuar usando o serviço normalmente. Para obter mais informações, consulte [AWS HealthOmics alteração na disponibilidade da loja de variantes e da loja de anotações](variant-store-availability-change.md).

Antes de usar o Lake Formation para gerenciar armazenamentos de HealthOmics dados, execute os seguintes procedimentos de configuração do Lake Formation.

**Topics**
+ [Criando ou verificando administradores do Lake Formation](#create-lf-admins)
+ [Criação de links de recursos usando o console Lake Formation](#create-resource-links)
+ [Configurando permissões para compartilhamentos AWS RAM de recursos](#configure-lf-permissions)

## Criando ou verificando administradores do Lake Formation
<a name="create-lf-admins"></a>

Antes de criar um data lake no Lake Formation, você define um ou mais administradores.

Os administradores são usuários e funções com permissões para criar links de recursos. Você configura administradores de data lake por conta por região.

**Crie um usuário administrador no console do Lake Formation**

1. Abra o console do AWS Lake Formation: console [do Lake Formation](https://console.aws.amazon.com//lakeformation)

1. Se o console exibir o painel **Welcome to Lake Formation**, escolha **Começar**.

   O Lake Formation adiciona você à tabela de **administradores do Data Lake**.

1. Caso contrário, no menu à esquerda, escolha **Funções e tarefas administrativas**.

1. Adicione outros administradores conforme necessário.

## Criação de links de recursos usando o console Lake Formation
<a name="create-resource-links"></a>

Para criar um recurso compartilhado que os usuários possam consultar, os controles de acesso padrão devem estar desativados. Para saber mais sobre como desativar os controles de acesso padrão, consulte [Alteração das configurações de segurança padrão do seu data lake](https://docs.aws.amazon.com/lake-formation/latest/dg/change-settings.html) na documentação do Lake Formation. Você pode criar links de recursos individualmente ou em grupo, para poder acessar dados no Amazon Athena ou em outros AWS serviços (como o Amazon EMR).

**Criar links de recursos no console do AWS Lake Formation e compartilhá-los com os usuários do HealthOmics Analytics**

1. Abra o console do AWS Lake Formation: console [do Lake Formation](https://console.aws.amazon.com//lakeformation)

1. Na barra de navegação principal, escolha **Bancos de dados**.

1. Na tabela **Bancos de dados**, selecione o banco de dados desejado.

1. No menu **Criar**, escolha **Link do recurso**.

1. Insira o **nome do link do recurso**. Se você planeja acessar o banco de dados a partir do Athena, insira um nome usando somente letras minúsculas (até 256 caracteres).

1. Escolha **Criar**.

1. O novo link do recurso agora está listado em **Bancos de dados**.

### Conceda acesso ao recurso compartilhado usando o console do Lake Formation
<a name="create-resource-links"></a>

Um administrador de banco de dados do Lake Formation pode conceder acesso ao recurso compartilhado usando o procedimento a seguir.

1. Abra o console do AWS Lake Formation: [https://console.aws.amazon.com/lakeformation/](https://console.aws.amazon.com//lakeformation)

1. Na barra de navegação principal, escolha **Bancos de dados**.

1. Na página **Bancos de dados**, selecione o link do recurso que você criou anteriormente.

1. No menu **Ações**, escolha **Conceder no alvo**.

1. Na página **Conceder permissões de dados**, em **Diretores**, escolha **usuários ou funções do IAM**.

1. No menu suspenso **Usuários ou funções do IAM**, encontre o usuário ao qual você deseja conceder acesso.

1. Em seguida, em **LF-Tags ou cartão de recursos do catálogo**, selecione a opção Recursos do **catálogo de dados nomeados**.

1. No menu suspenso **Tabelas opcionais**, selecione **Todas as tabelas** ou a tabela que você criou anteriormente.

1. No cartão **Permissões da tabela**, em **Permissões da tabela**, escolha **Descrever** e **selecionar**.

1. Em seguida, escolha **Grant**.

Para visualizar as permissões do Lake Formation, escolha **Permissões do Data lake** no painel de navegação principal. A tabela mostra os bancos de dados e links de recursos disponíveis.

## Configurando permissões para compartilhamentos AWS RAM de recursos
<a name="configure-lf-permissions"></a>

No console do AWS Lake Formation, visualize as permissões escolhendo **Permissões do Data lake** na barra de navegação principal. Na página **Permissões de dados**, você pode ver uma tabela que mostra os **tipos de recursos**, **bancos** de dados e **ARN** que está relacionada a um recurso compartilhado em **Compartilhamento de recursos de RAM**. Se você precisar aceitar um compartilhamento de recursos AWS Resource Access Manager (AWS RAM), AWS Lake Formation notificará você no console.

HealthOmics pode aceitar implicitamente os compartilhamentos AWS RAM de recursos durante a criação da loja. Para aceitar o compartilhamento AWS RAM de recursos, o usuário ou a função do IAM que chama as operações da `CreateAnnotationStore` API `CreateVariantStore` ou da API deve permitir as seguintes ações:
+ `ram:GetResourceShareInvitations`- Esta ação permite HealthOmics encontrar os convites.
+ `ram:AcceptResourceShareInvitation`- Esta ação permite HealthOmics aceitar o convite usando um token FAS.

Sem essas permissões, você vê um erro de autorização durante a criação da loja.

Aqui está um exemplo de política que inclui essas ações. Adicione essa política ao usuário ou função do IAM que aceita o compartilhamento AWS RAM de recursos.

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "omics:*",
        "ram:AcceptResourceShareInvitation",
        "ram:GetResourceShareInvitations"
      ],
      "Resource": "*"
    }
  ]
}
```

------

# Configurando o Athena para consultas
<a name="analytics-setting-up-athena"></a>

**Importante**  
AWS HealthOmics lojas de variantes e lojas de anotações não estão mais abertas a novos clientes. Os clientes atuais podem continuar usando o serviço normalmente. Para obter mais informações, consulte [AWS HealthOmics alteração na disponibilidade da loja de variantes e da loja de anotações](variant-store-availability-change.md).

Você pode usar o Athena para consultar variantes e anotações. Antes de executar qualquer consulta, execute as seguintes tarefas de configuração:

**Topics**
+ [Configurar um local de resultados de consulta usando o console Athena](#configure-athena-query)
+ [Configurar um grupo de trabalho com o Athena engine v3](#configure-athena-workgroup)

## Configurar um local de resultados de consulta usando o console Athena
<a name="configure-athena-query"></a>

Para configurar a localização dos resultados da consulta, siga estas etapas.

1. [Abra o console Athena: console Athena](https://console.aws.amazon.com//athena)

1. Na barra de navegação principal, escolha **Editor de consultas**.

1. No editor de consultas, escolha a guia **Configurações** e, em seguida, escolha **Gerenciar**.

1. Insira um prefixo S3 de um local para salvar o resultado da consulta.

## Configurar um grupo de trabalho com o Athena engine v3
<a name="configure-athena-workgroup"></a>

Para configurar um grupo de trabalho, siga estas etapas.

1. [Abra o console Athena: console Athena](https://console.aws.amazon.com//athena)

1. Na barra de navegação principal, escolha **Grupos de trabalho** e, em seguida, **Criar grupo de trabalho**.

1. Insira um nome para o grupo de trabalho.

1. Selecione **Athena SQL** como o tipo de mecanismo.

1. Em **Atualizar mecanismo de consulta**, selecione **Manual**.

1. Em **Mecanismo de versão do Query**, selecione **Athena versão 3**.

1. Escolha **Create workgroup (Criar grupo de trabalho)**.

# Executando consultas em lojas de HealthOmics variantes
<a name="analytics-run-queries"></a>

**Importante**  
AWS HealthOmics lojas de variantes e lojas de anotações não estão mais abertas a novos clientes. Os clientes atuais podem continuar usando o serviço normalmente. Para obter mais informações, consulte [AWS HealthOmics alteração na disponibilidade da loja de variantes e da loja de anotações](variant-store-availability-change.md).

Você pode realizar consultas na sua loja de variantes usando o Amazon Athena. Observe que as coordenadas genômicas nos armazenamentos de variantes e anotações são representadas como intervalos semiabertos semifechados com base em zero.

## Execute uma consulta simples usando o console Athena
<a name="run-queries-athena-simple"></a>

O exemplo a seguir mostra como executar uma consulta simples.

1. [Abra o editor Athena Query: editor Athena Query](https://console.aws.amazon.com//athena)

1. Em **Grupo de trabalho**, selecione o grupo de trabalho que você criou durante a configuração.

1. Verifique se a **fonte de dados** é **AwsDataCatalog**.

1. Em **Database**, selecione o link do recurso de banco de dados que você criou durante a configuração do Lake Formation.

1. Copie a consulta a seguir no **Editor** de **consultas na guia Consulta 1**:

   ```
   SELECT * from omicsvariants limit 10
   ```

1. Para executar a consulta, escolha **Executar**. O console preenche a tabela de resultados com as primeiras 10 linhas da **omicsvariants** tabela.

## Execute uma consulta complexa usando o console Athena
<a name="run-queries-athena-complex"></a>

O exemplo a seguir mostra como executar uma consulta complexa. Para executar essa consulta, importe `ClinVar` para o armazenamento de anotações.

**Execute uma consulta complexa**

1. [Abra o editor Athena Query: editor Athena Query](https://console.aws.amazon.com//athena)

1. Em **Grupo de trabalho**, selecione o grupo de trabalho que você criou durante a configuração.

1. Verifique se a **fonte de dados** é **AwsDataCatalog**.

1. Em **Database**, selecione o link do recurso de banco de dados que você criou durante a configuração do Lake Formation.

1. Escolha a opção **\$1** no canto superior direito para criar uma nova guia de **consulta chamada Consulta 2**.

1. Copie a consulta a seguir no **Editor** de **consultas na guia Consulta 2**:

   ```
   SELECT variants.sampleid,
     variants.contigname,
     variants.start,
     variants."end",
     variants.referenceallele,
     variants.alternatealleles,
     variants.attributes AS variant_attributes,
     clinvar.attributes AS clinvar_attributes  
   FROM omicsvariants as variants 
   INNER JOIN omicsannotations as clinvar ON 
     variants.contigname=CONCAT('chr',clinvar.contigname) 
     AND variants.start=clinvar.start 
     AND variants."end"=clinvar."end" 
     AND variants.referenceallele=clinvar.referenceallele 
     AND variants.alternatealleles=clinvar.alternatealleles 
   WHERE clinvar.attributes['CLNSIG']='Likely_pathogenic'
   ```

1. Escolha **Executar** para começar a executar a consulta. 