

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Consulta de datos HealthOmics analíticos
<a name="analytics-query-data"></a>

**importante**  
AWS HealthOmics las tiendas de variantes y las tiendas de anotaciones ya no están abiertas a nuevos clientes. Los clientes existentes pueden seguir utilizando el servicio con normalidad. Para obtener más información, consulte [AWS HealthOmics cambio en la disponibilidad del almacén de variantes y del almacén de anotaciones](variant-store-availability-change.md).

Puede realizar consultas en sus tiendas de variantes mediante AWS Lake Formation Amazon Athena o Amazon EMR. Antes de ejecutar cualquier consulta, complete los procedimientos de configuración (descritos en las siguientes secciones) para Lake Formation y Amazon Athena.

Para obtener información sobre Amazon EMR, consulte el [tutorial: Introducción a Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-gs.html)

En el caso de las tiendas de variantes creadas después del 26 de septiembre de 2024, HealthOmics divida la tienda por ID de muestra. Esta partición significa que HealthOmics utiliza el ID de muestra para optimizar el almacenamiento de la información de la variante. Las consultas que utilizan información de muestra como filtros devolverán los resultados más rápido, ya que la consulta escanea menos datos. 

HealthOmics usa muestras IDs como nombres de archivos de partición. Antes de ingerir datos, compruebe si el ID de muestra contiene algún dato de PHI. Si es así, cambie la ID de la muestra antes de ingerir los datos. Para obtener más información sobre qué contenido incluir y qué no incluir en la muestra IDs, consulte la guía en la página web sobre el [cumplimiento de la AWS HIPAA](https://aws.amazon.com/compliance/hipaa-compliance).

**Topics**
+ [Configuración de Lake Formation para usar HealthOmics](setting-up-lf.md)
+ [Configuración de Athena para consultas](analytics-setting-up-athena.md)
+ [Ejecutar consultas en tiendas de HealthOmics variantes](analytics-run-queries.md)

# Configuración de Lake Formation para usar HealthOmics
<a name="setting-up-lf"></a>

**importante**  
AWS HealthOmics Las tiendas de variantes y las tiendas de anotaciones ya no están abiertas a nuevos clientes. Los clientes existentes pueden seguir utilizando el servicio con normalidad. Para obtener más información, consulte [AWS HealthOmics cambio en la disponibilidad del almacén de variantes y del almacén de anotaciones](variant-store-availability-change.md).

Antes de usar Lake Formation para administrar HealthOmics los almacenes de datos, lleve a cabo los siguientes procedimientos de configuración de Lake Formation.

**Topics**
+ [Crear o verificar los administradores de Lake Formation](#create-lf-admins)
+ [Creación de enlaces de recursos mediante la consola de Lake Formation](#create-resource-links)
+ [Configurar los permisos para AWS RAM los recursos compartidos](#configure-lf-permissions)

## Crear o verificar los administradores de Lake Formation
<a name="create-lf-admins"></a>

Antes de poder crear un lago de datos en Lake Formation, debe definir uno o más administradores.

Los administradores son usuarios y roles con permisos para crear enlaces a recursos. Los administradores de los lagos de datos se configuran por cuenta y región.

**Cree un usuario administrador en la consola de Lake Formation**

1. Abra la consola AWS Lake Formation: consola [Lake Formation](https://console.aws.amazon.com//lakeformation)

1. Si la consola muestra el panel **Welcome to Lake Formation**, seleccione **Comenzar**.

   Lake Formation lo agrega a la tabla de **administradores de Data Lake**.

1. De lo contrario, en el menú de la izquierda, seleccione **Funciones y tareas administrativas**.

1. Añada los administradores adicionales que sean necesarios.

## Creación de enlaces de recursos mediante la consola de Lake Formation
<a name="create-resource-links"></a>

Para crear un recurso compartido que los usuarios puedan consultar, los controles de acceso predeterminados deben estar deshabilitados. Para obtener más información sobre cómo deshabilitar los controles de acceso predeterminados, consulte [Cambiar la configuración de seguridad predeterminada de su lago de datos](https://docs.aws.amazon.com/lake-formation/latest/dg/change-settings.html) en la documentación de Lake Formation. Puede crear enlaces a recursos de forma individual o en grupo para poder acceder a los datos de Amazon Athena u otros AWS servicios (como Amazon EMR).

**Crear enlaces a recursos en la consola de AWS Lake Formation y compartirlos con los usuarios de HealthOmics Analytics**

1. Abra la consola AWS Lake Formation: consola [Lake Formation](https://console.aws.amazon.com//lakeformation)

1. En la barra de navegación principal, selecciona **Bases de datos**.

1. En la tabla **Bases de datos**, seleccione la base de datos que desee.

1. En el menú **Crear**, seleccione el **enlace de recursos**.

1. Introduzca un **nombre de enlace a un recurso**. Si planea acceder a la base de datos desde Athena, introduzca un nombre utilizando solo letras minúsculas (hasta 256 caracteres).

1. Seleccione **Crear**.

1. **El nuevo enlace al recurso ahora aparece en Bases de datos.**

### Conceda acceso al recurso compartido mediante la consola de Lake Formation
<a name="create-resource-links"></a>

El administrador de la base de datos de Lake Formation puede conceder acceso al recurso compartido mediante el siguiente procedimiento.

1. Abre la consola de AWS Lake Formation: [https://console.aws.amazon.com/lakeformation/](https://console.aws.amazon.com//lakeformation)

1. En la barra de navegación principal, selecciona **Bases de datos**.

1. En la página **Bases** de datos, seleccione el enlace al recurso que creó anteriormente.

1. En el menú **Acciones**, selecciona **Otorgar al objetivo**.

1. En la página **Conceder permisos de datos**, en la sección **Principales**, selecciona **Usuarios o roles de IAM**.

1. En el menú desplegable de **usuarios o roles de IAM**, busca el usuario al que quieres conceder acceso.

1. A continuación, en las **etiquetas LF o en la tarjeta de recursos del catálogo**, seleccione la opción Recursos del **catálogo de datos con nombre asignado**.

1. En el menú **desplegable opcional de tablas**, selecciona **Todas las tablas** o la tabla que creaste anteriormente.

1. **En la tarjeta de **permisos de tabla**, en **Permisos de tabla**, elija **Describir** y Seleccionar.**

1. A continuación, selecciona **Otorgar**.

Para ver los permisos de Lake Formation, elija **los permisos de Data Lake** en el panel de navegación principal. En la tabla se muestran las bases de datos y los enlaces a los recursos disponibles.

## Configurar los permisos para AWS RAM los recursos compartidos
<a name="configure-lf-permissions"></a>

En la consola de AWS Lake Formation, seleccione los permisos de **Data Lake en la barra de navegación principal para ver los permisos**. En la página de **permisos de datos**, puede ver una tabla que muestra los **tipos de recursos** y las **bases** de datos y **ARN** qué está relacionado con un recurso compartido en **RAM Resource Share**. Si necesitas aceptar un recurso compartido AWS Resource Access Manager (AWS RAM), se lo AWS Lake Formation notificará en la consola.

HealthOmics puede aceptar implícitamente los AWS RAM recursos compartidos durante la creación de la tienda. Para aceptar el AWS RAM recurso compartido, el usuario o rol de IAM que invoca las operaciones `CreateVariantStore` o la `CreateAnnotationStore` API debe permitir las siguientes acciones:
+ `ram:GetResourceShareInvitations`- Esta acción permite HealthOmics encontrar las invitaciones.
+ `ram:AcceptResourceShareInvitation`- Esta acción HealthOmics permite aceptar la invitación mediante un token FAS.

Sin estos permisos, aparecerá un error de autorización durante la creación de la tienda.

Este es un ejemplo de política que incluye estas acciones. Agregue esta política al usuario o rol de IAM que acepta el AWS RAM recurso compartido.

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "omics:*",
        "ram:AcceptResourceShareInvitation",
        "ram:GetResourceShareInvitations"
      ],
      "Resource": "*"
    }
  ]
}
```

------

# Configuración de Athena para consultas
<a name="analytics-setting-up-athena"></a>

**importante**  
AWS HealthOmics las tiendas de variantes y las tiendas de anotaciones ya no están abiertas a nuevos clientes. Los clientes existentes pueden seguir utilizando el servicio con normalidad. Para obtener más información, consulte [AWS HealthOmics cambio en la disponibilidad del almacén de variantes y del almacén de anotaciones](variant-store-availability-change.md).

Puedes usar Athena para consultar variantes y anotaciones. Antes de ejecutar cualquier consulta, lleve a cabo las siguientes tareas de configuración:

**Topics**
+ [Configurar una ubicación de resultados de consulta mediante la consola Athena](#configure-athena-query)
+ [Configurar un grupo de trabajo con el motor Athena v3](#configure-athena-workgroup)

## Configurar una ubicación de resultados de consulta mediante la consola Athena
<a name="configure-athena-query"></a>

Para configurar una ubicación de resultados de consulta, siga estos pasos.

1. [Abra la consola Athena: consola Athena](https://console.aws.amazon.com//athena)

1. En la barra de navegación principal, selecciona el editor de **consultas**.

1. En el editor de consultas, selecciona la pestaña **Configuración** y, a continuación, selecciona **Administrar**.

1. Introduzca el prefijo S3 de una ubicación para guardar el resultado de la consulta.

## Configurar un grupo de trabajo con el motor Athena v3
<a name="configure-athena-workgroup"></a>

Para configurar un grupo de trabajo, siga estos pasos.

1. [Abra la consola Athena: consola Athena](https://console.aws.amazon.com//athena)

1. **En la barra de navegación principal, elija **Grupos de trabajo y, a continuación, Crear grupo** de trabajo.**

1. Introduzca un nombre para el grupo de trabajo.

1. Seleccione **Athena SQL** como tipo de motor.

1. En **Actualizar el motor de consultas**, seleccione **Manual**.

1. En **Query version engine**, selecciona **Athena versión 3**.

1. Elija **Crear grupo de trabajo**.

# Ejecutar consultas en tiendas de HealthOmics variantes
<a name="analytics-run-queries"></a>

**importante**  
AWS HealthOmics las tiendas de variantes y las tiendas de anotaciones ya no están abiertas a nuevos clientes. Los clientes existentes pueden seguir utilizando el servicio con normalidad. Para obtener más información, consulte [AWS HealthOmics cambio en la disponibilidad del almacén de variantes y del almacén de anotaciones](variant-store-availability-change.md).

Puedes realizar consultas en tu tienda de variantes con Amazon Athena. Tenga en cuenta que las coordenadas genómicas de los almacenes de variantes y anotaciones se representan como intervalos de base cero, semicerrados y semiabiertos.

## Ejecute una consulta sencilla con la consola Athena
<a name="run-queries-athena-simple"></a>

El siguiente ejemplo muestra cómo ejecutar una consulta sencilla.

1. [Abra el editor de consultas de Athena: editor de consultas de Athena](https://console.aws.amazon.com//athena)

1. En **Grupo de trabajo**, seleccione el grupo de trabajo que creó durante la configuración.

1. Compruebe que la **fuente de datos** sea. **AwsDataCatalog**

1. En **Database**, seleccione el enlace de recursos de base de datos que creó durante la configuración de Lake Formation.

1. Copie la siguiente consulta en el **editor de consultas**, en la pestaña **Consulta 1**:

   ```
   SELECT * from omicsvariants limit 10
   ```

1. Seleccione **Ejecutar** para ejecutar la consulta. La consola rellena la tabla de resultados con las 10 primeras filas de la **omicsvariants** tabla.

## Ejecute una consulta compleja con la consola de Athena
<a name="run-queries-athena-complex"></a>

El siguiente ejemplo muestra cómo ejecutar una consulta compleja. Para ejecutar esta consulta, `ClinVar` impórtela al almacén de anotaciones.

**Ejecute una consulta compleja**

1. [Abra el editor de consultas de Athena: editor de consultas de Athena](https://console.aws.amazon.com//athena)

1. En **Grupo de trabajo**, seleccione el grupo de trabajo que creó durante la configuración.

1. Compruebe que la **fuente de datos** sea. **AwsDataCatalog**

1. En **Database**, seleccione el enlace de recursos de base de datos que creó durante la configuración de Lake Formation.

1. Seleccione la de **\$1** la parte superior derecha para crear una nueva pestaña de **consulta denominada Consulta 2**.

1. Copie la siguiente consulta en el **editor de consultas**, en la pestaña **Consulta 2**:

   ```
   SELECT variants.sampleid,
     variants.contigname,
     variants.start,
     variants."end",
     variants.referenceallele,
     variants.alternatealleles,
     variants.attributes AS variant_attributes,
     clinvar.attributes AS clinvar_attributes  
   FROM omicsvariants as variants 
   INNER JOIN omicsannotations as clinvar ON 
     variants.contigname=CONCAT('chr',clinvar.contigname) 
     AND variants.start=clinvar.start 
     AND variants."end"=clinvar."end" 
     AND variants.referenceallele=clinvar.referenceallele 
     AND variants.alternatealleles=clinvar.alternatealleles 
   WHERE clinvar.attributes['CLNSIG']='Likely_pathogenic'
   ```

1. Seleccione **Ejecutar** para empezar a ejecutar la consulta. 