

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Interrogation de HealthOmics données analytiques
<a name="analytics-query-data"></a>

**Important**  
AWS HealthOmics les magasins de variantes et les magasins d'annotations ne sont plus ouverts aux nouveaux clients. Les clients existants peuvent continuer à utiliser le service normalement. Pour de plus amples informations, veuillez consulter [AWS HealthOmics modification de la disponibilité du magasin de variantes et du magasin d'annotations](variant-store-availability-change.md).

Vous pouvez effectuer des requêtes sur vos variantes de boutiques à l'aide AWS Lake Formation d'Amazon Athena ou d'Amazon EMR. Avant d'exécuter des requêtes, suivez les procédures de configuration (décrites dans les sections suivantes) pour Lake Formation et Amazon Athena.

Pour plus d'informations sur Amazon EMR, consultez [Tutoriel : Getting started with Amazon](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-gs.html) EMR

Pour les variantes de magasins créées après le 26 septembre 2024, HealthOmics partitionnez le magasin par ID d'échantillon. Ce partitionnement signifie qu'il HealthOmics utilise l'identifiant de l'échantillon pour optimiser le stockage des informations sur les variantes. Les requêtes qui utilisent des exemples d'informations comme filtres renvoient des résultats plus rapidement, car elles analysent moins de données. 

HealthOmics utilise un échantillon IDs comme nom de fichier de partition. Avant d'ingérer des données, vérifiez si l'identifiant d'échantillon contient des données PHI. Si c'est le cas, modifiez l'identifiant de l'échantillon avant d'ingérer les données. Pour plus d'informations sur le contenu à inclure et à ne pas inclure dans l'échantillon IDs, consultez les instructions sur la page Web de [conformité à la loi AWS HIPAA](https://aws.amazon.com/compliance/hipaa-compliance).

**Topics**
+ [Configuration de Lake Formation à utiliser HealthOmics](setting-up-lf.md)
+ [Configuration d'Athena pour les requêtes](analytics-setting-up-athena.md)
+ [Exécution de requêtes sur des magasins de HealthOmics variantes](analytics-run-queries.md)

# Configuration de Lake Formation à utiliser HealthOmics
<a name="setting-up-lf"></a>

**Important**  
AWS HealthOmics les magasins de variantes et les magasins d'annotations ne sont plus ouverts aux nouveaux clients. Les clients existants peuvent continuer à utiliser le service normalement. Pour de plus amples informations, veuillez consulter [AWS HealthOmics modification de la disponibilité du magasin de variantes et du magasin d'annotations](variant-store-availability-change.md).

Avant d'utiliser Lake Formation pour gérer les magasins de HealthOmics données, effectuez les procédures de configuration de Lake Formation suivantes.

**Topics**
+ [Création ou vérification des administrateurs de Lake Formation](#create-lf-admins)
+ [Création de liens vers des ressources à l'aide de la console Lake Formation](#create-resource-links)
+ [Configuration des autorisations pour les partages AWS RAM de ressources](#configure-lf-permissions)

## Création ou vérification des administrateurs de Lake Formation
<a name="create-lf-admins"></a>

Avant de créer un lac de données dans Lake Formation, vous devez définir un ou plusieurs administrateurs.

Les administrateurs sont des utilisateurs et des rôles autorisés à créer des liens vers des ressources. Vous configurez les administrateurs de data lake par compte et par région.

**Créez un utilisateur administrateur dans la console Lake Formation**

1. Ouvrez la console AWS Lake Formation : console [Lake Formation](https://console.aws.amazon.com//lakeformation)

1. Si la console affiche le panneau **Welcome to Lake Formation**, choisissez **Get started**.

   Lake Formation vous ajoute à la table des **administrateurs du Data Lake**.

1. Sinon, dans le menu de gauche, sélectionnez **Rôles et tâches** d'administration.

1. Ajoutez des administrateurs supplémentaires si nécessaire.

## Création de liens vers des ressources à l'aide de la console Lake Formation
<a name="create-resource-links"></a>

Pour créer une ressource partagée que les utilisateurs peuvent interroger, les contrôles d'accès par défaut doivent être désactivés. Pour en savoir plus sur la désactivation des contrôles d'accès par défaut, consultez [la section Modification des paramètres de sécurité par défaut pour votre lac de données](https://docs.aws.amazon.com/lake-formation/latest/dg/change-settings.html) dans la documentation de Lake Formation. Vous pouvez créer des liens vers des ressources individuellement ou en groupe, afin d'accéder aux données d'Amazon Athena ou d'autres AWS services (tels qu'Amazon EMR).

**Création de liens vers des ressources dans la console AWS Lake Formation et partage de ces liens avec les utilisateurs HealthOmics d'Analytics**

1. Ouvrez la console AWS Lake Formation : console [Lake Formation](https://console.aws.amazon.com//lakeformation)

1. Dans la barre de navigation principale, sélectionnez **Bases de données**.

1. Dans le tableau **Bases de données**, sélectionnez la base de données souhaitée.

1. Dans le menu **Créer**, choisissez **Lien vers la ressource**.

1. Entrez le **nom du lien vers la ressource**. Si vous prévoyez d'accéder à la base de données depuis Athéna, entrez un nom en minuscules uniquement (256 caractères maximum).

1. Choisissez **Créer**.

1. Le nouveau lien vers la ressource est désormais répertorié sous **Bases de données**.

### Accorder l'accès à la ressource partagée à l'aide de la console Lake Formation
<a name="create-resource-links"></a>

Un administrateur de base de données Lake Formation peut accorder l'accès à la ressource partagée en suivant la procédure suivante.

1. Ouvrez la console AWS Lake Formation : [https://console.aws.amazon.com/lakeformation/](https://console.aws.amazon.com//lakeformation)

1. Dans la barre de navigation principale, sélectionnez **Bases de données**.

1. Sur la page **Bases de données**, sélectionnez le lien de ressource que vous avez créé précédemment.

1. Dans le menu **Actions**, choisissez **Grant on target**.

1. Sur la page **Accorder les autorisations relatives aux données**, sous **Principaux**, sélectionnez **Utilisateurs ou rôles IAM**.

1. Dans le menu déroulant **Utilisateurs ou rôles IAM**, recherchez l'utilisateur auquel vous souhaitez accorder l'accès.

1. Ensuite, sous **Étiquettes LF ou carte de ressources de catalogue**, sélectionnez l'option **Ressources de catalogue de données nommées**.

1. Dans le menu déroulant **Tables (facultatif)**, sélectionnez **Toutes les tables** ou la table que vous avez créée précédemment.

1. Dans la fiche **Autorisations du tableau**, sous **Autorisations du tableau**, choisissez **Décrire** et **sélectionner**.

1. Ensuite, choisissez **Grant**.

Pour consulter les autorisations de Lake Formation, choisissez **Data Lake Permissions** dans le volet de navigation principal. Le tableau indique les bases de données et les liens vers les ressources disponibles.

## Configuration des autorisations pour les partages AWS RAM de ressources
<a name="configure-lf-permissions"></a>

Dans la console AWS Lake Formation, consultez les autorisations en choisissant Autorisations du **lac de données** dans la barre de navigation principale. Sur la page **Autorisations relatives aux données**, vous pouvez consulter un tableau qui indique les **types de ressources**, les **bases de données**, ainsi **ARN** que les informations relatives à une ressource partagée dans le cadre du **partage des ressources RAM**. Si vous devez accepter un partage de ressources AWS Resource Access Manager (AWS RAM), vous en AWS Lake Formation informe dans la console.

HealthOmics peut accepter implicitement les partages de AWS RAM ressources lors de la création du magasin. Pour accepter le partage de AWS RAM ressources, l'utilisateur ou le rôle IAM qui appelle les opérations `CreateVariantStore` ou `CreateAnnotationStore` API doit autoriser les actions suivantes :
+ `ram:GetResourceShareInvitations`- Cette action permet HealthOmics de retrouver les invitations.
+ `ram:AcceptResourceShareInvitation`- Cette action permet d' HealthOmics accepter l'invitation en utilisant un jeton FAS.

Sans ces autorisations, une erreur d'autorisation s'affiche lors de la création de la boutique.

Voici un exemple de politique qui inclut ces actions. Ajoutez cette politique à l'utilisateur ou au rôle IAM qui accepte le partage de AWS RAM ressources.

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "omics:*",
        "ram:AcceptResourceShareInvitation",
        "ram:GetResourceShareInvitations"
      ],
      "Resource": "*"
    }
  ]
}
```

------

# Configuration d'Athena pour les requêtes
<a name="analytics-setting-up-athena"></a>

**Important**  
AWS HealthOmics les magasins de variantes et les magasins d'annotations ne sont plus ouverts aux nouveaux clients. Les clients existants peuvent continuer à utiliser le service normalement. Pour de plus amples informations, veuillez consulter [AWS HealthOmics modification de la disponibilité du magasin de variantes et du magasin d'annotations](variant-store-availability-change.md).

Vous pouvez utiliser Athena pour interroger des variantes et des annotations. Avant d'exécuter des requêtes, effectuez les tâches de configuration suivantes :

**Topics**
+ [Configuration de l'emplacement des résultats d'une requête à l'aide de la console Athena](#configure-athena-query)
+ [Configuration d'un groupe de travail avec le moteur Athena v3](#configure-athena-workgroup)

## Configuration de l'emplacement des résultats d'une requête à l'aide de la console Athena
<a name="configure-athena-query"></a>

Pour configurer l'emplacement des résultats d'une requête, procédez comme suit.

1. [Ouvrez la console Athena : Athena console](https://console.aws.amazon.com//athena)

1. Dans la barre de navigation principale, choisissez l'**éditeur de requêtes**.

1. Dans l'éditeur de requêtes, choisissez l'onglet **Paramètres**, puis sélectionnez **Gérer**.

1. Entrez le préfixe S3 d'un emplacement pour enregistrer le résultat de la requête.

## Configuration d'un groupe de travail avec le moteur Athena v3
<a name="configure-athena-workgroup"></a>

Pour configurer un groupe de travail, procédez comme suit.

1. [Ouvrez la console Athena : Athena console](https://console.aws.amazon.com//athena)

1. Dans la barre de navigation principale, choisissez **Groupes de travail**, puis **Créer un groupe de travail**.

1. Entrez un nom pour le groupe de travail.

1. Sélectionnez **Athena SQL** comme type de moteur.

1. Sous **Mettre à niveau le moteur de requête**, sélectionnez **Manuel**.

1. Sous **Query version engine**, sélectionnez **Athena version 3**.

1. Choisissez **Créer un groupe de travail**.

# Exécution de requêtes sur des magasins de HealthOmics variantes
<a name="analytics-run-queries"></a>

**Important**  
AWS HealthOmics les magasins de variantes et les magasins d'annotations ne sont plus ouverts aux nouveaux clients. Les clients existants peuvent continuer à utiliser le service normalement. Pour de plus amples informations, veuillez consulter [AWS HealthOmics modification de la disponibilité du magasin de variantes et du magasin d'annotations](variant-store-availability-change.md).

Vous pouvez effectuer des requêtes sur votre boutique de variantes à l'aide d'Amazon Athena. Notez que les coordonnées génomiques dans les magasins de variants et d'annotations sont représentées sous forme d'intervalles de base zéro, mi-fermés, mi-ouverts.

## Exécutez une requête simple à l'aide de la console Athena
<a name="run-queries-athena-simple"></a>

L'exemple suivant montre comment exécuter une requête simple.

1. [Ouvrez l'éditeur de requêtes Athena : éditeur de requêtes Athena](https://console.aws.amazon.com//athena)

1. Sous **Groupe de travail**, sélectionnez le groupe de travail que vous avez créé lors de la configuration.

1. Vérifiez que la **source de données** est **AwsDataCatalog**.

1. Pour **Base de données**, sélectionnez le lien de ressource de base de données que vous avez créé lors de la configuration de Lake Formation.

1. Copiez la requête suivante dans l'**éditeur de requêtes** sous l'onglet **Requête 1** :

   ```
   SELECT * from omicsvariants limit 10
   ```

1. Choisissez **Exécuter** pour exécuter la requête. La console remplit le tableau des résultats avec les 10 premières lignes du **omicsvariants** tableau.

## Exécuter une requête complexe à l'aide de la console Athena
<a name="run-queries-athena-complex"></a>

L'exemple suivant montre comment exécuter une requête complexe. Pour exécuter cette requête, importez-la `ClinVar` dans le magasin d'annotations.

**Exécuter une requête complexe**

1. [Ouvrez l'éditeur de requêtes Athena : éditeur de requêtes Athena](https://console.aws.amazon.com//athena)

1. Sous **Groupe de travail**, sélectionnez le groupe de travail que vous avez créé lors de la configuration.

1. Vérifiez que la **source de données** est **AwsDataCatalog**.

1. Pour **Base de données**, sélectionnez le lien de ressource de base de données que vous avez créé lors de la configuration de Lake Formation.

1. Cliquez **\$1** sur le bouton en haut à droite pour créer un nouvel onglet de **requête nommé Requête 2**.

1. Copiez la requête suivante dans l'**éditeur de requêtes** sous l'onglet **Requête 2** :

   ```
   SELECT variants.sampleid,
     variants.contigname,
     variants.start,
     variants."end",
     variants.referenceallele,
     variants.alternatealleles,
     variants.attributes AS variant_attributes,
     clinvar.attributes AS clinvar_attributes  
   FROM omicsvariants as variants 
   INNER JOIN omicsannotations as clinvar ON 
     variants.contigname=CONCAT('chr',clinvar.contigname) 
     AND variants.start=clinvar.start 
     AND variants."end"=clinvar."end" 
     AND variants.referenceallele=clinvar.referenceallele 
     AND variants.alternatealleles=clinvar.alternatealleles 
   WHERE clinvar.attributes['CLNSIG']='Likely_pathogenic'
   ```

1. Choisissez **Exécuter** pour démarrer l'exécution de la requête. 