

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# HealthOmics 分析データのクエリ
<a name="analytics-query-data"></a>

**重要**  
AWS HealthOmics バリアントストアと注釈ストアは、新規のお客様に公開されなくなりました。既存のお客様は、通常どおりサービスを引き続き使用できます。詳細については、「[AWS HealthOmics バリアントストアと注釈ストアの可用性の変更](variant-store-availability-change.md)」を参照してください。

バリアントストアに対してクエリを実行するには、 AWS Lake Formation と Amazon Athena または Amazon EMR を使用します。クエリを実行する前に、Lake Formation と Amazon Athena のセットアップ手順 (以下のセクションで説明) を完了してください。

Amazon EMR の詳細については、[「チュートリアル: Amazon EMR の開始方法](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-gs.html)」を参照してください。

2024 年 9 月 26 日以降に作成されたバリアントストアの場合、HealthOmics はストアをサンプル ID でパーティション分割します。このパーティショニングは、HealthOmics がサンプル ID を使用してバリアント情報の保存を最適化することを意味します。サンプル情報をフィルターとして使用するクエリは、クエリがスキャンするデータが少ないため、より迅速に結果を返します。

HealthOmics はパーティションファイル名としてサンプル IDsを使用します。データを取り込む前に、サンプル ID に PHI データが含まれているかどうかを確認します。その場合は、データを取り込む前にサンプル ID を変更します。サンプル IDs に含めるコンテンツと含めないコンテンツの詳細については、 AWS [HIPAA コンプライアンス](https://aws.amazon.com/compliance/hipaa-compliance)ウェブページのガイダンスを参照してください。

**Topics**
+ [HealthOmics を使用するように Lake Formation を設定する](setting-up-lf.md)
+ [クエリ用の Athena の設定](analytics-setting-up-athena.md)
+ [HealthOmics バリアントストアでのクエリの実行](analytics-run-queries.md)

# HealthOmics を使用するように Lake Formation を設定する
<a name="setting-up-lf"></a>

**重要**  
AWS HealthOmics バリアントストアと注釈ストアは、新規のお客様に公開されなくなりました。既存のお客様は、通常どおりサービスを引き続き使用できます。詳細については、「[AWS HealthOmics バリアントストアと注釈ストアの可用性の変更](variant-store-availability-change.md)」を参照してください。

Lake Formation を使用して HealthOmics データストアを管理する前に、次の Lake Formation 設定手順を実行します。

**Topics**
+ [Lake Formation 管理者の作成または検証](#create-lf-admins)
+ [Lake Formation コンソールを使用したリソースリンクの作成](#create-resource-links)
+ [AWS RAM リソース共有のアクセス許可の設定](#configure-lf-permissions)

## Lake Formation 管理者の作成または検証
<a name="create-lf-admins"></a>

Lake Formation でデータレイクを作成する前に、1 人以上の管理者を定義します。

管理者は、リソースリンクを作成するアクセス許可を持つユーザーとロールです。アカウントごと、リージョンごとにデータレイク管理者を設定します。

**Lake Formation コンソールで管理者ユーザーを作成する**

1.  AWS Lake Formation コンソールを開く: [Lake Formation コンソール](https://console.aws.amazon.com//lakeformation)を開く

1. コンソールに **Welcome to Lake Formation** パネルが表示された場合は、**開始方法**を選択します。

   Lake Formation は、**データレイク管理者**テーブルにユーザーを追加します。

1. それ以外の場合は、左側のメニューから**管理ロールとタスク**を選択します。

1. 必要に応じて管理者を追加します。

## Lake Formation コンソールを使用したリソースリンクの作成
<a name="create-resource-links"></a>

ユーザーがクエリできる共有リソースを作成するには、デフォルトのアクセスコントロールを無効にする必要があります。デフォルトのアクセスコントロールの無効化の詳細については、Lake Formation ドキュメントの[「データレイクのデフォルトのセキュリティ設定を変更する](https://docs.aws.amazon.com/lake-formation/latest/dg/change-settings.html)」を参照してください。リソースリンクは個別に作成することも、グループとして作成することもできます。これにより、Amazon Athena または他の AWS サービス (Amazon EMR など) のデータにアクセスできます。

**AWS Lake Formation コンソールでのリソースリンクの作成と HealthOmics Analytics ユーザーとの共有**

1.  AWS Lake Formation コンソールを開く: [Lake Formation コンソール](https://console.aws.amazon.com//lakeformation)を開く

1. プライマリナビゲーションバーで、**データベース**を選択します。

1. **Databases** テーブルで、目的のデータベースを選択します。

1. **作成**メニューから、**リソースリンク**を選択します。

1. **リソースリンク名**を入力します。Athena からデータベースにアクセスする場合は、小文字 (最大 256 文字) のみを使用して名前を入力します。

1. **[作成]** を選択します。

1. 新しいリソースリンクが**データベース**に一覧表示されるようになりました。

### Lake Formation コンソールを使用して共有リソースへのアクセスを許可する
<a name="create-resource-links"></a>

Lake Formation データベース管理者は、次の手順を使用して共有リソースへのアクセスを許可できます。

1.  AWS Lake Formation コンソールを開きます: [https://console.aws.amazon.com/lakeformation/](https://console.aws.amazon.com//lakeformation)

1. プライマリナビゲーションバーで、**データベース**を選択します。

1. **データベース**ページで、以前に作成したリソースリンクを選択します。

1. **アクション**メニューから、**ターゲットに対する付与**を選択します。

1. プリンシパルの**「データアクセス許可の付与**」ページで、**IAM ユーザーまたはロール**を選択します。 ****

1. **IAM ユーザーまたはロール**のドロップダウンメニューから、アクセスを許可するユーザーを見つけます。

1. 次に、**LF タグまたはカタログリソース**カードで、**名前付きデータカタログリソース**オプションを選択します。

1. **Tables-optional** ドロップダウンメニューから、**すべてのテーブル**または以前に作成したテーブルを選択します。

1. **テーブルのアクセス許可**カードで、**テーブルのアクセス許可**で**「Describe** and **Select**」を選択します。

1. 次に、**Grant **を選択します。

Lake Formation のアクセス許可を表示するには、プライマリナビゲーションペインから**データレイクのアクセス許可**を選択します。この表は、使用可能なデータベースとリソースリンクを示しています。

## AWS RAM リソース共有のアクセス許可の設定
<a name="configure-lf-permissions"></a>

 AWS Lake Formation コンソールで、プライマリナビゲーションバーで**データレイクのアクセス許可を選択してアクセス許可**を表示します。**データアクセス許可**ページで、リソース**タイプ、データベース、および RAM リソース**共有の共有リソース**ARN**に関連する テーブルを表示できます。 **** **** AWS Resource Access Manager (AWS RAM) リソース共有を受け入れる必要がある場合、 はコンソールで AWS Lake Formation 通知します。

HealthOmics は、ストアの作成中に AWS RAM リソース共有を暗黙的に受け入れることができます。 AWS RAM リソース共有を受け入れるには、 または `CreateAnnotationStore` API オペレーションを呼び出す IAM ユーザー`CreateVariantStore`またはロールで、次のアクションを許可する必要があります。
+ `ram:GetResourceShareInvitations` - このアクションにより、HealthOmics は招待を検索できます。
+ `ram:AcceptResourceShareInvitation` - このアクションにより、HealthOmics は FAS トークンを使用して招待を受け入れることができます。

これらのアクセス許可がないと、ストアの作成中に認可エラーが表示されます。

これらのアクションを含むポリシーの例を次に示します。このポリシーを、 AWS RAM リソース共有を受け入れる IAM ユーザーまたはロールに追加します。

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "omics:*",
        "ram:AcceptResourceShareInvitation",
        "ram:GetResourceShareInvitations"
      ],
      "Resource": "*"
    }
  ]
}
```

------

# クエリ用の Athena の設定
<a name="analytics-setting-up-athena"></a>

**重要**  
AWS HealthOmics バリアントストアと注釈ストアは、新規のお客様に公開されなくなりました。既存のお客様は、通常どおりサービスを引き続き使用できます。詳細については、「[AWS HealthOmics バリアントストアと注釈ストアの可用性の変更](variant-store-availability-change.md)」を参照してください。

Athena を使用してバリアントと注釈をクエリできます。クエリを実行する前に、次のセットアップタスクを実行します。

**Topics**
+ [Athena コンソールを使用してクエリ結果の場所を設定する](#configure-athena-query)
+ [Athena エンジン v3 でワークグループを設定する](#configure-athena-workgroup)

## Athena コンソールを使用してクエリ結果の場所を設定する
<a name="configure-athena-query"></a>

クエリ結果の場所を設定するには、次の手順に従います。

1. Athena コンソールを開く: [Athena コンソール](https://console.aws.amazon.com//athena)

1. プライマリナビゲーションバーで、**クエリエディタ**を選択します。

1. クエリエディタで、**設定**タブを選択し、**管理**を選択します。

1. クエリ結果を保存する場所の S3 プレフィックスを入力します。

## Athena エンジン v3 でワークグループを設定する
<a name="configure-athena-workgroup"></a>

ワークグループを設定するには、次の手順に従います。

1. Athena コンソールを開く: [Athena コンソール](https://console.aws.amazon.com//athena)

1. プライマリナビゲーションバーで、**ワークグループ**を選択し、**ワークグループを作成します**。

1. ワークグループの名前を入力します。

1. エンジンのタイプとして **Athena SQL** を選択します。

1. **アップグレードクエリエンジン**で、**手動**を選択します。

1. **クエリバージョンエンジン**で、**Athena バージョン 3 **を選択します。

1. **[Create workgroup]** (ワークグループの作成) を選択します。

# HealthOmics バリアントストアでのクエリの実行
<a name="analytics-run-queries"></a>

**重要**  
AWS HealthOmics バリアントストアと注釈ストアは、新規のお客様に公開されなくなりました。既存のお客様は、通常どおりサービスを引き続き使用できます。詳細については、「[AWS HealthOmics バリアントストアと注釈ストアの可用性の変更](variant-store-availability-change.md)」を参照してください。

Amazon Athena を使用してバリアントストアでクエリを実行できます。バリアントストアと注釈ストアのゲノム座標は、ゼロベースの半分閉じた半オープン間隔として表されることに注意してください。

## Athena コンソールを使用してシンプルなクエリを実行する
<a name="run-queries-athena-simple"></a>

次の例は、単純なクエリを実行する方法を示しています。

1. Athena クエリエディタを開く: [Athena クエリエディタ](https://console.aws.amazon.com//athena)

1. **ワークグループ** で、セットアップ中に作成したワークグループを選択します。

1. **データソース**が **AwsDataCatalog** であることを確認します。

1. **データベース** で、Lake Formation のセットアップ中に作成したデータベースリソースリンクを選択します。

1. クエリ 1 タブのクエリ**エディタ**に次のクエリをコピーします。 ****

   ```
   SELECT * from omicsvariants limit 10
   ```

1. クエリを実行するには、**[実行]** を選択します。コンソールは、結果テーブルに**omicsvariants**テーブルの最初の 10 行を入力します。

## Athena コンソールを使用して複雑なクエリを実行する
<a name="run-queries-athena-complex"></a>

次の例は、複雑なクエリを実行する方法を示しています。このクエリを実行するには、注釈ストア`ClinVar`に をインポートします。

**複雑なクエリを実行する**

1. Athena クエリエディタを開く: [Athena クエリエディタ](https://console.aws.amazon.com//athena)

1. **ワークグループ** で、セットアップ中に作成したワークグループを選択します。

1. **データソース**が **AwsDataCatalog** であることを確認します。

1. **データベース** で、Lake Formation のセットアップ中に作成したデータベースリソースリンクを選択します。

1. 右上**\$1**の を選択して、クエリ **2** という名前の新しいクエリタブを作成します。

1. クエリ 2 タブのクエリ**エディタ**に次のクエリをコピーします。 ****

   ```
   SELECT variants.sampleid,
     variants.contigname,
     variants.start,
     variants."end",
     variants.referenceallele,
     variants.alternatealleles,
     variants.attributes AS variant_attributes,
     clinvar.attributes AS clinvar_attributes  
   FROM omicsvariants as variants 
   INNER JOIN omicsannotations as clinvar ON 
     variants.contigname=CONCAT('chr',clinvar.contigname) 
     AND variants.start=clinvar.start 
     AND variants."end"=clinvar."end" 
     AND variants.referenceallele=clinvar.referenceallele 
     AND variants.alternatealleles=clinvar.alternatealleles 
   WHERE clinvar.attributes['CLNSIG']='Likely_pathogenic'
   ```

1. **Run** を選択して、クエリの実行を開始します。