本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# HealthOmics 分析
<a name="omics-analytics"></a>

**重要**  
AWS HealthOmics 變體存放區和註釋存放區不再開放給新客戶。現有客戶可以繼續正常使用該服務。如需詳細資訊，請參閱[AWS HealthOmics 變體存放區和註釋存放區可用性變更](variant-store-availability-change.md)。

HealthOmics 分析支援儲存和分析基因體變體和註釋。Analytics 提供兩種類型的儲存資源：變體存放區和註釋存放區。您可以使用這些資源來存放、轉換和查詢基因體變體資料和註釋資料。將資料匯入資料存放區後，您可以使用 Athena 對資料進行進階分析。

您可以使用 HealthOmics 主控台或 API 來建立和管理存放區、匯入資料，以及與協作者共用分析存放區資料。

變體會以 VCF 格式存放支援資料，而註釋存放區支援 TSV/CSV 和 GFF3 格式。基因體座標表示為以零為基礎的半封閉半開間隔。當您的資料位於 HealthOmics 分析資料存放區時，將透過 管理對 VCF 檔案的存取 AWS Lake Formation。然後，您可以使用 Amazon Athena 查詢 VCF 檔案。查詢必須使用 Athena 查詢引擎版本 3。若要進一步了解 Athena 查詢引擎版本，請參閱 [Amazon Athena 文件](https://docs.aws.amazon.com/athena/latest/ug/engine-versions-changing.html)。


**Topics**
+ [建立 HealthOmics 變體存放區](creating-variant-stores.md)
+ [建立 HealthOmics 變體存放區匯入任務](parsing-annotation-stores.md)
+ [建立 HealthOmics 註釋存放區](creating-and-managing-annotation-store.md)
+ [為 HealthOmics 註釋存放區建立匯入任務](annotation-store-import-jobs.md)
+ [建立 HealthOmics 註釋存放區版本](annotation-store-versioning.md)
+ [刪除 HealthOmics 分析存放區](deleting-a-store-examples.md)
+ [查詢 HealthOmics 分析資料](analytics-query-data.md)
+ [共用 HealthOmics 分析存放區](cross-account-sharing.md)

# 建立 HealthOmics 變體存放區
<a name="creating-variant-stores"></a>

**重要**  
AWS HealthOmics 變體存放區和註釋存放區不再開放給新客戶。現有客戶可以繼續正常使用該服務。如需詳細資訊，請參閱[AWS HealthOmics 變體存放區和註釋存放區可用性變更](variant-store-availability-change.md)。

下列主題說明如何使用 主控台和 API 建立 HealthOmics 變體存放區。

**Topics**
+ [使用主控台建立變體存放區](#gs-console-analytics)
+ [使用 API 建立變體存放區](#gs-api-analytics)

## 使用主控台建立變體存放區
<a name="gs-console-analytics"></a>

您可以使用 HealthOmics 主控台建立變體存放區。

1. 開啟 [HealthOmics 主控台](https://console.aws.amazon.com/omics/)。

1.  如有需要，請開啟左側導覽窗格 (≡)。選擇**變體存放**區。

1. 在**建立變體存放**區頁面上，提供下列資訊
   + **變體存放區名稱** - 此存放區的唯一名稱。
   + **描述** （選用） - 此變體存放區的描述。
   + **參考基因體** - 此變體存放區的參考基因體。
   + **資料加密** - 選擇是否要由 AWS 或您自己擁有和管理資料加密。
   + **標籤 **（選用） - 為此變體存放區提供最多 50 個標籤。

1. 選擇**建立變體存放區**。

## 使用 API 建立變體存放區
<a name="gs-api-analytics"></a>

使用 HealthOmics `CreateVariantStore` API 操作來建立變體存放區。您也可以使用 執行此操作 AWS CLI。

若要建立變體存放區，請提供存放區的名稱和參考存放區的 ARN。當變體存放區的狀態變更為 READY 時，已準備好擷取資料。

下列範例使用 AWS CLI 來建立變體存放區。

```
aws omics create-variant-store --name myvariantstore \
    --reference referenceArn="arn:aws:omics:us-west-2:555555555555:referenceStore/123456789/reference/5987565360"
```

若要確認建立變體存放區，您會收到下列回應。

```
{
    "creationTime": "2022-11-03T18:19:52.296368+00:00",
    "id": "45aeb91d5678",
    "name": "myvariantstore",
    "reference": {
        "referenceArn": "arn:aws:omics:us-west-2:555555555555:referenceStore/123456789/reference/5987565360"
    },
    "status": "CREATING"
}
```

若要進一步了解變體存放區，請使用 **get-variant-store** API。

```
aws omics get-variant-store --name myvariantstore
```

您會收到下列回應。

```
{
    "id": "45aeb91d5678",
    "reference": {
        "referenceArn": "arn:aws:omics:us-west-2:555555555555:referenceStore/123456789/reference/5987565360"
    },
    "status": "ACTIVE",
    "storeArn": "arn:aws:omics:us-west-2:555555555555:variantStore/myvariantstore",
    "name": "myvariantstore",
    "creationTime": "2022-11-03T18:19:52.296368+00:00",
    "updateTime": "2022-11-03T18:30:56.272792+00:00",
    "tags": {},
    "storeSizeBytes": 0
}
```

若要檢視與帳戶相關聯的所有變體存放區，請使用 **list-variant-stores** API。

```
aws omics list-variant-stores  
```

您會收到一個回應，列出所有變體存放區及其 IDs、狀態和其他詳細資訊，如下列範例回應所示。

```
{
    "variantStores": [
        {
            "id": "45aeb91d5678",
            "reference": {
                "referenceArn": "arn:aws:omics:us-west-2:55555555555:referenceStore/5506874698"
            },
            "status": "ACTIVE",
            "storeArn": "arn:aws:omics:us-west-2:55555555555:variantStore/new_variant_store",
            "name": "variantstore",
            "creationTime": "2022-11-03T18:19:52.296368+00:00",
            "updateTime": "2022-11-03T18:30:56.272792+00:00",
            "statusMessage": "",
            "storeSizeBytes": 141526
        }
    ]
}
```

您也可以根據狀態或其他條件，篩選 **list-variant-stores** API 的回應。

 匯入 2023 年 5 月 15 日當天或之後建立的分析存放區的 VCF 檔案已定義變體效果預測器 (VEP) 註釋的結構描述。這可讓您更輕鬆地查詢和剖析匯入的 VCF 資料。變更不會影響 2023 年 5 月 15 日之前建立的存放區，除非`annotation fields`參數包含在 API 或 CLI 呼叫中。對於這些存放區，使用 `annotation fields` 參數會導致請求失敗。

# 建立 HealthOmics 變體存放區匯入任務
<a name="parsing-annotation-stores"></a>

**重要**  
AWS HealthOmics 變體存放區和註釋存放區不再開放給新客戶。現有客戶可以繼續正常使用該服務。如需詳細資訊，請參閱[AWS HealthOmics 變體存放區和註釋存放區可用性變更](variant-store-availability-change.md)。

下列範例示範如何使用 AWS CLI 為變體存放區建立匯入任務。

```
aws omics start-variant-import-job \
       --destination-name myvariantstore \
       --runLeftNormalization false \
       --role-arn  arn:aws:iam::55555555555:role/roleName \
       --items source=s3://my-omics-bucket/sample.vcf.gz source=s3://my-omics-bucket/sample2.vcf.gz
```

```
{
    "destinationName": "store_a",
    "roleArn": "....",
    "runLeftNormalization": false,
    "items": [
        {"source": "s3://my-omics-bucket/sample.vcf.gz"},
        {"source": "s3://my-omics-bucket/sample2.vcf.gz"}
    ]
}
```

對於 2023 年 5 月 15 日之後建立的存放區，下列範例顯示如何新增 `--annotation-fields` 參數。註釋欄位是使用匯入來定義。

```
aws omics start-variant-import-job \
   --destination-name annotationparsingvariantstore \
   --role-arn arn:aws:iam::123456789012:role/<role_name> \
   --items source=s3://pathToS3/sample.vcf
   --annotation-fields '{"VEP": "CSQ"}'
```

```
{
    "jobId": "981e2286-e954-4391-8a97-09aefc343861"
}
```

使用 **get-variant-import-job** 檢查狀態。

```
aws omics get-variant-import-job --job-id 08279950-a9e3-4cc3-9a3c-a574f9c9e229      
```

您將會收到 JSON 回應，顯示匯入任務的狀態。VCF 中的 VEP 註釋會剖析為 ID/值對儲存在 INFO 欄中的資訊。[Ensembl 變體效果預測器](https://useast.ensembl.org/info/docs/tools/vep/index.html/#vcf)註釋 INFO 欄的預設 ID 為 CSQ，但您可以使用 `--annotation-fields` 參數來指示 INFO 欄中使用的自訂值。VEP 註釋目前支援剖析。

對於在 2023 年 5 月 15 日之前建立的存放區，或未包含 VEP 註釋的 VCF 檔案，回應不包含任何註釋欄位。

```
{
    "creationTime": "2023-04-11T17:52:37.241958+00:00",
    "destinationName": "annotationparsingvariantstore",
    "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea",
    "items": [

    {
       "jobStatus": "COMPLETED",
       "source": "s3://amzn-s3-demo-bucket/NA12878.2k.garvan.vcf"
    }
 ],
    "roleArn": "arn:aws:iam::555555555555:role/<role_name>",

    "runLeftNormalization": false,
    "status": "COMPLETED",
    "updateTime": "2023-04-11T17:58:22.676043+00:00",
}
```

屬於 VCF 檔案一部分的 VEP 註釋會儲存為具有下列結構的預先定義結構描述。額外欄位可用來存放預設結構描述中未包含的任何其他 VEP 欄位。

```
annotations struct<
   vep: array<struct<
      allele:string,
      consequence: array<string>,
      impact:string,
      symbol:string,
      gene:string,
      `feature_type`: string, 
      feature: string,
      biotype: string,
      exon: struct<rank:string, total:string>,
      intron: struct<rank:string, total:string>,
      hgvsc: string,
      hgvsp: string,
      `cdna_position`: string,
      `cds_position`: string,
      `protein_position`: string,
      `amino_acids`: struct<reference:string, variant: string>,
      codons: struct<reference:string, variant: string>,
      `existing_variation`: array<string>,
      distance: string, 
      strand: string, 
      flags: array<string>,
      symbol_source: string,
      hgnc_id: string,
      `extras`: map<string, string> 
    >>
>
```

剖析是以盡最大努力的方法執行。如果 VEP 項目未遵循 [VEP 標準規格](https://useast.ensembl.org/info/docs/tools/vep/vep_formats.html#vcf)，則不會剖析，且陣列中的資料列將為空白。

對於新的變體存放區，**get-variant-import-job** 的回應將包含註釋欄位，如下所示。

```
aws omics get-variant-import-job --job-id 08279950-a9e3-4cc3-9a3c-a574f9c9e229      
```

您會收到 JSON 回應，顯示匯入任務的狀態。

```
{
    "creationTime": "2023-04-11T17:52:37.241958+00:00",
    "destinationName": "annotationparsingvariantstore",
    "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea",
    "items": [

    {
    "jobStatus": "COMPLETED",
    "source": "s3://amzn-s3-demo-bucket/NA12878.2k.garvan.vcf"
    }
 ],
    "roleArn": "arn:aws:iam::123456789012:role/<role_name>",
    "runLeftNormalization": false,
    "status": "COMPLETED",
    "updateTime": "2023-04-11T17:58:22.676043+00:00",
    "annotationFields" : {"VEP": "CSQ"}
  }
}
```

您可以使用 **list-variant-import-jobs** 來查看所有匯入任務及其狀態。

```
aws omics list-variant-import-jobs --ids 7a1c67e3-b7f9-434d-817b-9c571fd63bea          
```

回應包含的資訊如下所示。

```
{
    "variantImportJobs": [
    {
        "creationTime": "2023-04-11T17:52:37.241958+00:00",
        "destinationName": "annotationparsingvariantstore",
        "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea",
        "roleArn": "arn:aws:iam::55555555555:role/roleName",
        "runLeftNormalization": false,
        "status": "COMPLETED",
        "updateTime": "2023-04-11T17:58:22.676043+00:00",
        "annotationFields" : {"VEP": "CSQ"}
        }
    ]
  }
}
```

如有必要，您可以使用下列命令取消匯入任務。

```
aws omics cancel-variant-import-job 
     --job-id edd7b8ce-xmpl-47e2-bc99-258cac95a508
```

# 建立 HealthOmics 註釋存放區
<a name="creating-and-managing-annotation-store"></a>

**重要**  
AWS HealthOmics 變體存放區和註釋存放區不再開放給新客戶。現有客戶可以繼續正常使用該服務。如需詳細資訊，請參閱[AWS HealthOmics 變體存放區和註釋存放區可用性變更](variant-store-availability-change.md)。

註釋存放區是代表註釋資料庫的資料存放區，例如來自 TSV、VPF 或 GFF 檔案的資料存放區。如果指定相同的參考基因體，註釋存放區會在匯入期間映射到與變體存放區相同的座標系統。下列主題說明如何使用 HealthOmics 主控台和 AWS CLI 來建立和管理註釋存放區。

**Topics**
+ [使用主控台建立註釋存放區](#gs-console-create-annotation-store)
+ [使用 API 建立註釋存放區](#create-manage-annotation-store-api)

## 使用主控台建立註釋存放區
<a name="gs-console-create-annotation-store"></a>

使用下列程序，透過 HealthOmics 主控台建立註釋存放區。

**建立註釋存放區**

1. 開啟 [HealthOmics 主控台](https://console.aws.amazon.com/omics/)。

1.  如有需要，請開啟左側導覽窗格 (≡)。選擇**註釋存放區**。

1. 在**註釋存放**區頁面上，選擇**建立註釋存放區**。

1. 在**建立註釋存放**區頁面上，提供下列資訊
   + **註釋存放區名稱** - 此存放區的唯一名稱。
   + **描述** （選用） - 此參考基因體的描述。
   + **資料格式和結構描述詳細資訊** - 選取資料檔案格式並上傳此存放區的結構描述定義。
   + **參考基因體** - 此註釋的參考基因體。
   + **資料加密** - 選擇是否要由 AWS 或您自己擁有和管理資料加密。
   + **標籤 **（選用） - 為此註釋存放區提供最多 50 個標籤。

1. 選擇**建立註釋存放區**。

## 使用 API 建立註釋存放區
<a name="create-manage-annotation-store-api"></a>

下列範例示範如何使用 建立註釋存放區 AWS CLI。對於所有 AWS CLI 和 API 操作，您必須指定資料的格式。

```
aws omics create-annotation-store --name my_annotation_store \
           --store-format GFF \
           --reference referenceArn="arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/5987565360"
           --version-name new_version
```

您會收到以下回應，以確認建立註釋存放區。

```
{
           "creationTime": "2022-08-24T20:34:19.229500Z",
           "id": "3b93cdef69d2",
           "name": "my_annotation_store",
           "reference": {
               "referenceArn": "arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/5987565360"
           },
           "status": "CREATING"
           "versionName": "my_version"
       }
```

若要進一步了解註釋存放區，請使用 **get-annotation-store** API。

```
aws omics get-annotation-store --name my_annotation_store
```

您會收到下列回應。

```
{
          "id": "eeb019ac79c2",
          "reference": {
              "referenceArn": "arn:aws:omics:us-west-2:555555555555:referenceStore/5638433913/reference/5871590330“
          },
          "status": "ACTIVE",
          "storeArn": "arn:aws:omics:us-west-2:555555555555:annotationStore/gffstore",
          "name": "my_annotation_store",
          "creationTime": "2022-11-05T00:05:19.136131+00:00",
          "updateTime": "2022-11-05T00:10:36.944839+00:00",
          "tags": {},
          "storeFormat": "GFF",
          "statusMessage": "",
          "storeSizeBytes": 0,
          "numVersions": 1
      }
```

若要檢視與帳戶相關聯的所有註釋存放區，請使用 **list-annotation-stores** API 操作。

```
aws omics list-annotation-stores 
```

您會收到一個回應，列出所有註釋存放區及其 IDs、狀態和其他詳細資訊，如下列範例回應所示。

```
{
           "annotationStores": [
               {
                  "id": "4d8f3eada259",
                   "reference":
                       "referenceArn": "arn:aws:omics:us-west-2:555555555555:referenceStore/5638433913/reference/5871590330"
                   },
                   "status": "CREATING",
                   "name": "gffstore",
                   "creationTime": "2022-09-27T17:30:52.182990+00:00",
                   "updateTime": "2022-09-27T17:30:53.025362+00:00"
               }
           ]
       }
```

您也可以根據狀態或其他條件來篩選回應。

# 為 HealthOmics 註釋存放區建立匯入任務
<a name="annotation-store-import-jobs"></a>

**重要**  
AWS HealthOmics 變體存放區和註釋存放區不再開放給新客戶。現有客戶可以繼續正常使用該服務。如需詳細資訊，請參閱[AWS HealthOmics 變體存放區和註釋存放區可用性變更](variant-store-availability-change.md)。

**Topics**
+ [使用 API 建立註釋匯入任務](#create-annotation-import-api)
+ [TSV 和 VCF 格式的其他參數](#annotation-import-tsv-vcf)
+ [建立 TSV 格式的註釋存放區](#annotation-import-tsv-vcftsv-annotation-store-examples-tsv)
+ [啟動 VCF 格式的匯入任務](#vcf-annotation-store-examples)

## 使用 API 建立註釋匯入任務
<a name="create-annotation-import-api"></a>

下列範例示範如何使用 AWS CLI 啟動註釋匯入任務。

```
aws omics start-annotation-import-job \
           --destination-name myannostore \
           --version-name myannostore \
           --role-arn arn:aws:iam::123456789012:role/roleName \
           --items source=s3://my-omics-bucket/sample.vcf.gz
           --annotation-fields '{"VEP": "CSQ"}'
```

如果包含註釋**欄位，則在 2023 年 5 月 15 日之前建立的註釋**存放區會傳回錯誤訊息。它們不會針對涉及註釋存放區匯入任務的任何 API 操作傳回輸出。

然後，您可以使用 **get-annotation-import-job** API 操作和 `job ID` 參數來進一步了解註釋匯入任務的詳細資訊。

```
aws omics get-annotation-import-job --job-id 9e4198fb-fa85-446c-9301-9b823a1a8ba8         
```

您會收到下列回應，包括註釋欄位。

```
{
          "creationTime": "2023-04-11T19:09:25.049767+00:00",
          "destinationName": "parsingannotationstore",
          "versionName": "parsingannotationstore",
          "id": "9e4198fb-fa85-446c-9301-9b823a1a8ba8",
          "items": [
              {
                  "jobStatus": "COMPLETED",
                  "source": "s3://my-omics-bucket/sample.vep.vcf"
              }
          ],
          "roleArn": "arn:aws:iam::55555555555:role/roleName",
          "runLeftNormalization": false,
          "status": "COMPLETED",
          "updateTime": "2023-04-11T19:13:09.110130+00:00",
          "annotationFields" : {"VEP": "CSQ"}
       }
```

若要檢視所有註釋存放區匯入任務，請使用 **list-annotation-import-jobs **。

```
aws omics list-annotation-import-jobs --ids 9e4198fb-fa85-446c-9301-9b823a1a8ba8          
```

回應包含註釋存放區匯入任務的詳細資訊和狀態。

```
{
          "annotationImportJobs": [
          {
              "creationTime": "2023-04-11T19:09:25.049767+00:00",
              "destinationName": "parsingannotationstore",
              "versionName": "parsingannotationstore",
              "id": "9e4198fb-fa85-446c-9301-9b823a1a8ba8",
              "roleArn": "arn:aws:iam::55555555555:role/roleName",
              "runLeftNormalization": false,
              "status": "COMPLETED",
              "updateTime": "2023-04-11T19:13:09.110130+00:00",
              "annotationFields" : {"VEP": "CSQ"}
          }
          ]
      }
```

## TSV 和 VCF 格式的其他參數
<a name="annotation-import-tsv-vcf"></a>

對於 TSV 和 VCF 格式，還有其他參數可通知 API 如何剖析您的輸入。

**重要**  
 使用查詢引擎匯出的 CSV 註釋資料會直接從資料集匯入傳回資訊。如果匯入的資料包含公式或命令，則檔案可能需要 CSV 插入。因此，使用查詢引擎匯出的檔案可能會提示安全性警告。為了避免惡意活動，請在讀取匯出檔案時關閉連結和巨集。

TSV 剖析器也會執行基本的生物資訊學操作，例如基因體座標的左側標準化和標準化，如下表所列。


| 格式類型 | Description | 
| --- | --- | 
| 一般 | 一般文字檔案。沒有基因體資訊。 | 
| CHR\$1POS | 開始位置 - 1，新增結束位置，這與 相同POS。 | 
| CHR\$1POS\$1REF\$1ALT | 包含 contig、1 基位置、ref 和 alt 等位基因資訊。 | 
| CHR\$1START\$1END\$1REF\$1ALT\$1ONE\$1BASE | 包含 contig、start、end、ref 和 alt 等位基因資訊。座標以 1 為基礎。 | 
| CHR\$1START\$1END\$1ZERO\$1BASE | 包含連續、開始和結束位置。座標以 0 為基礎。 | 
| CHR\$1START\$1END\$1ONE\$1BASE | 包含連續、開始和結束位置。座標以 1 為基礎。 | 
| CHR\$1START\$1END\$1REF\$1ALT\$1ZERO\$1BASE | 包含 contig、start、end、ref 和 alt 等位基因資訊。座標以 0 為基礎。 | 

TSV 匯入註釋存放區請求如下所示。

```
aws omics start-annotation-import-job \
--destination-name tsv_anno_example \
--role-arn arn:aws:iam::555555555555:role/demoRole \
--items source=s3://demodata/genomic_data.bed.gz \
--format-options '{ "tsvOptions": {
        "readOptions": {
            "header": false,
            "sep": "\t"
        }
    }
}'
```

## 建立 TSV 格式的註釋存放區
<a name="annotation-import-tsv-vcftsv-annotation-store-examples-tsv"></a>

下列範例使用包含標頭、資料列和註解的索引標籤限制檔案來建立註釋存放區。座標為 `CHR_START_END_ONE_BASED`，其中包含來自 OMIM 人類基因貼圖摘要的 HG19 基因貼圖。 [https://www.omim.org/downloads](https://www.omim.org/downloads)

```
aws omics create-annotation-store --name mimgenemap \
  --store-format TSV \
  --reference=referenceArn=arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/2310864158 \
  --store-options=tsvStoreOptions='{
    annotationType=CHR_START_END_ONE_BASE,  
    formatToHeader={CHR=chromosome, START=genomic_position_start, END=genomic_position_end},
    schema=[
      {chromosome=STRING}, 
      {genomic_position_start=LONG}, 
      {genomic_position_end=LONG}, 
      {cyto_location=STRING}, 
      {computed_cyto_location=STRING}, 
      {mim_number=STRING}, 
      {gene_symbols=STRING}, 
      {gene_name=STRING}, 
      {approved_gene_name=STRING}, 
      {entrez_gene_id=STRING}, 
      {ensembl_gene_id=STRING}, 
      {comments=STRING}, 
      {phenotypes=STRING}, 
      {mouse_gene_symbol=STRING}]}'
```

您可以使用或不使用標頭匯入檔案。若要在 CLI 請求中指出這一點，請使用 `header=false`，如下列匯入任務範例所示。

```
aws omics start-annotation-import-job \
   --role-arn arn:aws:iam::555555555555:role/demoRole \
   --items=source=s3://amzn-s3-demo-bucket/annotation-examples/hg38_genemap2.txt \
   --destination-name output-bucket \
   --format-options=tsvOptions='{readOptions={sep="\t",header=false,comment="#"}}'
```

下列範例會為床鋪檔案建立註釋存放區。床位檔案是簡單的標籤分隔檔案。在這個範例中，資料欄是「 」、「開始」、「結束」和「區域名稱」。座標為零，且資料沒有標頭。

```
aws omics create-annotation-store \
   --name cexbed --store-format TSV \
   --reference=referenceArn=arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/2310864158 \
   --store-options=tsvStoreOptions='{
   annotationType=CHR_START_END_ZERO_BASE,  
   formatToHeader={CHR=chromosome, START=start, END=end}, 
   schema=[{chromosome=STRING}, {start=LONG}, {end=LONG}, {name=STRING}]}'
```

然後，您可以使用下列 CLI 命令，將床位檔案匯入註釋存放區。

```
aws omics start-annotation-import-job \
   --role-arn arn:aws:iam::555555555555:role/demoRole \
   --items=source=s3://amzn-s3-demo-bucket/TruSeq_Exome_TargetedRegions_v1.2.bed \ 
   --destination-name cexbed \
   --format-options=tsvOptions='{readOptions={sep="\t",header=false,comment="#"}}'
```

下列範例會為以標籤分隔的檔案建立註釋存放區，其中包含 VCF 檔案的前幾個資料欄，後面接著包含註釋資訊的資料欄。它包含的基因組位置具有有關 、啟動、參考和替代等位基因的資訊，並且包含 標頭。

```
aws omics create-annotation-store --name gnomadchrx --store-format TSV \
--reference=referenceArn=arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/2310864158 \
--store-options=tsvStoreOptions='{
    annotationType=CHR_POS_REF_ALT, 
    formatToHeader={CHR=chromosome, POS=start, REF=ref, ALT=alt}, 
    schema=[
        {chromosome=STRING}, 
        {start=LONG}, 
        {ref=STRING}, 
        {alt=STRING}, 
        {filters=STRING}, 
        {ac_hom=STRING}, 
        {ac_het=STRING},
        {af_hom=STRING}, 
        {af_het=STRING}, 
        {an=STRING}, 
        {max_observed_heteroplasmy=STRING}]}'
```

然後，您可以使用下列 CLI 命令將檔案匯入註釋存放區。

```
aws omics start-annotation-import-job \
  --role-arn arn:aws:iam::555555555555:role/demoRole \
   --items=source=s3://amzn-s3-demo-bucket/gnomad.genomes.v3.1.sites.chrM.reduced_annotations.tsv \
   --destination-name gnomadchrx \
   --format-options=tsvOptions='{readOptions={sep="\t",header=true,comment="#"}}'
```

下列範例顯示客戶如何為 mim2gene 檔案建立註釋存放區。mim2gene 檔案提供 OMIM 中的基因與另一個基因識別符之間的連結。它以標籤分隔，並包含註解。

```
aws omics create-annotation-store \
  --name mim2gene \
  --store-format TSV \
  --reference=referenceArn=arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/2310864158 \
  --store-options=tsvStoreOptions='
    {annotationType=GENERIC,      
    formatToHeader={}, 
    schema=[
        {mim_gene_id=STRING}, 
        {mim_type=STRING}, 
        {entrez_id=STRING}, 
        {hgnc=STRING}, 
        {ensembl=STRING}]}'
```

然後，您可以將資料匯入您的 存放區，如下所示。

```
aws omics start-annotation-import-job \
   --role-arn arn:aws:iam::555555555555:role/demoRole \
   --items=source=s3://xquek-dev-aws/annotation-examples/mim2gene.txt \
   --destination-name mim2gene \
   --format-options=tsvOptions='{readOptions={sep="\t",header=false,comment="#"}}'
```

## 啟動 VCF 格式的匯入任務
<a name="vcf-annotation-store-examples"></a>

對於 VCF 檔案，有兩個額外的輸入 `ignoreQualField`和 `ignoreFilterField`，會忽略或包含這些參數，如下所示。

```
aws omics start-annotation-import-job --destination-name annotation_example\
  --role-arn arn:aws:iam::555555555555:role/demoRole \
  --items source=s3://demodata/example.garvan.vcf \
  --format-options '{ "vcfOptions": {
    "ignoreQualField": false,
    "ignoreFilterField": false         
    }
   }'
```

您也可以取消註釋存放區匯入，如下所示。如果取消成功，您將不會收到此 AWS CLI 呼叫的回應。不過，如果找不到匯入任務 ID 或匯入任務已完成，您會收到錯誤訊息。

```
aws omics cancel-annotation-import-job --job-id edd7b8ce-xmpl-47e2-bc99-258cac95a508
```

**注意**  
您的 **get-annotation-import-job**、**get-variant-import-job**、**list-annotation-import-jobs** 和 **list-variant-import-jobs** 中繼資料匯入任務歷史記錄會在兩年後自動刪除。匯入的變體和註釋資料不會自動刪除，並保留在您的資料存放區中。

# 建立 HealthOmics 註釋存放區版本
<a name="annotation-store-versioning"></a>

**重要**  
AWS HealthOmics 變體存放區和註釋存放區不再開放給新客戶。現有客戶可以繼續正常使用該服務。如需詳細資訊，請參閱[AWS HealthOmics 變體存放區和註釋存放區可用性變更](variant-store-availability-change.md)。

您可以建立新的註釋存放區版本，以收集不同版本的註釋資料庫。這可協助您組織註釋資料，這會定期更新。

若要建立新的現有註釋存放區版本，請使用 **create-annotation-store-version** API，如下列範例所示。

```
aws omics create-annotation-store-version \
     --name my_annotation_store \
     --version-name my_version
```

您將會收到包含註釋存放區版本 ID 的下列回應，確認已建立新版本的註釋。

```
{
     "creationTime": "2023-07-21T17:15:49.251040+00:00",
     "id": "3b93cdef69d2",
     "name": "my_annotation_store",
     "reference": {
         "referenceArn": "arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/5987565360"
     },
     "status": "CREATING",
     "versionName": "my_version"
}
```

若要更新註釋存放區版本的描述，您可以使用 **update-annotation-store-version** 將更新新增至註釋存放區版本。

```
aws omics update-annotation-store-version \
    --name my_annotation_store \
    --version-name my_version \
    --description "New Description"
```

您將會收到下列回應，確認註釋存放區版本已更新。

```
{
     "storeId": "4934045d1c6d",
     "id": "2a3f4a44aa7b",
     "description":"New Description",
     "status": "ACTIVE",
     "name": "my_annotation_store",
     "versionName": "my_version",
     "creation Time": "2023-07-21T17:20:59.380043+00:00",
     "updateTime": "2023-07-21T17:26:17.892034+00:00"
}
```

若要檢視註釋存放區版本的詳細資訊，請使用 **get-annotation-store-version**。

```
aws omics get-annotation-store-version --name my_annotation_store --version-name my_version              
```

您將會收到包含版本名稱、狀態和其他詳細資訊的回應。

```
{
     "storeId": "4934045d1c6d",
     "id": "2a3f4a44aa7b",
     "status": "ACTIVE",
     "versionArn": "arn:aws:omics:us-west-2:555555555555:annotationStore/my_annotation_store/version/my_version",
     "name": "my_annotation_store",
     "versionName": "my_version",
     "creationTime": "2023-07-21T17:15:49.251040+00:00",
     "updateTime": "2023-07-21T17:15:56.434223+00:00",
     "statusMessage": "",
     "versionSizeBytes": 0
    }
```

若要檢視註釋存放區的所有版本，您可以使用 **list-annotation-store-versions**，如下列範例所示。

```
aws omics list-annotation-store-versions --name my_annotation_store
```

您將會收到包含下列資訊的回應

```
{
  "annotationStoreVersions": [
    {
     "storeId": "4934045d1c6d",
     "id": "2a3f4a44aa7b",
     "status": "CREATING",
     "versionArn": "arn:aws:omics:us-west-2:555555555555:annotationStore/my_annotation_store/version/my_version_2",
     "name": "my_annotation_store",
     "versionName": "my_version_2",
     "creation Time": "2023-07-21T17:20:59.380043+00:00",
     "versionSizeBytes": 0
    },
    {
     "storeId": "4934045d1c6d",
     "id": "4934045d1c6d",
     "status": "ACTIVE",
     "versionArn": "arn:aws:omics:us-west-2:555555555555:annotationStore/my_annotation_store/version/my_version_1",
     "name": "my_annotation_store",
     "versionName": "my_version_1",
     "creationTime": "2023-07-21T17:15:49.251040+00:00",
     "updateTime": "2023-07-21T17:15:56.434223+00:00",
     "statusMessage": "",
     "versionSizeBytes": 0
    }
}
```

如果您不再需要註釋存放區版本，您可以使用 **delete-annotation-store-versions** 刪除註釋存放區版本，如下列範例所示。

```
aws omics delete-annotation-store-versions --name my_annotation_store --versions my_version  
```

如果刪除的儲存體版本沒有錯誤，您將會收到下列回應。

```
{
  "errors": []
}
```

如果有錯誤，您將收到包含錯誤詳細資訊的回應，如下所示。

```
{
  "errors": [
    {
      "versionName": "my_version",
      "message": "Version with versionName: my_version was not found."
    }
  ]
}
```

如果您嘗試刪除具有作用中匯入任務的註釋存放區版本，您將收到包含錯誤的回應，如下所示。

```
{
  "errors": [
    {
      "versionName": "my_version",
      "message": "version has an inflight import running"
    }
  ]
}
```

在此情況下，您可以強制刪除註釋存放區版本，如下列範例所示。

```
aws omics delete-annotation-store-versions --name my_annotation_store --versions my_version --force 
```

# 刪除 HealthOmics 分析存放區
<a name="deleting-a-store-examples"></a>

**重要**  
AWS HealthOmics 變體存放區和註釋存放區不再開放給新客戶。現有客戶可以繼續正常使用該服務。如需詳細資訊，請參閱[AWS HealthOmics 變體存放區和註釋存放區可用性變更](variant-store-availability-change.md)。

當您刪除變體或註釋存放區時，系統也會刪除該存放區中的所有匯入資料，以及任何相關聯的標籤。

下列範例示範如何使用 刪除變體存放區 AWS CLI。如果動作成功，變體存放區狀態會轉換為 `DELETING`。

```
aws omics delete-variant-store --id <variant-store-id>
```

下列範例示範如何刪除註釋存放區。如果動作成功，註釋存放區狀態會轉換為 `DELETING`。如果存在多個版本，則無法刪除註釋存放區。

```
aws omics delete-annotation-store --id <annotation-store-id>
```

# 查詢 HealthOmics 分析資料
<a name="analytics-query-data"></a>

**重要**  
AWS HealthOmics 變體存放區和註釋存放區不再開放給新客戶。現有客戶可以繼續正常使用該服務。如需詳細資訊，請參閱[AWS HealthOmics 變體存放區和註釋存放區可用性變更](variant-store-availability-change.md)。

您可以使用 AWS Lake Formation 和 Amazon Athena 或 Amazon EMR 在變體存放區上執行查詢。執行任何查詢之前，請先完成 Lake Formation 和 Amazon Athena 的設定程序 （如以下章節所述）。

如需 Amazon EMR 的相關資訊，請參閱[教學課程：Amazon EMR 入門](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-gs.html)

對於 2024 年 9 月 26 日之後建立的變體存放區，HealthOmics 會依範例 ID 分割存放區。此分割表示 HealthOmics 使用範例 ID 來最佳化變體資訊的儲存。使用範例資訊做為篩選條件的查詢會更快傳回結果，因為查詢掃描的資料較少。

HealthOmics 使用範例 IDs做為分割區檔案名稱。擷取資料之前，請檢查範例 ID 是否包含任何 PHI 資料。如果是這樣，請在擷取資料之前變更範例 ID。如需在範例 IDs中包含和不包含哪些內容的詳細資訊，請參閱 AWS [HIPAA 合規](https://aws.amazon.com/compliance/hipaa-compliance)網頁上的指導。

**Topics**
+ [設定 Lake Formation 以使用 HealthOmics](setting-up-lf.md)
+ [為查詢設定 Athena](analytics-setting-up-athena.md)
+ [在 HealthOmics 變體存放區上執行查詢](analytics-run-queries.md)

# 設定 Lake Formation 以使用 HealthOmics
<a name="setting-up-lf"></a>

**重要**  
AWS HealthOmics 變體存放區和註釋存放區不再開放給新客戶。現有客戶可以繼續正常使用該服務。如需詳細資訊，請參閱[AWS HealthOmics 變體存放區和註釋存放區可用性變更](variant-store-availability-change.md)。

在您使用 Lake Formation 管理 HealthOmics 資料存放區之前，請執行下列 Lake Formation 組態程序。

**Topics**
+ [建立或驗證 Lake Formation 管理員](#create-lf-admins)
+ [使用 Lake Formation 主控台建立資源連結](#create-resource-links)
+ [設定 AWS RAM 資源共享的許可](#configure-lf-permissions)

## 建立或驗證 Lake Formation 管理員
<a name="create-lf-admins"></a>

您必須先定義一或多個管理員，才能在 Lake Formation 中建立資料湖。

管理員是具有建立資源連結許可的使用者和角色。您為每個區域的每個帳戶設定資料湖管理員。

**在 Lake Formation 主控台中建立管理員使用者**

1. 開啟 AWS Lake Formation 主控台：[Lake Formation 主控台](https://console.aws.amazon.com//lakeformation)

1. 如果主控台顯示**歡迎使用 Lake Formation** 面板，請選擇**開始使用**。

   Lake Formation 會將**您新增至資料湖管理員**資料表。

1. 否則，從左側功能表中，選擇**管理角色和任務**。

1. 視需要新增任何其他管理員。

## 使用 Lake Formation 主控台建立資源連結
<a name="create-resource-links"></a>

若要建立使用者可以查詢的共用資源，必須停用預設存取控制。若要進一步了解停用預設存取控制，請參閱 Lake Formation 文件中的[變更資料湖的預設安全設定](https://docs.aws.amazon.com/lake-formation/latest/dg/change-settings.html)。您可以個別或群組建立資源連結，以便存取 Amazon Athena 或其他 AWS 服務 （例如 Amazon EMR) 中的資料。

**在 AWS Lake Formation 主控台中建立資源連結，並與 HealthOmics Analytics 使用者共用**

1. 開啟 AWS Lake Formation 主控台：[Lake Formation 主控台](https://console.aws.amazon.com//lakeformation)

1. 在主要導覽列中，選擇**資料庫**。

1. 在**資料庫**表格中，選取所需的資料庫。

1. 從**建立**功能表中，選擇**資源連結**。

1. 輸入**資源連結名稱**。如果您計劃從 Athena 存取資料庫，請使用小寫字母 （最多 256 個字元） 輸入名稱。

1. 選擇**建立**。

1. 新的資源連結現在會列在**資料庫**下。

### 使用 Lake Formation 主控台授予共用資源的存取權
<a name="create-resource-links"></a>

Lake Formation 資料庫管理員可以使用下列程序授予共用資源的存取權。

1. 開啟 AWS Lake Formation 主控台：https：//[https://console.aws.amazon.com/lakeformation/](https://console.aws.amazon.com//lakeformation)

1. 在主要導覽列中，選擇**資料庫**。

1. 在**資料庫**頁面上，選取您先前建立的資源連結。

1. 從**動作**功能表中，選擇**對目標授予**。

1. 在**主體**下的**授予資料許可**頁面上，選擇 **IAM 使用者或角色**。

1. 從 **IAM 使用者或角色**下拉式功能表中，尋找您要授予存取權的使用者。

1. 接著，在 **LF 標籤或目錄資源**卡下，選取**具名資料目錄資源**選項。

1. 從**資料表選用**下拉式功能表中，選取**所有資料表**或您先前建立的資料表。

1. 在**資料表許可**卡的**資料表許可**下，選擇**描述**和**選取**。

1. 接著，選擇**授予**。

若要檢視 Lake Formation 許可，請從主要導覽窗格中選擇 **Data lake 許可**。資料表顯示可用的資料庫和資源連結。

## 設定 AWS RAM 資源共享的許可
<a name="configure-lf-permissions"></a>

在 AWS Lake Formation 主控台中，選擇**主導覽列中的資料湖許可來檢視許可**。在**資料許可**頁面上，您可以檢視顯示**資源類型**、**資料庫**，以及與 **RAM Resource Share** 下共用資源**ARN**相關的資料表。如果您需要接受 AWS Resource Access Manager (AWS RAM) 資源共享， 會在 主控台中 AWS Lake Formation 通知您。

HealthOmics 可以在建立儲存期間隱含接受 AWS RAM 資源共用。若要接受 AWS RAM 資源共用，呼叫 或 `CreateAnnotationStore` API 操作的 IAM 使用者`CreateVariantStore`或角色必須允許下列動作：
+ `ram:GetResourceShareInvitations` - 此動作可讓 HealthOmics 尋找邀請。
+ `ram:AcceptResourceShareInvitation` - 此動作允許 HealthOmics 使用 FAS 字符接受邀請。

如果沒有這些許可，您會在建立存放區期間看到授權錯誤。

以下是包含這些動作的範例政策。將此政策新增至接受 AWS RAM 資源共用的 IAM 使用者或角色。

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "omics:*",
        "ram:AcceptResourceShareInvitation",
        "ram:GetResourceShareInvitations"
      ],
      "Resource": "*"
    }
  ]
}
```

------

# 為查詢設定 Athena
<a name="analytics-setting-up-athena"></a>

**重要**  
AWS HealthOmics 變體存放區和註釋存放區不再開放給新客戶。現有客戶可以繼續正常使用該服務。如需詳細資訊，請參閱[AWS HealthOmics 變體存放區和註釋存放區可用性變更](variant-store-availability-change.md)。

您可以使用 Athena 來查詢變體和註釋。執行任何查詢之前，請執行下列設定任務：

**Topics**
+ [使用 Athena 主控台設定查詢結果位置](#configure-athena-query)
+ [使用 Athena 引擎 v3 設定工作群組](#configure-athena-workgroup)

## 使用 Athena 主控台設定查詢結果位置
<a name="configure-athena-query"></a>

若要設定查詢結果位置，請遵循下列步驟。

1. 開啟 Athena 主控台：[Athena 主控台](https://console.aws.amazon.com//athena)

1. 在主要導覽列中，選擇**查詢編輯器**。

1. 在查詢編輯器中，選擇**設定**索引標籤，然後選擇**管理**。

1. 輸入位置的 S3 字首以儲存查詢結果。

## 使用 Athena 引擎 v3 設定工作群組
<a name="configure-athena-workgroup"></a>

若要設定工作群組，請依照下列步驟進行。

1. 開啟 Athena 主控台：[Athena 主控台](https://console.aws.amazon.com//athena)

1. 在主要導覽列中，選擇**工作群組**，然後選擇**建立工作群組**。

1. 輸入工作群組的名稱。

1. 選取 **Athena SQL** 做為引擎類型。

1. 在**升級查詢引擎**下，選取**手動**。

1. 在**查詢版本引擎**下，選取 **Athena 第 3 版**。

1. 選擇**建立工作群組**。

# 在 HealthOmics 變體存放區上執行查詢
<a name="analytics-run-queries"></a>

**重要**  
AWS HealthOmics 變體存放區和註釋存放區不再開放給新客戶。現有客戶可以繼續正常使用該服務。如需詳細資訊，請參閱[AWS HealthOmics 變體存放區和註釋存放區可用性變更](variant-store-availability-change.md)。

您可以使用 Amazon Athena 在變體存放區上執行查詢。請注意，變體和註釋存放區中的基因體座標表示為以零為基礎、半封閉的半開間隔。

## 使用 Athena 主控台執行簡單的查詢
<a name="run-queries-athena-simple"></a>

下列範例示範如何執行簡單的查詢。

1. 開啟 Athena 查詢編輯器：[Athena 查詢編輯器](https://console.aws.amazon.com//athena)

1. 在**工作群組**下，選取您在設定期間建立的工作群組。

1. 確認**資料來源**是 **AwsDataCatalog**。

1. 針對**資料庫**，選取您在 Lake Formation 設定期間建立的資料庫資源連結。

1. 將下列查詢複製到查詢 ******1 索引標籤下的查詢編輯器**：

   ```
   SELECT * from omicsvariants limit 10
   ```

1. 選擇**執行**以執行查詢。主控台會將資料表的前 10 列填入結果**omicsvariants**資料表。

## 使用 Athena 主控台執行複雜的查詢
<a name="run-queries-athena-complex"></a>

下列範例示範如何執行複雜的查詢。若要執行此查詢，`ClinVar`請將 匯入註釋存放區。

**執行複雜的查詢**

1. 開啟 Athena 查詢編輯器：[Athena 查詢編輯器](https://console.aws.amazon.com//athena)

1. 在**工作群組**下，選取您在設定期間建立的工作群組。

1. 確認**資料來源**是 **AwsDataCatalog**。

1. 針對**資料庫**，選取您在 Lake Formation 設定期間建立的資料庫資源連結。

1. 選擇右上角**\$1**的 ，以建立新的查詢索引標籤，名為**查詢 2**。

1. 將下列查詢複製到查詢 ******2 索引標籤下的查詢編輯器**：

   ```
   SELECT variants.sampleid,
     variants.contigname,
     variants.start,
     variants."end",
     variants.referenceallele,
     variants.alternatealleles,
     variants.attributes AS variant_attributes,
     clinvar.attributes AS clinvar_attributes  
   FROM omicsvariants as variants 
   INNER JOIN omicsannotations as clinvar ON 
     variants.contigname=CONCAT('chr',clinvar.contigname) 
     AND variants.start=clinvar.start 
     AND variants."end"=clinvar."end" 
     AND variants.referenceallele=clinvar.referenceallele 
     AND variants.alternatealleles=clinvar.alternatealleles 
   WHERE clinvar.attributes['CLNSIG']='Likely_pathogenic'
   ```

1. 選擇**執行**以開始執行查詢。

# 共用 HealthOmics 分析存放區
<a name="cross-account-sharing"></a>

**重要**  
AWS HealthOmics 變體存放區和註釋存放區不再開放給新客戶。現有客戶可以繼續正常使用該服務。如需詳細資訊，請參閱[AWS HealthOmics 變體存放區和註釋存放區可用性變更](variant-store-availability-change.md)。

身為變體存放區或註釋存放區的擁有者，您可以與其他 AWS 帳戶共用存放區。擁有者可以透過刪除共用來撤銷對共用資源的存取。

身為共用存放區的訂閱者，您必須先接受共用。然後，您可以定義使用共用存放區的工作流程。資料會在 AWS Glue 和 Lake Formation 中顯示為資料表。

當您不再需要存取存放區時，您會刪除共用。

如需資源共用的其他資訊[中的跨帳戶資源共用 AWS HealthOmics](resource-sharing.md)，請參閱 。

## 建立存放區共用
<a name="sharing-create"></a>

若要建立存放區共享，請使用 **create-share** API 操作。委託人訂閱者是將訂閱共享 AWS 帳戶 之使用者的 。下列範例會為變體存放區建立共享。若要與多個帳戶共用商店，您可以建立相同商店的多個共用。

```
aws omics create-share  \
        --resource-arn "arn:aws:omics:us-west-2:555555555555:variantStore/omics_dev_var_store" \
        --principal-subscriber "123456789012" \
        --name "my_Share-123"
```

如果建立成功，您會收到共用 ID 和狀態的回應。

```
{
       "shareId": "495c21bedc889d07d0ab69d710a6841e-dd75ab7a1a9c384fa848b5bd8e5a7e0a",
       "name": "my_Share-123",
       "status": "PENDING"
  }
```

共享會保持待定狀態，直到訂閱者使用接受共享 API 操作接受為止。