

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# HealthOmics 분석
<a name="omics-analytics"></a>

**중요**  
AWS HealthOmics 변형 저장소 및 주석 저장소는 더 이상 신규 고객에게 공개되지 않습니다. 기존 고객은 정상적으로 서비스를 계속 이용할 수 있습니다. 자세한 내용은 [AWS HealthOmics 변형 저장소 및 주석 저장소 가용성 변경](variant-store-availability-change.md) 단원을 참조하십시오.

HealthOmics 분석은 게놈 변형 및 주석의 저장 및 분석을 지원합니다. Analytics는 변형 저장소와 주석 저장소라는 두 가지 유형의 스토리지 리소스를 제공합니다. 이러한 리소스를 사용하여 유전체 변형 데이터 및 주석 데이터를 저장, 변환 및 쿼리합니다. 데이터를 데이터 스토어로 가져온 후 Athena를 사용하여 데이터에 대한 고급 분석을 수행할 수 있습니다.

HealthOmics 콘솔 또는 API를 사용하여 저장소를 생성 및 관리하고, 데이터를 가져오고, 분석 저장소 데이터를 공동 작업자와 공유할 수 있습니다.

변형 저장소는 VCF 형식의 데이터를 지원하고 주석 저장소는 TSV/CSV 및 GFF3 형식을 지원합니다. 유전체 좌표는 0 기반 반닫힌 반개방 간격으로 표시됩니다. 데이터가 HealthOmics 분석 데이터 스토어에 있는 경우 VCF 파일에 대한 액세스는를 통해 관리됩니다 AWS Lake Formation. 그런 다음 Amazon Athena를 사용하여 VCF 파일을 쿼리할 수 있습니다. 쿼리는 Athena 쿼리 엔진 버전 3을 사용해야 합니다. Athena 쿼리 엔진 버전에 대한 자세한 내용은 [Amazon Athena 설명서를](https://docs.aws.amazon.com/athena/latest/ug/engine-versions-changing.html) 참조하세요.



**Topics**
+ [HealthOmics 변형 저장소 생성](creating-variant-stores.md)
+ [HealthOmics 변형 저장소 가져오기 작업 생성](parsing-annotation-stores.md)
+ [HealthOmics 주석 저장소 생성](creating-and-managing-annotation-store.md)
+ [HealthOmics 주석 저장소에 대한 가져오기 작업 생성](annotation-store-import-jobs.md)
+ [HealthOmics 주석 저장소 버전 생성](annotation-store-versioning.md)
+ [HealthOmics 분석 저장소 삭제](deleting-a-store-examples.md)
+ [HealthOmics 분석 데이터 쿼리](analytics-query-data.md)
+ [HealthOmics 분석 스토어 공유](cross-account-sharing.md)

# HealthOmics 변형 저장소 생성
<a name="creating-variant-stores"></a>

**중요**  
AWS HealthOmics 변형 저장소 및 주석 저장소는 더 이상 신규 고객에게 공개되지 않습니다. 기존 고객은 정상적으로 서비스를 계속 이용할 수 있습니다. 자세한 내용은 [AWS HealthOmics 변형 저장소 및 주석 저장소 가용성 변경](variant-store-availability-change.md) 단원을 참조하십시오.

다음 주제에서는 콘솔 및 API를 사용하여 HealthOmics 변형 저장소를 생성하는 방법을 설명합니다.

**Topics**
+ [콘솔을 사용하여 변형 저장소 생성](#gs-console-analytics)
+ [API를 사용하여 변형 저장소 생성](#gs-api-analytics)

## 콘솔을 사용하여 변형 저장소 생성
<a name="gs-console-analytics"></a>

HealthOmics 콘솔을 사용하여 변형 저장소를 생성할 수 있습니다.

1. [HealthOmics 콘솔](https://console.aws.amazon.com/omics/)을 엽니다.

1.  필요한 경우 왼쪽 탐색 창(™)을 엽니다. **변형 저장소**를 선택합니다.

1. **변형 저장소 생성** 페이지에서 다음 정보를 제공합니다.
   + **변형 저장소 이름** -이 저장소의 고유한 이름입니다.
   + **설명**(선택 사항) -이 변형 저장소에 대한 설명입니다.
   + **참조 유전체** -이 변형 저장소의 참조 유전체입니다.
   + **데이터 암호화** - 데이터 암호화를 직접 소유 및 관리할지 여부를 선택합니다 AWS .
   + **태그**(선택 사항) -이 변형 저장소에 최대 50개의 태그를 제공합니다.

1. **변형 저장소 생성을** 선택합니다.

## API를 사용하여 변형 저장소 생성
<a name="gs-api-analytics"></a>

HealthOmics `CreateVariantStore` API 작업을 사용하여 변형 저장소를 생성합니다. 를 사용하여이 작업을 수행할 수도 있습니다 AWS CLI.

변형 저장소를 생성하려면 저장소의 이름과 참조 저장소의 ARN을 제공합니다. 변형 저장소는 상태가 READY로 변경되면 데이터를 수집할 준비가 된 것입니다.

다음 예제에서는 AWS CLI 를 사용하여 변형 저장소를 생성합니다.

```
aws omics create-variant-store --name myvariantstore \
    --reference referenceArn="arn:aws:omics:us-west-2:555555555555:referenceStore/123456789/reference/5987565360"
```

변형 저장소 생성을 확인하려면 다음 응답을 받습니다.

```
{
    "creationTime": "2022-11-03T18:19:52.296368+00:00",
    "id": "45aeb91d5678",
    "name": "myvariantstore",
    "reference": {
        "referenceArn": "arn:aws:omics:us-west-2:555555555555:referenceStore/123456789/reference/5987565360"
    },
    "status": "CREATING"
}
```

변형 저장소에 대해 자세히 알아보려면 **get-variant-store** API를 사용합니다.

```
aws omics get-variant-store --name myvariantstore
```

다음과 같은 응답을 받게 됩니다.

```
{
    "id": "45aeb91d5678",
    "reference": {
        "referenceArn": "arn:aws:omics:us-west-2:555555555555:referenceStore/123456789/reference/5987565360"
    },
    "status": "ACTIVE",
    "storeArn": "arn:aws:omics:us-west-2:555555555555:variantStore/myvariantstore",
    "name": "myvariantstore",
    "creationTime": "2022-11-03T18:19:52.296368+00:00",
    "updateTime": "2022-11-03T18:30:56.272792+00:00",
    "tags": {},
    "storeSizeBytes": 0
}
```

계정과 연결된 모든 변형 저장소를 보려면 **list-variant-stores** API를 사용합니다.

```
aws omics list-variant-stores  
```

다음 예제 응답과 같이 ID, IDs 상태 및 기타 세부 정보와 함께 모든 변형 저장소를 나열하는 응답을 받습니다.

```
{
    "variantStores": [
        {
            "id": "45aeb91d5678",
            "reference": {
                "referenceArn": "arn:aws:omics:us-west-2:55555555555:referenceStore/5506874698"
            },
            "status": "ACTIVE",
            "storeArn": "arn:aws:omics:us-west-2:55555555555:variantStore/new_variant_store",
            "name": "variantstore",
            "creationTime": "2022-11-03T18:19:52.296368+00:00",
            "updateTime": "2022-11-03T18:30:56.272792+00:00",
            "statusMessage": "",
            "storeSizeBytes": 141526
        }
    ]
}
```

상태 또는 기타 기준에 따라 **list-variant-stores** API에 대한 응답을 필터링할 수도 있습니다.

 2023년 5월 15일 이후에 생성된 분석 저장소로 가져온 VCF 파일은 변형 효과 예측기(VEP) 주석에 대한 스키마를 정의했습니다. 이렇게 하면 가져온 VCF 데이터를 더 쉽게 쿼리하고 구문 분석할 수 있습니다. `annotation fields` 파라미터가 API 또는 CLI 호출에 포함된 경우를 제외하고 변경 사항은 2023년 5월 15일 이전에 생성된 스토어에는 영향을 주지 않습니다. 이러한 스토어의 경우 `annotation fields` 파라미터를 사용하면 요청이 실패합니다.

# HealthOmics 변형 저장소 가져오기 작업 생성
<a name="parsing-annotation-stores"></a>

**중요**  
AWS HealthOmics 변형 저장소 및 주석 저장소는 더 이상 신규 고객에게 공개되지 않습니다. 기존 고객은 정상적으로 서비스를 계속 이용할 수 있습니다. 자세한 내용은 [AWS HealthOmics 변형 저장소 및 주석 저장소 가용성 변경](variant-store-availability-change.md) 단원을 참조하십시오.

다음 예제에서는를 사용하여 변형 저장소 AWS CLI 에 대한 가져오기 작업을 생성하는 방법을 보여줍니다.

```
aws omics start-variant-import-job \
       --destination-name myvariantstore \
       --runLeftNormalization false \
       --role-arn  arn:aws:iam::55555555555:role/roleName \
       --items source=s3://my-omics-bucket/sample.vcf.gz source=s3://my-omics-bucket/sample2.vcf.gz
```

```
{
    "destinationName": "store_a",
    "roleArn": "....",
    "runLeftNormalization": false,
    "items": [
        {"source": "s3://my-omics-bucket/sample.vcf.gz"},
        {"source": "s3://my-omics-bucket/sample2.vcf.gz"}
    ]
}
```

2023년 5월 15일 이후에 생성된 스토어의 경우 다음 예제에서는 `--annotation-fields` 파라미터를 추가하는 방법을 보여줍니다. 주석 필드는 가져오기로 정의됩니다.

```
aws omics start-variant-import-job \
   --destination-name annotationparsingvariantstore \
   --role-arn arn:aws:iam::123456789012:role/<role_name> \
   --items source=s3://pathToS3/sample.vcf
   --annotation-fields '{"VEP": "CSQ"}'
```

```
{
    "jobId": "981e2286-e954-4391-8a97-09aefc343861"
}
```

**get-variant-import-job**을 사용하여 상태를 확인합니다.

```
aws omics get-variant-import-job --job-id 08279950-a9e3-4cc3-9a3c-a574f9c9e229      
```

가져오기 작업의 상태를 보여주는 JSON 응답을 받게 됩니다. VCF의 VEP 주석은 INFO 열에 ID/값 페어로 저장된 정보에 대해 구문 분석됩니다. [변형 효과 예측기 주석 앙상블](https://useast.ensembl.org/info/docs/tools/vep/index.html/#vcf) INFO 열의 기본 ID는 CSQ이지만 `--annotation-fields` 파라미터를 사용하여 INFO 열에 사용되는 사용자 지정 값을 나타낼 수 있습니다. 구문 분석은 현재 VEP 주석에 대해 지원됩니다.

2023년 5월 15일 이전에 생성된 저장소 또는 VEP 주석이 포함되지 않은 VCF 파일의 경우 응답에 주석 필드가 포함되지 않습니다.

```
{
    "creationTime": "2023-04-11T17:52:37.241958+00:00",
    "destinationName": "annotationparsingvariantstore",
    "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea",
    "items": [

    {
       "jobStatus": "COMPLETED",
       "source": "s3://amzn-s3-demo-bucket/NA12878.2k.garvan.vcf"
    }
 ],
    "roleArn": "arn:aws:iam::555555555555:role/<role_name>",

    "runLeftNormalization": false,
    "status": "COMPLETED",
    "updateTime": "2023-04-11T17:58:22.676043+00:00",
}
```

VCF 파일의 일부인 VEP 주석은 다음 구조의 사전 정의된 스키마로 저장됩니다. 추가 항목 필드는 기본 스키마에 포함되지 않은 추가 VEP 필드를 저장하는 데 사용할 수 있습니다.

```
annotations struct<
   vep: array<struct<
      allele:string,
      consequence: array<string>,
      impact:string,
      symbol:string,
      gene:string,
      `feature_type`: string, 
      feature: string,
      biotype: string,
      exon: struct<rank:string, total:string>,
      intron: struct<rank:string, total:string>,
      hgvsc: string,
      hgvsp: string,
      `cdna_position`: string,
      `cds_position`: string,
      `protein_position`: string,
      `amino_acids`: struct<reference:string, variant: string>,
      codons: struct<reference:string, variant: string>,
      `existing_variation`: array<string>,
      distance: string, 
      strand: string, 
      flags: array<string>,
      symbol_source: string,
      hgnc_id: string,
      `extras`: map<string, string> 
    >>
>
```

구문 분석은 최선의 방법으로 수행됩니다. VEP 항목이 [VEP 표준 사양을](https://useast.ensembl.org/info/docs/tools/vep/vep_formats.html#vcf) 따르지 않으면 구문 분석되지 않고 배열의 행이 비어 있습니다.

새 변형 저장소의 경우 **get-variant-import-job**에 대한 응답에는 다음과 같이 주석 필드가 포함됩니다.

```
aws omics get-variant-import-job --job-id 08279950-a9e3-4cc3-9a3c-a574f9c9e229      
```

가져오기 작업의 상태를 보여주는 JSON 응답을 받습니다.

```
{
    "creationTime": "2023-04-11T17:52:37.241958+00:00",
    "destinationName": "annotationparsingvariantstore",
    "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea",
    "items": [

    {
    "jobStatus": "COMPLETED",
    "source": "s3://amzn-s3-demo-bucket/NA12878.2k.garvan.vcf"
    }
 ],
    "roleArn": "arn:aws:iam::123456789012:role/<role_name>",
    "runLeftNormalization": false,
    "status": "COMPLETED",
    "updateTime": "2023-04-11T17:58:22.676043+00:00",
    "annotationFields" : {"VEP": "CSQ"}
  }
}
```

**list-variant-import-jobs**를 사용하여 모든 가져오기 작업과 해당 상태를 볼 수 있습니다.

```
aws omics list-variant-import-jobs --ids 7a1c67e3-b7f9-434d-817b-9c571fd63bea          
```

응답에는 다음과 같은 정보가 포함됩니다.

```
{
    "variantImportJobs": [
    {
        "creationTime": "2023-04-11T17:52:37.241958+00:00",
        "destinationName": "annotationparsingvariantstore",
        "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea",
        "roleArn": "arn:aws:iam::55555555555:role/roleName",
        "runLeftNormalization": false,
        "status": "COMPLETED",
        "updateTime": "2023-04-11T17:58:22.676043+00:00",
        "annotationFields" : {"VEP": "CSQ"}
        }
    ]
  }
}
```

필요한 경우 다음 명령을 사용하여 가져오기 작업을 취소할 수 있습니다.

```
aws omics cancel-variant-import-job 
     --job-id edd7b8ce-xmpl-47e2-bc99-258cac95a508
```

# HealthOmics 주석 저장소 생성
<a name="creating-and-managing-annotation-store"></a>

**중요**  
AWS HealthOmics 변형 저장소 및 주석 저장소는 더 이상 신규 고객에게 공개되지 않습니다. 기존 고객은 정상적으로 서비스를 계속 이용할 수 있습니다. 자세한 내용은 [AWS HealthOmics 변형 저장소 및 주석 저장소 가용성 변경](variant-store-availability-change.md) 단원을 참조하십시오.

주석 저장소는 TSV, VCF 또는 GFF 파일의 것과 같은 주석 데이터베이스를 나타내는 데이터 저장소입니다. 동일한 참조 유전체가 지정되면 주석 저장소는 가져오기 중에 변형 저장소와 동일한 좌표계에 매핑됩니다. 다음 주제에서는 HealthOmics 콘솔 및를 사용하여 주석 저장소 AWS CLI 를 생성하고 관리하는 방법을 보여줍니다.

**Topics**
+ [콘솔을 사용하여 주석 저장소 생성](#gs-console-create-annotation-store)
+ [API를 사용하여 주석 저장소 생성](#create-manage-annotation-store-api)

## 콘솔을 사용하여 주석 저장소 생성
<a name="gs-console-create-annotation-store"></a>

다음 절차에 따라 HealthOmics 콘솔을 사용하여 주석 저장소를 생성합니다.

**주석 저장소를 생성하려면**

1. [HealthOmics 콘솔](https://console.aws.amazon.com/omics/)을 엽니다.

1.  필요한 경우 왼쪽 탐색 창(™)을 엽니다. **주석 저장소를** 선택합니다.

1. **주석 저장소** 페이지에서 **주석 저장소 생성을** 선택합니다.

1. **주석 저장소 생성** 페이지에서 다음 정보를 제공합니다.
   + **주석 저장소 이름** -이 저장소의 고유한 이름입니다.
   + **설명**(선택 사항) -이 참조 유전체에 대한 설명입니다.
   + **데이터 형식 및 스키마 세부 정보 **- 데이터 파일 형식을 선택하고이 저장소에 대한 스키마 정의를 업로드합니다.
   + **참조 유전체** -이 주석의 참조 유전체입니다.
   + **데이터 암호화** - 데이터 암호화를 직접 소유 및 관리할지 여부를 선택합니다 AWS .
   + **태그**(선택 사항) -이 주석 저장소에 최대 50개의 태그를 제공합니다.

1. **주석 저장소 생성을** 선택합니다.

## API를 사용하여 주석 저장소 생성
<a name="create-manage-annotation-store-api"></a>

다음 예제에서는를 사용하여 주석 저장소를 생성하는 방법을 보여줍니다 AWS CLI. 모든 AWS CLI 및 API 작업에 대해 데이터 형식을 지정해야 합니다.

```
aws omics create-annotation-store --name my_annotation_store \
           --store-format GFF \
           --reference referenceArn="arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/5987565360"
           --version-name new_version
```

주석 저장소 생성을 확인하는 다음 응답을 받게 됩니다.

```
{
           "creationTime": "2022-08-24T20:34:19.229500Z",
           "id": "3b93cdef69d2",
           "name": "my_annotation_store",
           "reference": {
               "referenceArn": "arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/5987565360"
           },
           "status": "CREATING"
           "versionName": "my_version"
       }
```

주석 저장소에 대해 자세히 알아보려면 **get-annotation-store** API를 사용합니다.

```
aws omics get-annotation-store --name my_annotation_store
```

다음과 같은 응답을 받게 됩니다.

```
{
          "id": "eeb019ac79c2",
          "reference": {
              "referenceArn": "arn:aws:omics:us-west-2:555555555555:referenceStore/5638433913/reference/5871590330“
          },
          "status": "ACTIVE",
          "storeArn": "arn:aws:omics:us-west-2:555555555555:annotationStore/gffstore",
          "name": "my_annotation_store",
          "creationTime": "2022-11-05T00:05:19.136131+00:00",
          "updateTime": "2022-11-05T00:10:36.944839+00:00",
          "tags": {},
          "storeFormat": "GFF",
          "statusMessage": "",
          "storeSizeBytes": 0,
          "numVersions": 1
      }
```

계정과 연결된 모든 주석 저장소를 보려면 **list-annotation-stores** API 작업을 사용합니다.

```
aws omics list-annotation-stores 
```

다음 예제 응답과 같이 ID, IDs 상태 및 기타 세부 정보와 함께 모든 주석 저장소를 나열하는 응답을 받습니다.

```
{
           "annotationStores": [
               {
                  "id": "4d8f3eada259",
                   "reference":
                       "referenceArn": "arn:aws:omics:us-west-2:555555555555:referenceStore/5638433913/reference/5871590330"
                   },
                   "status": "CREATING",
                   "name": "gffstore",
                   "creationTime": "2022-09-27T17:30:52.182990+00:00",
                   "updateTime": "2022-09-27T17:30:53.025362+00:00"
               }
           ]
       }
```

상태 또는 기타 기준에 따라 응답을 필터링할 수도 있습니다.

# HealthOmics 주석 저장소에 대한 가져오기 작업 생성
<a name="annotation-store-import-jobs"></a>

**중요**  
AWS HealthOmics 변형 저장소 및 주석 저장소는 더 이상 신규 고객에게 공개되지 않습니다. 기존 고객은 정상적으로 서비스를 계속 이용할 수 있습니다. 자세한 내용은 [AWS HealthOmics 변형 저장소 및 주석 저장소 가용성 변경](variant-store-availability-change.md) 단원을 참조하십시오.

**Topics**
+ [API를 사용하여 주석 가져오기 작업 생성](#create-annotation-import-api)
+ [TSV 및 VCF 형식에 대한 추가 파라미터](#annotation-import-tsv-vcf)
+ [TSV 형식의 주석 저장소 생성](#annotation-import-tsv-vcftsv-annotation-store-examples-tsv)
+ [VCF 형식의 가져오기 작업 시작](#vcf-annotation-store-examples)

## API를 사용하여 주석 가져오기 작업 생성
<a name="create-annotation-import-api"></a>

다음 예제에서는를 사용하여 주석 가져오기 작업을 AWS CLI 시작하는 방법을 보여줍니다.

```
aws omics start-annotation-import-job \
           --destination-name myannostore \
           --version-name myannostore \
           --role-arn arn:aws:iam::123456789012:role/roleName \
           --items source=s3://my-omics-bucket/sample.vcf.gz
           --annotation-fields '{"VEP": "CSQ"}'
```

2023년 5월 15일 이전에 생성된 주석 저장소는 **주석 필드가 포함된 경우 오류 메시지를 반환합니다**. 주석 저장소 가져오기 작업과 관련된 API 작업에 대한 출력은 반환되지 않습니다.

그런 다음 **get-annotation-import-job** API 작업과 `job ID` 파라미터를 사용하여 주석 가져오기 작업에 대한 자세한 내용을 알아볼 수 있습니다.

```
aws omics get-annotation-import-job --job-id 9e4198fb-fa85-446c-9301-9b823a1a8ba8         
```

주석 필드를 포함하여 다음과 같은 응답을 받게 됩니다.

```
{
          "creationTime": "2023-04-11T19:09:25.049767+00:00",
          "destinationName": "parsingannotationstore",
          "versionName": "parsingannotationstore",
          "id": "9e4198fb-fa85-446c-9301-9b823a1a8ba8",
          "items": [
              {
                  "jobStatus": "COMPLETED",
                  "source": "s3://my-omics-bucket/sample.vep.vcf"
              }
          ],
          "roleArn": "arn:aws:iam::55555555555:role/roleName",
          "runLeftNormalization": false,
          "status": "COMPLETED",
          "updateTime": "2023-04-11T19:13:09.110130+00:00",
          "annotationFields" : {"VEP": "CSQ"}
       }
```

모든 주석 저장소 가져오기 작업을 보려면 **list-annotation-import-jobs를 **사용합니다.

```
aws omics list-annotation-import-jobs --ids 9e4198fb-fa85-446c-9301-9b823a1a8ba8          
```

응답에는 주석 저장소 가져오기 작업의 세부 정보와 상태가 포함됩니다.

```
{
          "annotationImportJobs": [
          {
              "creationTime": "2023-04-11T19:09:25.049767+00:00",
              "destinationName": "parsingannotationstore",
              "versionName": "parsingannotationstore",
              "id": "9e4198fb-fa85-446c-9301-9b823a1a8ba8",
              "roleArn": "arn:aws:iam::55555555555:role/roleName",
              "runLeftNormalization": false,
              "status": "COMPLETED",
              "updateTime": "2023-04-11T19:13:09.110130+00:00",
              "annotationFields" : {"VEP": "CSQ"}
          }
          ]
      }
```

## TSV 및 VCF 형식에 대한 추가 파라미터
<a name="annotation-import-tsv-vcf"></a>

TSV 및 VCF 형식의 경우 입력 구문 분석 방법을 API에 알려주는 추가 파라미터가 있습니다.

**중요**  
 쿼리 엔진으로 내보낸 CSV 주석 데이터는 데이터 세트 가져오기의 정보를 직접 반환합니다. 가져온 데이터에 수식 또는 명령이 포함된 경우 파일에 CSV 삽입이 적용될 수 있습니다. 따라서 쿼리 엔진으로 내보낸 파일은 보안 경고를 표시할 수 있습니다. 악의적인 활동을 방지하려면 내보내기 파일을 읽을 때 링크와 매크로를 끄세요.

또한 TSV 구문 분석기는 다음 표에 나열된 유전체 좌표의 왼쪽 정규화 및 표준화와 같은 기본 생물 정보학 작업을 수행합니다.


| 형식 유형 | 설명 | 
| --- | --- | 
| Generic | 일반 텍스트 파일. 게놈 정보가 없습니다. | 
| CHR\$1POS | 시작 위치 - 1,와 동일한 종료 위치 추가POS. | 
| CHR\$1POS\$1REF\$1ALT | contig, 1-base 위치, ref 및 alt 대립형질 정보를 포함합니다. | 
| CHR\$1START\$1END\$1REF\$1ALT\$1ONE\$1BASE | contig, start, end, ref 및 alt 대립형질 정보를 포함합니다. 좌표는 1 기반입니다. | 
| CHR\$1START\$1END\$1ZERO\$1BASE | contig, start 및 end 위치를 포함합니다. 좌표는 0 기반입니다. | 
| CHR\$1START\$1END\$1ONE\$1BASE | contig, start 및 end 위치를 포함합니다. 좌표는 1 기반입니다. | 
| CHR\$1START\$1END\$1REF\$1ALT\$1ZERO\$1BASE | contig, start, end, ref 및 alt 대립형질 정보를 포함합니다. 좌표는 0 기반입니다. | 

TSV 가져오기 주석 저장소 요청은 다음 예제와 같습니다.

```
aws omics start-annotation-import-job \
--destination-name tsv_anno_example \
--role-arn arn:aws:iam::555555555555:role/demoRole \
--items source=s3://demodata/genomic_data.bed.gz \
--format-options '{ "tsvOptions": {
        "readOptions": {
            "header": false,
            "sep": "\t"
        }
    }
}'
```

## TSV 형식의 주석 저장소 생성
<a name="annotation-import-tsv-vcftsv-annotation-store-examples-tsv"></a>

다음 예제에서는 헤더, 행 및 설명이 포함된 탭 제한 파일을 사용하여 주석 저장소를 생성합니다. 좌표는 이며`CHR_START_END_ONE_BASED`, OMIM의 인적 Gene Map 개요에 있는 HG19 Gene Map이 포함되어 있습니다. [https://www.omim.org/downloads](https://www.omim.org/downloads) 

```
aws omics create-annotation-store --name mimgenemap \
  --store-format TSV \
  --reference=referenceArn=arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/2310864158 \
  --store-options=tsvStoreOptions='{
    annotationType=CHR_START_END_ONE_BASE,  
    formatToHeader={CHR=chromosome, START=genomic_position_start, END=genomic_position_end},
    schema=[
      {chromosome=STRING}, 
      {genomic_position_start=LONG}, 
      {genomic_position_end=LONG}, 
      {cyto_location=STRING}, 
      {computed_cyto_location=STRING}, 
      {mim_number=STRING}, 
      {gene_symbols=STRING}, 
      {gene_name=STRING}, 
      {approved_gene_name=STRING}, 
      {entrez_gene_id=STRING}, 
      {ensembl_gene_id=STRING}, 
      {comments=STRING}, 
      {phenotypes=STRING}, 
      {mouse_gene_symbol=STRING}]}'
```

헤더를 사용하거나 사용하지 않고 파일을 가져올 수 있습니다. CLI 요청에서 이를 나타내려면 다음 가져오기 작업 예제와 `header=false`같이를 사용합니다.

```
aws omics start-annotation-import-job \
   --role-arn arn:aws:iam::555555555555:role/demoRole \
   --items=source=s3://amzn-s3-demo-bucket/annotation-examples/hg38_genemap2.txt \
   --destination-name output-bucket \
   --format-options=tsvOptions='{readOptions={sep="\t",header=false,comment="#"}}'
```

다음 예시에서는 침대 파일에 대한 주석 저장소를 생성합니다. 침대 파일은 탭으로 구분된 간단한 파일입니다. 이 예제에서 열은 염색체, 시작, 끝 및 리전 이름입니다. 좌표는 0을 기반으로 하며 데이터에 헤더가 없습니다.

```
aws omics create-annotation-store \
   --name cexbed --store-format TSV \
   --reference=referenceArn=arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/2310864158 \
   --store-options=tsvStoreOptions='{
   annotationType=CHR_START_END_ZERO_BASE,  
   formatToHeader={CHR=chromosome, START=start, END=end}, 
   schema=[{chromosome=STRING}, {start=LONG}, {end=LONG}, {name=STRING}]}'
```

그런 다음 CLI 명령을 사용하여 Bed 파일을 주석 저장소로 가져올 수 있습니다.

```
aws omics start-annotation-import-job \
   --role-arn arn:aws:iam::555555555555:role/demoRole \
   --items=source=s3://amzn-s3-demo-bucket/TruSeq_Exome_TargetedRegions_v1.2.bed \ 
   --destination-name cexbed \
   --format-options=tsvOptions='{readOptions={sep="\t",header=false,comment="#"}}'
```

다음 예제에서는 VCF 파일의 처음 몇 개의 열과 주석 정보가 있는 열이 포함된 탭으로 구분된 파일에 대한 주석 저장소를 생성합니다. 여기에는 염색체, 시작, 참조 및 대체 대립형질에 대한 정보가 포함된 유전체 위치가 포함되며 헤더가 포함됩니다.

```
aws omics create-annotation-store --name gnomadchrx --store-format TSV \
--reference=referenceArn=arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/2310864158 \
--store-options=tsvStoreOptions='{
    annotationType=CHR_POS_REF_ALT, 
    formatToHeader={CHR=chromosome, POS=start, REF=ref, ALT=alt}, 
    schema=[
        {chromosome=STRING}, 
        {start=LONG}, 
        {ref=STRING}, 
        {alt=STRING}, 
        {filters=STRING}, 
        {ac_hom=STRING}, 
        {ac_het=STRING},
        {af_hom=STRING}, 
        {af_het=STRING}, 
        {an=STRING}, 
        {max_observed_heteroplasmy=STRING}]}'
```

그런 다음 CLI 명령을 사용하여 파일을 주석 저장소로 가져옵니다.

```
aws omics start-annotation-import-job \
  --role-arn arn:aws:iam::555555555555:role/demoRole \
   --items=source=s3://amzn-s3-demo-bucket/gnomad.genomes.v3.1.sites.chrM.reduced_annotations.tsv \
   --destination-name gnomadchrx \
   --format-options=tsvOptions='{readOptions={sep="\t",header=true,comment="#"}}'
```

다음 예제에서는 고객이 mim2gene 파일에 대한 주석 저장소를 생성하는 방법을 보여줍니다. mim2gene 파일은 OMIM의 유전자와 다른 유전자 식별자 간의 링크를 제공합니다. 탭이 구분되어 있으며 주석이 포함되어 있습니다.

```
aws omics create-annotation-store \
  --name mim2gene \
  --store-format TSV \
  --reference=referenceArn=arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/2310864158 \
  --store-options=tsvStoreOptions='
    {annotationType=GENERIC,      
    formatToHeader={}, 
    schema=[
        {mim_gene_id=STRING}, 
        {mim_type=STRING}, 
        {entrez_id=STRING}, 
        {hgnc=STRING}, 
        {ensembl=STRING}]}'
```

그런 다음 다음과 같이 스토어로 데이터를 가져올 수 있습니다.

```
aws omics start-annotation-import-job \
   --role-arn arn:aws:iam::555555555555:role/demoRole \
   --items=source=s3://xquek-dev-aws/annotation-examples/mim2gene.txt \
   --destination-name mim2gene \
   --format-options=tsvOptions='{readOptions={sep="\t",header=false,comment="#"}}'
```

## VCF 형식의 가져오기 작업 시작
<a name="vcf-annotation-store-examples"></a>

VCF 파일의 경우 표시된 대로 해당 파라미터를 무시하거나 포함하는 `ignoreQualField` 및 `ignoreFilterField`라는 두 개의 추가 입력이 있습니다.

```
aws omics start-annotation-import-job --destination-name annotation_example\
  --role-arn arn:aws:iam::555555555555:role/demoRole \
  --items source=s3://demodata/example.garvan.vcf \
  --format-options '{ "vcfOptions": {
    "ignoreQualField": false,
    "ignoreFilterField": false         
    }
   }'
```

그림과 같이 주석 저장소 가져오기를 취소할 수도 있습니다. 취소에 성공하면이 AWS CLI 호출에 대한 응답을 받지 못합니다. 그러나 가져오기 작업 ID를 찾을 수 없거나 가져오기 작업이 완료되면 오류 메시지가 표시됩니다.

```
aws omics cancel-annotation-import-job --job-id edd7b8ce-xmpl-47e2-bc99-258cac95a508
```

**참고**  
**get-annotation-import-job**, **get-variant-import-job**, **list-annotation-import-jobs** 및 **list-variant-import-jobs**에 대한 메타데이터 가져오기 작업 기록은 2년 후에 자동으로 삭제됩니다. 가져온 변형 및 주석 데이터는 자동으로 삭제되지 않으며 데이터 스토어에 남아 있습니다.

# HealthOmics 주석 저장소 버전 생성
<a name="annotation-store-versioning"></a>

**중요**  
AWS HealthOmics 변형 저장소 및 주석 저장소는 더 이상 신규 고객에게 공개되지 않습니다. 기존 고객은 정상적으로 서비스를 계속 이용할 수 있습니다. 자세한 내용은 [AWS HealthOmics 변형 저장소 및 주석 저장소 가용성 변경](variant-store-availability-change.md) 단원을 참조하십시오.

새 버전의 주석 저장소를 생성하여 다양한 버전의 주석 데이터베이스를 수집할 수 있습니다. 이렇게 하면 정기적으로 업데이트되는 주석 데이터를 구성하는 데 도움이 됩니다.

기존 주석 저장소의 새 버전을 생성하려면 다음 예제와 같이 **create-annotation-store-version** API를 사용합니다.

```
aws omics create-annotation-store-version \
     --name my_annotation_store \
     --version-name my_version
```

주석 저장소 버전 ID로 다음 응답을 받아 주석의 새 버전이 생성되었음을 확인합니다.

```
{
     "creationTime": "2023-07-21T17:15:49.251040+00:00",
     "id": "3b93cdef69d2",
     "name": "my_annotation_store",
     "reference": {
         "referenceArn": "arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/5987565360"
     },
     "status": "CREATING",
     "versionName": "my_version"
}
```

주석 저장소 버전의 설명을 업데이트하려면 **update-annotation-store-version**을 사용하여 주석 저장소 버전에 업데이트를 추가할 수 있습니다.

```
aws omics update-annotation-store-version \
    --name my_annotation_store \
    --version-name my_version \
    --description "New Description"
```

주석 저장소 버전이 업데이트되었음을 확인하는 다음 응답을 받게 됩니다.

```
{
     "storeId": "4934045d1c6d",
     "id": "2a3f4a44aa7b",
     "description":"New Description",
     "status": "ACTIVE",
     "name": "my_annotation_store",
     "versionName": "my_version",
     "creation Time": "2023-07-21T17:20:59.380043+00:00",
     "updateTime": "2023-07-21T17:26:17.892034+00:00"
}
```

주석 저장소 버전의 세부 정보를 보려면 **get-annotation-store-version**을 사용합니다.

```
aws omics get-annotation-store-version --name my_annotation_store --version-name my_version              
```

버전 이름, 상태 및 기타 세부 정보가 포함된 응답을 받게 됩니다.

```
{
     "storeId": "4934045d1c6d",
     "id": "2a3f4a44aa7b",
     "status": "ACTIVE",
     "versionArn": "arn:aws:omics:us-west-2:555555555555:annotationStore/my_annotation_store/version/my_version",
     "name": "my_annotation_store",
     "versionName": "my_version",
     "creationTime": "2023-07-21T17:15:49.251040+00:00",
     "updateTime": "2023-07-21T17:15:56.434223+00:00",
     "statusMessage": "",
     "versionSizeBytes": 0
    }
```

다음 예제와 같이 **list-annotation-store-versions**를 사용하여 주석 저장소의 모든 버전을 볼 수 있습니다.

```
aws omics list-annotation-store-versions --name my_annotation_store
```

다음 정보가 포함된 응답을 받게 됩니다.

```
{
  "annotationStoreVersions": [
    {
     "storeId": "4934045d1c6d",
     "id": "2a3f4a44aa7b",
     "status": "CREATING",
     "versionArn": "arn:aws:omics:us-west-2:555555555555:annotationStore/my_annotation_store/version/my_version_2",
     "name": "my_annotation_store",
     "versionName": "my_version_2",
     "creation Time": "2023-07-21T17:20:59.380043+00:00",
     "versionSizeBytes": 0
    },
    {
     "storeId": "4934045d1c6d",
     "id": "4934045d1c6d",
     "status": "ACTIVE",
     "versionArn": "arn:aws:omics:us-west-2:555555555555:annotationStore/my_annotation_store/version/my_version_1",
     "name": "my_annotation_store",
     "versionName": "my_version_1",
     "creationTime": "2023-07-21T17:15:49.251040+00:00",
     "updateTime": "2023-07-21T17:15:56.434223+00:00",
     "statusMessage": "",
     "versionSizeBytes": 0
    }
}
```

주석 저장소 버전이 더 이상 필요하지 않은 경우 다음 예제와 같이 **delete-annotation-store-versions**를 사용하여 주석 저장소 버전을 삭제할 수 있습니다.

```
aws omics delete-annotation-store-versions --name my_annotation_store --versions my_version  
```

저장소 버전이 오류 없이 삭제되면 다음과 같은 응답을 받게 됩니다.

```
{
  "errors": []
}
```

오류가 있는 경우 다음과 같이 오류 세부 정보가 포함된 응답을 받게 됩니다.

```
{
  "errors": [
    {
      "versionName": "my_version",
      "message": "Version with versionName: my_version was not found."
    }
  ]
}
```

활성 가져오기 작업이 있는 주석 저장소 버전을 삭제하려고 하면 다음과 같이 오류가 포함된 응답을 받게 됩니다.

```
{
  "errors": [
    {
      "versionName": "my_version",
      "message": "version has an inflight import running"
    }
  ]
}
```

이 경우 다음 예제와 같이 주석 저장소 버전을 강제로 삭제할 수 있습니다.

```
aws omics delete-annotation-store-versions --name my_annotation_store --versions my_version --force 
```

# HealthOmics 분석 저장소 삭제
<a name="deleting-a-store-examples"></a>

**중요**  
AWS HealthOmics 변형 저장소 및 주석 저장소는 더 이상 신규 고객에게 공개되지 않습니다. 기존 고객은 정상적으로 서비스를 계속 이용할 수 있습니다. 자세한 내용은 [AWS HealthOmics 변형 저장소 및 주석 저장소 가용성 변경](variant-store-availability-change.md) 단원을 참조하십시오.

변형 또는 주석 저장소를 삭제하면 시스템은 해당 저장소에서 가져온 모든 데이터와 연결된 태그도 삭제합니다.

다음 예제에서는를 사용하여 변형 저장소를 삭제하는 방법을 보여줍니다 AWS CLI. 작업이 성공하면 변형 저장소 상태가 로 전환됩니다`DELETING`.

```
aws omics delete-variant-store --id <variant-store-id>
```

다음 예제에서는 주석 저장소를 삭제하는 방법을 보여줍니다. 작업이 성공하면 주석 저장소 상태가 로 전환됩니다`DELETING`. 둘 이상의 버전이 있는 경우 주석 저장소를 삭제할 수 없습니다.

```
aws omics delete-annotation-store --id <annotation-store-id>
```

# HealthOmics 분석 데이터 쿼리
<a name="analytics-query-data"></a>

**중요**  
AWS HealthOmics 변형 저장소 및 주석 저장소는 더 이상 신규 고객에게 공개되지 않습니다. 기존 고객은 정상적으로 서비스를 계속 이용할 수 있습니다. 자세한 내용은 [AWS HealthOmics 변형 저장소 및 주석 저장소 가용성 변경](variant-store-availability-change.md) 단원을 참조하십시오.

 AWS Lake Formation 및 Amazon Athena 또는 Amazon EMR을 사용하여 변형 스토어에 대한 쿼리를 수행할 수 있습니다. 쿼리를 실행하기 전에 Lake Formation 및 Amazon Athena에 대한 설정 절차(다음 섹션에 설명됨)를 완료합니다.

Amazon EMR에 대한 자세한 내용은 [ 자습서: Amazon EMR 시작하기를 참조하세요.](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-gs.html)

2024년 9월 26일 이후에 생성된 변형 저장소의 경우 HealthOmics는 샘플 ID로 저장소를 분할합니다. 이 파티셔닝은 HealthOmics가 샘플 ID를 사용하여 변형 정보의 저장을 최적화함을 의미합니다. 샘플 정보를 필터로 사용하는 쿼리는 쿼리가 데이터를 더 적게 스캔하므로 결과를 더 빨리 반환합니다.

HealthOmics는 샘플 IDs 파티션 파일 이름으로 사용합니다. 데이터를 수집하기 전에 샘플 ID에 PHI 데이터가 포함되어 있는지 확인합니다. 그럴 경우 데이터를 수집하기 전에 샘플 ID를 변경합니다. 샘플 IDs에 포함하거나 포함하지 않을 콘텐츠에 대한 자세한 내용은 AWS [ HIPAA 규정 준수](https://aws.amazon.com/compliance/hipaa-compliance) 웹 페이지의 지침을 참조하세요.

**Topics**
+ [HealthOmics를 사용하도록 Lake Formation 구성](setting-up-lf.md)
+ [쿼리에 대한 Athena 구성](analytics-setting-up-athena.md)
+ [HealthOmics 변형 저장소에서 쿼리 실행](analytics-run-queries.md)

# HealthOmics를 사용하도록 Lake Formation 구성
<a name="setting-up-lf"></a>

**중요**  
AWS HealthOmics 변형 저장소 및 주석 저장소는 더 이상 신규 고객에게 공개되지 않습니다. 기존 고객은 정상적으로 서비스를 계속 이용할 수 있습니다. 자세한 내용은 [AWS HealthOmics 변형 저장소 및 주석 저장소 가용성 변경](variant-store-availability-change.md) 단원을 참조하십시오.

Lake Formation을 사용하여 HealthOmics 데이터 스토어를 관리하기 전에 다음 Lake Formation 구성 절차를 수행합니다.

**Topics**
+ [Lake Formation 관리자 생성 또는 확인](#create-lf-admins)
+ [Lake Formation 콘솔을 사용하여 리소스 링크 생성](#create-resource-links)
+ [AWS RAM 리소스 공유에 대한 권한 구성](#configure-lf-permissions)

## Lake Formation 관리자 생성 또는 확인
<a name="create-lf-admins"></a>

Lake Formation에서 데이터 레이크를 생성하기 전에 하나 이상의 관리자를 정의합니다.

관리자는 리소스 링크를 생성할 권한이 있는 사용자 및 역할입니다. 리전별로 계정당 데이터 레이크 관리자를 설정합니다.

**Lake Formation 콘솔에서 관리자 생성**

1.  AWS Lake Formation 콘솔 열기: [Lake Formation 콘솔](https://console.aws.amazon.com//lakeformation)

1. 콘솔에 **Lake Formation 시작** 패널이 표시되면 **시작하기를** 선택합니다.

   Lake Formation에서 **데이터 레이크 관리자** 테이블에 사용자를 추가합니다.

1. 그렇지 않으면 왼쪽 메뉴에서 **관리 역할 및 작업을** 선택합니다.

1. 필요에 따라 관리자를 추가합니다.

## Lake Formation 콘솔을 사용하여 리소스 링크 생성
<a name="create-resource-links"></a>

사용자가 쿼리할 수 있는 공유 리소스를 만들려면 기본 액세스 제어를 비활성화해야 합니다. 기본 액세스 제어 비활성화에 대한 자세한 내용은 Lake Formation 설명서의 [데이터 레이크의 기본 보안 설정 변경을 참조하세요](https://docs.aws.amazon.com/lake-formation/latest/dg/change-settings.html). 리소스 링크를 개별적으로 또는 그룹으로 생성하여 Amazon Athena 또는 기타 AWS 서비스(예: Amazon EMR)의 데이터에 액세스할 수 있습니다.

**AWS Lake Formation 콘솔에서 리소스 링크 생성 및 HealthOmics Analytics 사용자와 공유**

1.  AWS Lake Formation 콘솔 열기: [Lake Formation 콘솔](https://console.aws.amazon.com//lakeformation)

1. 기본 탐색 모음에서 **데이터베이스를** 선택합니다.

1. **데이터베이스** 테이블에서 원하는 데이터베이스를 선택합니다.

1. **생성** 메뉴에서 **리소스 링크를** 선택합니다.

1. **리소스 링크 이름을** 입력합니다. Athena에서 데이터베이스에 액세스하려면 소문자(최대 256자)만 사용하여 이름을 입력합니다.

1. **생성(Create)**을 선택합니다.

1. 이제 새 리소스 링크가 **데이터베이스 아래에 나열됩니다**.

### Lake Formation 콘솔을 사용하여 공유 리소스에 대한 액세스 권한 부여
<a name="create-resource-links"></a>

Lake Formation 데이터베이스 관리자는 다음 절차를 사용하여 공유 리소스에 대한 액세스 권한을 부여할 수 있습니다.

1.  AWS Lake Formation 콘솔 열기: [https://console.aws.amazon.com/lakeformation/](https://console.aws.amazon.com//lakeformation)

1. 기본 탐색 모음에서 **데이터베이스를** 선택합니다.

1. **데이터베이스** 페이지에서 이전에 생성한 리소스 링크를 선택합니다.

1. **작업** 메뉴에서 **대상에 부여**를 선택합니다.

1. 보안 **주체** 아래의 **데이터 권한 부여** 페이지에서 **IAM 사용자 또는 역할을** 선택합니다.

1. **IAM 사용자 또는 역할** 드롭다운 메뉴에서 액세스 권한을 부여할 사용자를 찾습니다.

1. 그런 다음 **LF 태그 또는 카탈로그 리소스** 카드에서 **명명된 데이터 카탈로그 리소스** 옵션을 선택합니다.

1. **테이블-선택 사항** 드롭다운 메뉴에서 **모든 테이블** 또는 이전에 생성한 테이블을 선택합니다.

1. **테이블 권한** 카드의 **테이블 권한**에서 **설명** 및 **선택을** 선택합니다.

1. 그런 다음 **부여**를 선택합니다.

Lake Formation 권한을 보려면 기본 탐색 창에서 **데이터 레이크 권한을** 선택합니다. 이 표에는 사용 가능한 데이터베이스 및 리소스 링크가 나와 있습니다.

## AWS RAM 리소스 공유에 대한 권한 구성
<a name="configure-lf-permissions"></a>

 AWS Lake Formation 콘솔의 기본 탐색 모음에서 **데이터 레이크 권한을 선택하여 권한을** 확인합니다. **데이터 권한** 페이지에서 리소스 **유형, 데이터베이스** ****및 공유 리소스와 **ARN** 관련된 테이블을 **RAM 리소스 공유에서 볼 수 있습니다**. AWS Resource Access Manager (AWS RAM) 리소스 공유를 수락해야 하는 경우 콘솔에서에 AWS Lake Formation 알립니다.

HealthOmics는 저장소 생성 중에 AWS RAM 리소스 공유를 암시적으로 수락할 수 있습니다. AWS RAM 리소스 공유를 수락하려면 또는 `CreateAnnotationStore` API 작업을 호출하는 IAM 사용자 `CreateVariantStore` 또는 역할이 다음 작업을 허용해야 합니다.
+ `ram:GetResourceShareInvitations` -이 작업을 통해 HealthOmics는 초대를 찾을 수 있습니다.
+ `ram:AcceptResourceShareInvitation` -이 작업을 통해 HealthOmics는 FAS 토큰을 사용하여 초대를 수락할 수 있습니다.

이러한 권한이 없으면 스토어 생성 중에 권한 부여 오류가 표시됩니다.

다음은 이러한 작업을 포함하는 샘플 정책입니다. AWS RAM 리소스 공유를 수락하는 IAM 사용자 또는 역할에이 정책을 추가합니다.

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "omics:*",
        "ram:AcceptResourceShareInvitation",
        "ram:GetResourceShareInvitations"
      ],
      "Resource": "*"
    }
  ]
}
```

------

# 쿼리에 대한 Athena 구성
<a name="analytics-setting-up-athena"></a>

**중요**  
AWS HealthOmics 변형 저장소 및 주석 저장소는 더 이상 신규 고객에게 공개되지 않습니다. 기존 고객은 정상적으로 서비스를 계속 이용할 수 있습니다. 자세한 내용은 [AWS HealthOmics 변형 저장소 및 주석 저장소 가용성 변경](variant-store-availability-change.md) 단원을 참조하십시오.

Athena를 사용하여 변형 및 주석을 쿼리할 수 있습니다. 쿼리를 실행하기 전에 다음 설정 작업을 수행합니다.

**Topics**
+ [Athena 콘솔을 사용하여 쿼리 결과 위치 구성](#configure-athena-query)
+ [Athena 엔진 v3를 사용하여 작업 그룹 구성](#configure-athena-workgroup)

## Athena 콘솔을 사용하여 쿼리 결과 위치 구성
<a name="configure-athena-query"></a>

쿼리 결과 위치를 구성하려면 다음 단계를 따릅니다.

1. Athena 콘솔 열기: [Athena 콘솔](https://console.aws.amazon.com//athena)

1. 기본 탐색 모음에서 **쿼리 편집기**를 선택합니다.

1. 쿼리 편집기에서 **설정** 탭을 선택한 다음 **관리를** 선택합니다.

1. 위치의 S3 접두사를 입력하여 쿼리 결과를 저장합니다.

## Athena 엔진 v3를 사용하여 작업 그룹 구성
<a name="configure-athena-workgroup"></a>

작업 그룹을 구성하려면 다음 단계를 따릅니다.

1. Athena 콘솔 열기: [Athena 콘솔](https://console.aws.amazon.com//athena)

1. 기본 탐색 모음에서 **작업 그룹을** 선택한 다음 **작업 그룹 생성을** 선택합니다.

1. 작업 그룹의 이름을 입력합니다.

1. 엔진 유형으로 **Athena SQL**을 선택합니다.

1. **쿼리 엔진 업그레이드**에서 **수동**을 선택합니다.

1. **쿼리 버전 엔진**에서 **Athena 버전 3**을 선택합니다.

1. **작업 그룹 생성**을 선택합니다.

# HealthOmics 변형 저장소에서 쿼리 실행
<a name="analytics-run-queries"></a>

**중요**  
AWS HealthOmics 변형 저장소 및 주석 저장소는 더 이상 신규 고객에게 공개되지 않습니다. 기존 고객은 정상적으로 서비스를 계속 이용할 수 있습니다. 자세한 내용은 [AWS HealthOmics 변형 저장소 및 주석 저장소 가용성 변경](variant-store-availability-change.md) 단원을 참조하십시오.

Amazon Athena를 사용하여 변형 저장소에서 쿼리를 수행할 수 있습니다. 변형 및 주석 저장소의 게놈 좌표는 제로 기반 반닫힌 반개방 간격으로 표시됩니다.

## Athena 콘솔을 사용하여 간단한 쿼리 실행
<a name="run-queries-athena-simple"></a>

다음 예제에서는 단순 쿼리를 실행하는 방법을 보여줍니다.

1. Athena 쿼리 편집기 열기: [Athena 쿼리 편집기](https://console.aws.amazon.com//athena)

1. **작업 그룹에서** 설정 중에 생성한 작업 그룹을 선택합니다.

1. **데이터 소스**가 **AwsDataCatalog**인지 확인합니다.

1. **데이터베이스**에서 Lake Formation 설정 중에 생성한 데이터베이스 리소스 링크를 선택합니다.

1. 쿼리 1 탭 아래의 **쿼리 편집기**에 다음 쿼리를 복사합니다. **** 

   ```
   SELECT * from omicsvariants limit 10
   ```

1. 그런 다음 **Run**(실행)을 선택하여 쿼리를 실행합니다. 콘솔은 결과 테이블을 **omicsvariants** 테이블의 처음 10개 행으로 채웁니다.

## Athena 콘솔을 사용하여 복잡한 쿼리 실행
<a name="run-queries-athena-complex"></a>

다음 예제에서는 복잡한 쿼리를 실행하는 방법을 보여줍니다. 이 쿼리를 실행하려면 주석 저장소`ClinVar`로 가져옵니다.

**복잡한 쿼리 실행**

1. Athena 쿼리 편집기 열기: [Athena 쿼리 편집기](https://console.aws.amazon.com//athena)

1. **작업 그룹에서** 설정 중에 생성한 작업 그룹을 선택합니다.

1. **데이터 소스**가 **AwsDataCatalog**인지 확인합니다.

1. **데이터베이스**에서 Lake Formation 설정 중에 생성한 데이터베이스 리소스 링크를 선택합니다.

1. 오른쪽 **\$1** 상단의를 선택하여 쿼리 **2**라는 새 쿼리 탭을 생성합니다.

1. 쿼리 2 탭 아래의 **쿼리 편집기**에 다음 쿼리를 복사합니다. **** 

   ```
   SELECT variants.sampleid,
     variants.contigname,
     variants.start,
     variants."end",
     variants.referenceallele,
     variants.alternatealleles,
     variants.attributes AS variant_attributes,
     clinvar.attributes AS clinvar_attributes  
   FROM omicsvariants as variants 
   INNER JOIN omicsannotations as clinvar ON 
     variants.contigname=CONCAT('chr',clinvar.contigname) 
     AND variants.start=clinvar.start 
     AND variants."end"=clinvar."end" 
     AND variants.referenceallele=clinvar.referenceallele 
     AND variants.alternatealleles=clinvar.alternatealleles 
   WHERE clinvar.attributes['CLNSIG']='Likely_pathogenic'
   ```

1. **실행**을 선택하여 쿼리 실행을 시작합니다.

# HealthOmics 분석 스토어 공유
<a name="cross-account-sharing"></a>

**중요**  
AWS HealthOmics 변형 저장소 및 주석 저장소는 더 이상 신규 고객에게 공개되지 않습니다. 기존 고객은 정상적으로 서비스를 계속 이용할 수 있습니다. 자세한 내용은 [AWS HealthOmics 변형 저장소 및 주석 저장소 가용성 변경](variant-store-availability-change.md) 단원을 참조하십시오.

변형 저장소 또는 주석 저장소의 소유자는 저장소를 다른 AWS 계정과 공유할 수 있습니다. 소유자는 공유를 삭제하여 공유 리소스에 대한 액세스를 취소할 수 있습니다.

공유 스토어의 구독자는 먼저 공유를 수락합니다. 그런 다음 공유 저장소를 사용하는 워크플로를 정의할 수 있습니다. 데이터는 AWS Glue 및 Lake Formation 모두에서 테이블로 표시됩니다.

스토어에 더 이상 액세스할 필요가 없으면 공유를 삭제합니다.

리소스 공유에 대한 자세한 내용은 섹션을 참조[의 교차 계정 리소스 공유 AWS HealthOmics](resource-sharing.md)하세요.

## 스토어 공유 생성
<a name="sharing-create"></a>

스토어 공유를 생성하려면 **공유 생성** API 작업을 사용합니다. 보안 주체 구독자는 공유 AWS 계정 를 구독할 사용자의 입니다. 다음 예제에서는 변형 저장소에 대한 공유를 생성합니다. 한 스토어를 두 개 이상의 계정과 공유하려면 동일한 스토어의 여러 공유를 생성합니다.

```
aws omics create-share  \
        --resource-arn "arn:aws:omics:us-west-2:555555555555:variantStore/omics_dev_var_store" \
        --principal-subscriber "123456789012" \
        --name "my_Share-123"
```

생성에 성공하면 공유 ID 및 상태가 포함된 응답을 받게 됩니다.

```
{
       "shareId": "495c21bedc889d07d0ab69d710a6841e-dd75ab7a1a9c384fa848b5bd8e5a7e0a",
       "name": "my_Share-123",
       "status": "PENDING"
  }
```

구독자가 공유 수락 API 작업을 사용하여 수락할 때까지 공유는 보류 상태로 유지됩니다.