

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Criação de trabalhos de importação de lojas HealthOmics variantes
<a name="parsing-annotation-stores"></a>

**Importante**  
AWS HealthOmics lojas de variantes e lojas de anotações não estão mais abertas a novos clientes. Os clientes atuais podem continuar usando o serviço normalmente. Para obter mais informações, consulte [AWS HealthOmics alteração na disponibilidade da loja de variantes e da loja de anotações](variant-store-availability-change.md).

O exemplo a seguir mostra como usar o AWS CLI para criar um trabalho de importação para um armazenamento de variantes.

```
aws omics start-variant-import-job \
       --destination-name myvariantstore \
       --runLeftNormalization false \
       --role-arn  arn:aws:iam::55555555555:role/roleName \
       --items source=s3://my-omics-bucket/sample.vcf.gz source=s3://my-omics-bucket/sample2.vcf.gz
```

```
{
    "destinationName": "store_a",
    "roleArn": "....",
    "runLeftNormalization": false,
    "items": [
        {"source": "s3://my-omics-bucket/sample.vcf.gz"},
        {"source": "s3://my-omics-bucket/sample2.vcf.gz"}
    ]
}
```

Para lojas criadas após 15 de maio de 2023, o exemplo a seguir mostra como adicionar o `--annotation-fields` parâmetro. Os campos de anotação são definidos com a importação.

```
aws omics start-variant-import-job \
   --destination-name annotationparsingvariantstore \
   --role-arn arn:aws:iam::123456789012:role/<role_name> \
   --items source=s3://pathToS3/sample.vcf
   --annotation-fields '{"VEP": "CSQ"}'
```

```
{
    "jobId": "981e2286-e954-4391-8a97-09aefc343861"
}
```

Use **get-variant-import-job**para verificar o status. 

```
aws omics get-variant-import-job --job-id 08279950-a9e3-4cc3-9a3c-a574f9c9e229      
```

Você receberá uma resposta JSON que mostra o status do seu trabalho de importação. As anotações VEP no VCF são analisadas em busca de informações armazenadas na coluna INFO como um par. ID/Value O ID padrão da coluna INFO de anotações do [Ensembl Variant Effect Predictor](https://useast.ensembl.org/info/docs/tools/vep/index.html/#vcf) é CSQ, mas você pode usar o `--annotation-fields` parâmetro para indicar um valor personalizado usado na coluna INFO. Atualmente, a análise é suportada para anotações VEP.

Para uma loja criada antes de 15 de maio de 2023 ou para arquivos VCF que não incluem a anotação VEP, a resposta não inclui nenhum campo de anotação. 

```
{
    "creationTime": "2023-04-11T17:52:37.241958+00:00",
    "destinationName": "annotationparsingvariantstore",
    "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea",
    "items": [

    {
       "jobStatus": "COMPLETED",
       "source": "s3://amzn-s3-demo-bucket/NA12878.2k.garvan.vcf"
    }
 ],
    "roleArn": "arn:aws:iam::555555555555:role/<role_name>",

    "runLeftNormalization": false,
    "status": "COMPLETED",
    "updateTime": "2023-04-11T17:58:22.676043+00:00",
}
```

As anotações VEP que fazem parte dos arquivos VCF são armazenadas como um esquema predefinido com a estrutura a seguir. O campo extras pode ser usado para armazenar quaisquer campos VEP adicionais que não estejam incluídos no esquema padrão. 

```
annotations struct<
   vep: array<struct<
      allele:string,
      consequence: array<string>,
      impact:string,
      symbol:string,
      gene:string,
      `feature_type`: string, 
      feature: string,
      biotype: string,
      exon: struct<rank:string, total:string>,
      intron: struct<rank:string, total:string>,
      hgvsc: string,
      hgvsp: string,
      `cdna_position`: string,
      `cds_position`: string,
      `protein_position`: string,
      `amino_acids`: struct<reference:string, variant: string>,
      codons: struct<reference:string, variant: string>,
      `existing_variation`: array<string>,
      distance: string, 
      strand: string, 
      flags: array<string>,
      symbol_source: string,
      hgnc_id: string,
      `extras`: map<string, string> 
    >>
>
```

A análise é executada com a abordagem de melhor esforço. Se a entrada do VEP não seguir as [especificações padrão do VEP](https://useast.ensembl.org/info/docs/tools/vep/vep_formats.html#vcf), ela não será analisada e a linha na matriz ficará vazia.

Para um novo armazenamento de variantes, a resposta para **get-variant-import-job**incluiria os campos de anotação, conforme mostrado. 

```
aws omics get-variant-import-job --job-id 08279950-a9e3-4cc3-9a3c-a574f9c9e229      
```

Você recebe uma resposta JSON que mostra o status do seu trabalho de importação.

```
{
    "creationTime": "2023-04-11T17:52:37.241958+00:00",
    "destinationName": "annotationparsingvariantstore",
    "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea",
    "items": [

    {
    "jobStatus": "COMPLETED",
    "source": "s3://amzn-s3-demo-bucket/NA12878.2k.garvan.vcf"
    }
 ],
    "roleArn": "arn:aws:iam::123456789012:role/<role_name>",
    "runLeftNormalization": false,
    "status": "COMPLETED",
    "updateTime": "2023-04-11T17:58:22.676043+00:00",
    "annotationFields" : {"VEP": "CSQ"}
  }
}
```

Você pode usar **list-variant-import-jobs**para ver todos os trabalhos de importação e seus status.

```
aws omics list-variant-import-jobs --ids 7a1c67e3-b7f9-434d-817b-9c571fd63bea          
```

A resposta contém as informações a seguir.

```
{
    "variantImportJobs": [
    {
        "creationTime": "2023-04-11T17:52:37.241958+00:00",
        "destinationName": "annotationparsingvariantstore",
        "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea",
        "roleArn": "arn:aws:iam::55555555555:role/roleName",
        "runLeftNormalization": false,
        "status": "COMPLETED",
        "updateTime": "2023-04-11T17:58:22.676043+00:00",
        "annotationFields" : {"VEP": "CSQ"}
        }
    ]
  }
}
```

Se necessário, você pode cancelar um trabalho de importação com o comando a seguir.

```
aws omics cancel-variant-import-job 
     --job-id edd7b8ce-xmpl-47e2-bc99-258cac95a508
```