

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# HealthOmics penyimpanan
<a name="sequence-stores"></a>

Gunakan HealthOmics penyimpanan untuk menyimpan, mengambil, mengatur, dan berbagi data genomik secara efisien dan dengan biaya rendah. HealthOmics penyimpanan memahami hubungan antara objek data yang berbeda, sehingga Anda dapat menentukan set baca mana yang berasal dari data sumber yang sama. Ini memberi Anda asal data. 

Data yang disimpan dalam `ACTIVE` status dapat diambil segera. Data yang belum diakses selama 30 hari atau lebih disimpan dalam `ARCHIVE` status. Untuk mengakses data yang diarsipkan, Anda dapat mengaktifkannya kembali melalui operasi API atau konsol. 

HealthOmics toko urutan dirancang untuk menjaga integritas konten file. Namun, kesetaraan bitwise dari file data yang diimpor dan file yang diekspor tidak dipertahankan karena kompresi selama tiering aktif dan arsip.

Selama konsumsi, buat HealthOmics tag entitas, atau *HealthOmics ETag*, untuk memungkinkan memvalidasi integritas konten file data Anda. Bagian sekuensing diidentifikasi dan ditangkap sebagai ETag pada tingkat sumber dari set baca. ETag Perhitungan tidak mengubah file aktual atau data genom. Setelah set baca dibuat, ETag seharusnya tidak berubah sepanjang siklus hidup sumber set baca. Ini berarti bahwa mengimpor ulang file yang sama menghasilkan ETag nilai yang sama yang dihitung. 

**Topics**
+ [HealthOmics ETags dan asal-usul data](etags-and-provenance.md)
+ [Membuat toko HealthOmics referensi](create-reference-store.md)
+ [Membuat toko HealthOmics urutan](create-sequence-store.md)
+ [Menghapus HealthOmics referensi dan toko urutan](deleting-reference-and-sequence-stores.md)
+ [Mengimpor set baca ke toko HealthOmics urutan](import-sequence-store.md)
+ [Unggah langsung ke toko HealthOmics urutan](synchronous-uploads.md)
+ [Mengekspor set HealthOmics baca ke bucket Amazon S3](read-set-exports.md)
+ [Mengakses set HealthOmics baca dengan Amazon S3 URIs](s3-access.md)
+ [Mengaktifkan set baca di HealthOmics](activating-read-sets.md)

# HealthOmics ETags dan asal-usul data
<a name="etags-and-provenance"></a>

A HealthOmics ETag (tag entitas) adalah hash dari konten yang dicerna di toko urutan. Ini menyederhanakan pengambilan dan pemrosesan data sambil mempertahankan integritas konten dari file data yang dicerna. Ini ETag mencerminkan perubahan pada konten semantik objek, bukan metadata-nya. Jenis dan algoritma set baca yang ditentukan menentukan bagaimana ETag dihitung. ETag Perhitungan tidak mengubah file aktual atau data genom. Ketika skema jenis file dari set baca mengizinkannya, urutan menyimpan memperbarui bidang yang ditautkan ke sumber data. 

File memiliki identitas bitwise dan identitas semantik. Identitas bitwise berarti bahwa bit dari sebuah file identik, dan identitas semantik berarti bahwa isi dari sebuah file identik. Identitas semantik tahan terhadap perubahan metadata dan perubahan kompresi karena menangkap integritas konten file. 

Set baca di penyimpanan HealthOmics urutan menjalani compression/decompression siklus dan pelacakan asal data di seluruh siklus hidup objek. Selama pemrosesan ini, identitas bitwise dari file yang tertelan dapat berubah dan diharapkan berubah setiap kali file diaktifkan; namun, identitas semantik file dipertahankan. Identitas semantik ditangkap sebagai tag HealthOmics entitas, atau ETag yang dihitung selama penyerapan penyimpanan urutan dan tersedia sebagai metadata set baca.

Ketika skema tipe file dari set baca mengizinkannya, lapisan pembaruan penyimpanan urutan ditautkan ke sumber data. Untuk file UBam, BAM, dan CRAM, `Comment` tag baru `@CO` atau ditambahkan ke header. Komentar berisi ID penyimpanan urutan dan stempel waktu konsumsi. 

## Amazon S3 ETags
<a name="s3-etags"></a>

Saat mengakses file menggunakan URI Amazon S3, operasi API Amazon S3 juga dapat mengembalikan nilai Amazon S3 dan checksum. ETag Nilai Amazon S3 ETag dan checksum berbeda dari nilai HealthOmics ETags karena mereka mewakili identitas bitwise file. [Untuk mempelajari metadata deskriptif dan Objek selengkapnya, lihat dokumentasi Amazon S3 Object API.](https://docs.aws.amazon.com/AmazonS3/latest/API/API_Object.html) ETag Nilai Amazon S3 dapat berubah dengan setiap siklus aktivasi set baca dan Anda dapat menggunakannya untuk memvalidasi pembacaan file. Namun, jangan cache ETag nilai Amazon S3 yang akan digunakan untuk validasi identitas file selama siklus hidup file karena tidak tetap konsisten. Sebaliknya, HealthOmics ETag tetap konsisten sepanjang siklus hidup set baca. 

## Bagaimana HealthOmics menghitung ETags
<a name="how-etags-calculated"></a>

 ETag Itu dihasilkan dari hash dari konten file yang dicerna. Keluarga ETag algoritme diatur ke secara MD5up default, tetapi dapat dikonfigurasi secara berbeda selama pembuatan penyimpanan urutan. Ketika ETag dihitung, algoritma dan hash yang dihitung ditambahkan ke set baca. MD5 Algoritma yang didukung untuk jenis file adalah sebagai berikut.
+ *FASTQ\$1 MD5up* - Menghitung MD5 hash dari sumber set baca FASTQ lengkap yang tidak terkompresi.
+ *BAM\$1 MD5up* — Menghitung MD5 hash dari bagian penyelarasan dari sumber kumpulan baca BAM atau UBAM yang tidak terkompresi seperti yang direpresentasikan dalam SAM, berdasarkan referensi tertaut, jika tersedia.
+ *CRAM\$1 MD5up* — Menghitung MD5 hash dari bagian penyelarasan dari sumber set baca CRAM yang tidak terkompresi seperti yang direpresentasikan dalam SAM, berdasarkan referensi tertaut.

**catatan**  
MD5 hashing dikenal rentan terhadap tabrakan. Karena itu, dua file yang berbeda mungkin memiliki yang sama ETag jika mereka diproduksi untuk mengeksploitasi tabrakan yang diketahui.

Algoritma berikut didukung untuk SHA256 keluarga. Algoritma dihitung sebagai berikut:
+ *FASTQ\$1 SHA256up* - Menghitung hash SHA-256 dari sumber set baca FASTQ lengkap yang tidak terkompresi. 
+ *BAM\$1 SHA256up* — Menghitung hash SHA-256 dari bagian penyelarasan dari sumber kumpulan baca BAM atau UBAM yang tidak terkompresi seperti yang direpresentasikan dalam SAM, berdasarkan referensi tertaut, jika tersedia. 
+ *CRAM\$1 SHA256up* — Menghitung hash SHA-256 dari bagian penyelarasan dari sumber set baca CRAM yang tidak terkompresi seperti yang direpresentasikan dalam SAM, berdasarkan referensi tertaut. 

Algoritma berikut didukung untuk SHA512 keluarga. Algoritma dihitung sebagai berikut:
+ *FASTQ\$1 SHA512up* - Menghitung hash SHA-512 dari sumber set baca FASTQ lengkap yang tidak terkompresi. 
+ *BAM\$1 SHA512up* — Menghitung hash SHA-512 dari bagian penyelarasan dari sumber kumpulan baca BAM atau UBAM yang tidak terkompresi seperti yang direpresentasikan dalam SAM, berdasarkan referensi tertaut, jika tersedia. 

   
+ *CRAM\$1 SHA512up * — Menghitung hash SHA-512 dari bagian penyelarasan dari sumber set baca CRAM yang tidak terkompresi seperti yang direpresentasikan dalam SAM, berdasarkan referensi tertaut. 

# Membuat toko HealthOmics referensi
<a name="create-reference-store"></a>

Penyimpanan referensi di HealthOmics adalah penyimpanan data untuk penyimpanan genom referensi. Anda dapat memiliki satu toko referensi di masing-masing Akun AWS dan Wilayah. Anda dapat membuat toko referensi menggunakan konsol atau CLI.

**Topics**
+ [Membuat toko referensi menggunakan konsol](#console-create-reference-store)
+ [Membuat toko referensi menggunakan CLI](#api-create-reference-store)

## Membuat toko referensi menggunakan konsol
<a name="console-create-reference-store"></a>

**Untuk membuat toko referensi**

1. Buka [konsol HealthOmics ](https://console.aws.amazon.com/omics/).

1.  Jika diperlukan, buka panel navigasi kiri (≡). Pilih **Toko referensi**.

1. Pilih **Genom referensi dari opsi** penyimpanan data Genomics.

1. Anda dapat memilih genom referensi yang diimpor sebelumnya atau mengimpor yang baru. Jika Anda belum mengimpor genom referensi, pilih **Impor genom referensi** di kanan atas.

1. Pada halaman **pekerjaan Buat referensi genom impor**, pilih opsi **Buat cepat** atau **Buat manual** untuk membuat toko referensi, lalu berikan informasi berikut.
   + Nama **genom referensi - Nama** unik untuk toko ini. 
   + **Deskripsi** (opsional) - Deskripsi toko referensi ini.
   + **Peran IAM** - Pilih peran dengan akses ke genom referensi Anda. 
   + **Referensi dari Amazon S3** - Pilih file urutan referensi Anda di bucket Amazon S3.
   + **Tag** (opsional) - Berikan hingga 50 tag untuk toko referensi ini.

## Membuat toko referensi menggunakan CLI
<a name="api-create-reference-store"></a>

Contoh berikut menunjukkan cara membuat toko referensi dengan menggunakan AWS CLI. Anda dapat memiliki satu toko referensi per AWS Wilayah. 

Toko referensi mendukung penyimpanan file FASTA dengan ekstensi`.fasta`,,`.fa`,`.fas`,`.fsa`,`.faa`,`.fna`,`.ffn`,`.frn`, `.mpfa``.seq`,`.txt`. `bgzip`Versi ekstensi ini juga didukung. 

Dalam contoh berikut, ganti `reference store name` dengan nama yang Anda pilih untuk toko referensi Anda.

```
aws omics create-reference-store --name "reference store name"  
```

Anda menerima respons JSON dengan ID dan nama toko referensi, ARN, dan stempel waktu kapan toko referensi Anda dibuat.

```
{
    "id": "3242349265",
    "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265",
    "name": "MyReferenceStore",
    "creationTime": "2022-07-01T20:58:42.878Z"
}
```

Anda dapat menggunakan ID toko referensi dalam AWS CLI perintah tambahan. Anda dapat mengambil daftar toko referensi yang IDs ditautkan ke akun Anda dengan menggunakan **list-reference-stores**perintah, seperti yang ditunjukkan pada contoh berikut.

```
aws omics list-reference-stores 
```

Sebagai tanggapan, Anda menerima nama toko referensi yang baru Anda buat.

```
{
    "referenceStores": [
        {
              "id": "3242349265",
              "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/3242349265",
              "name": "MyReferenceStore",
             "creationTime": "2022-07-01T20:58:42.878Z"
         }
     ]
}
```

Setelah Anda membuat toko referensi, Anda dapat membuat pekerjaan impor untuk memuat file referensi genom ke dalamnya. Untuk melakukannya, Anda harus menggunakan atau membuat peran IAM untuk mengakses data. Berikut ini adalah contoh kebijakan . 

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "s3:GetObject",
                "s3:GetBucketLocation"
                
            ],
            "Resource": [
                "arn:aws:s3:::amzn-s3-demo-bucket1",
                "arn:aws:s3:::amzn-s3-demo-bucket1/*"
            ]
        }
    ]
}
```

------

Anda juga harus memiliki kebijakan kepercayaan yang mirip dengan contoh berikut.

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Effect": "Allow",
            "Principal": {
                "Service": [
                   "omics.amazonaws.com"
                ]
            },
            "Action": "sts:AssumeRole"
        }
    ]
}
```

------

Anda sekarang dapat mengimpor genom referensi. Contoh ini menggunakan Genome Reference Consortium Human Build 38 (hg38), yang merupakan akses terbuka dan tersedia dari [Registry](https://registry.opendata.aws/) of Open Data on. AWS Bucket yang menampung data ini berbasis di US East (Ohio). Untuk menggunakan bucket di AWS Wilayah lain, Anda dapat menyalin data ke bucket Amazon S3 yang dihosting di Wilayah Anda. Gunakan AWS CLI perintah berikut untuk menyalin genom ke bucket Amazon S3 Anda. 

```
aws s3 cp s3://broad-references/hg38/v0/Homo_sapiens_assembly38.fasta s3://amzn-s3-demo-bucket 
```

Anda kemudian dapat memulai pekerjaan impor Anda. Ganti`reference store ID`,`role ARN`, dan `source file path` dengan masukan Anda sendiri.

```
aws omics start-reference-import-job --reference-store-id reference store ID --role-arn role ARN --sources source file path
```

Setelah data diimpor, Anda menerima respons berikut di JSON.

```
{
        "id": "7252016478",
        "referenceStoreId": "3242349265",
        "roleArn": "arn:aws:iam::111122223333:role/OmicsReferenceImport",
        "status": "CREATED",
        "creationTime": "2022-07-01T21:15:13.727Z"
}
```

Anda dapat memantau status pekerjaan dengan menggunakan perintah berikut. Dalam contoh berikut, ganti `reference store ID` dan `job ID` dengan ID toko referensi Anda dan ID pekerjaan yang ingin Anda pelajari lebih lanjut.

```
aws omics get-reference-import-job --reference-store-id reference store ID --id job ID  
```

Sebagai tanggapan, Anda menerima tanggapan dengan detail untuk toko referensi itu dan statusnya.

```
{
    "id": "7252016478",
    "referenceStoreId": "3242349265",
    "roleArn": "arn:aws:iam::555555555555:role/OmicsReferenceImport",
    "status": "RUNNING",
    "creationTime": "2022-07-01T21:15:13.727Z",
    "sources": [
        {
            "sourceFile": "s3://amzn-s3-demo-bucket/Homo_sapiens_assembly38.fasta",
            "status": "IN_PROGRESS",
            "name": "MyReference"
        }
    ]
}
```

Anda juga dapat menemukan referensi yang diimpor dengan mencantumkan referensi Anda dan memfilternya berdasarkan nama referensi. Ganti `reference store ID` dengan ID toko referensi Anda, dan tambahkan filter opsional untuk mempersempit daftar.

```
aws omics list-references --reference-store-id reference store ID --filter name=MyReference  
```

Sebagai tanggapan, Anda menerima informasi berikut.

```
{
    "references": [
        {
            "id": "1234567890",
            "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/1234567890/reference/1234567890",
            "referenceStoreId": "12345678",
            "md5": "7ff134953dcca8c8997453bbb80b6b5e",
            "status": "ACTIVE",
            "name": "MyReference",
            "creationTime": "2022-07-02T00:15:19.787Z",
            "updateTime": "2022-07-02T00:15:19.787Z"
        }
    ]
}
```

Untuk mempelajari lebih lanjut tentang metadata referensi, gunakan operasi **get-reference-metadata**API. Dalam contoh berikut, ganti `reference store ID` dengan ID toko referensi Anda dan `reference ID` dengan ID referensi yang ingin Anda pelajari lebih lanjut.

```
aws omics get-reference-metadata --reference-store-id reference store ID --id reference ID   
```

Anda menerima informasi berikut sebagai tanggapan.

```
{
    "id": "1234567890",
    "arn": "arn:aws:omics:us-west-2:555555555555:referenceStore/referencestoreID/reference/referenceID",
    "referenceStoreId": "1234567890",
    "md5": "7ff134953dcca8c8997453bbb80b6b5e",
    "status": "ACTIVE",
    "name": "MyReference",
    "creationTime": "2022-07-02T00:15:19.787Z",
    "updateTime": "2022-07-02T00:15:19.787Z",
    "files": {
        "source": {
            "totalParts": 31,
            "partSize": 104857600,
            "contentLength": 3249912778
        },
        "index": {
            "totalParts": 1,
            "partSize": 104857600,
            "contentLength": 160928
        }
    }
}
```

Anda juga dapat mengunduh bagian dari file referensi dengan menggunakan **get-reference**. Dalam contoh berikut, ganti `reference store ID` dengan ID toko referensi Anda dan `reference ID` dengan ID referensi yang ingin Anda unduh.

```
aws omics get-reference --reference-store-id reference store ID --id reference ID --part-number 1 outfile.fa   
```

# Membuat toko HealthOmics urutan
<a name="create-sequence-store"></a>



HealthOmics penyimpanan urutan mendukung penyimpanan file genom dalam format tidak selaras `FASTQ` (hanya gzip) dan. `uBAM` Ini juga mendukung format selaras `BAM` dan`CRAM`. 

File yang diimpor disimpan sebagai set baca. Anda dapat menambahkan tag ke set baca dan menggunakan kebijakan IAM untuk mengontrol akses ke set baca. Set baca yang selaras memerlukan genom referensi untuk menyelaraskan urutan genom, tetapi ini opsional untuk set baca yang tidak selaras.

Untuk menyimpan set baca, pertama-tama Anda membuat toko urutan. Saat membuat penyimpanan urutan, Anda dapat menentukan bucket Amazon S3 opsional sebagai lokasi fallback dan lokasi penyimpanan log akses S3. Lokasi fallback digunakan untuk menyimpan file apa pun yang gagal membuat set baca selama unggahan langsung. Lokasi fallback tersedia untuk toko urutan yang dibuat setelah 15 Mei 2023. Anda menentukan lokasi fallback saat Anda membuat toko urutan. 

Anda dapat menentukan hingga lima tombol tag set baca. Saat Anda membuat atau memperbarui set baca dengan kunci tag yang cocok dengan salah satu kunci ini, tag set baca disebarkan ke objek Amazon S3 yang sesuai. Tag sistem yang dibuat oleh HealthOmics disebarkan secara default. 

**Topics**
+ [Membuat toko urutan menggunakan konsol](#console-create-sequence-store)
+ [Membuat toko urutan menggunakan CLI](#api-create-sequence-store)
+ [Memperbarui toko urutan](#update-sequence-store)
+ [Memperbarui tag set baca untuk penyimpanan urutan](#sequence-store-manage-tags)
+ [Mengimpor file genom](#import-genomic-files)

## Membuat toko urutan menggunakan konsol
<a name="console-create-sequence-store"></a>

**Untuk membuat toko urutan**

1. Buka [konsol HealthOmics ](https://console.aws.amazon.com/omics/).

1.  Jika diperlukan, buka panel navigasi kiri (≡). Pilih **toko Sequence**.

1. Pada halaman **Create sequence store**, berikan informasi berikut
   + **Nama toko urutan** - Nama unik untuk toko ini. 
   + **Deskripsi** (opsional) - Deskripsi toko urutan ini.

1. Untuk **lokasi Fallback di S3**, tentukan lokasi Amazon S3. HealthOmics menggunakan lokasi fallback untuk menyimpan file apa pun yang gagal membuat set baca selama unggahan langsung. Anda harus memberikan akses tulis HealthOmics layanan ke lokasi fallback Amazon S3. Untuk contoh kebijakan, lihat [Konfigurasikan lokasi fallback](synchronous-uploads.md#synchronous-uploads-fallback).

   Lokasi fallback tidak tersedia untuk toko urutan yang dibuat sebelum 16 Mei 2023. 

1. (Opsional) Untuk **tombol tag set Baca untuk propagasi S3**, Anda dapat memasukkan hingga lima tombol set baca untuk disebarkan dari set baca ke Objek S3 yang mendasarinya. Dengan menyebarkan tag dari set baca ke objek S3, Anda dapat memberikan izin akses S3 berdasarkan pengguna and/or akhir tag untuk melihat tag yang disebarkan melalui operasi Amazon S3 API. getObjectTagging 

   1. Masukkan satu nilai kunci di kotak teks. Konsol membuat kotak teks baru untuk menambahkan kunci berikutnya.

   1. (Opsional) Pilih **Hapus** untuk menghapus semua tombol.

1. Di bawah **Enkripsi Data**, pilih apakah Anda ingin enkripsi data dimiliki dan dikelola oleh AWS atau menggunakan CMK yang dikelola pelanggan. 

1. (Opsional) Di bawah **Akses data S3**, pilih apakah akan membuat peran dan kebijakan baru untuk mengakses penyimpanan urutan melalui Amazon S3.

1. (Opsional) Untuk **pencatatan akses S3**, pilih `Enabled` apakah Anda ingin Amazon S3 mengumpulkan catatan log akses.

   Untuk **lokasi logging Access di S3**, tentukan lokasi Amazon S3 untuk menyimpan log. Bidang ini hanya terlihat jika Anda mengaktifkan pencatatan akses S3.

1. **Tag** (opsional) - Berikan hingga 50 tag untuk toko urutan ini. Tag ini terpisah dari tag set baca yang disetel selama import/tag pembaruan set baca

Setelah Anda membuat toko, itu siap untuk[Mengimpor file genom](#import-genomic-files).

## Membuat toko urutan menggunakan CLI
<a name="api-create-sequence-store"></a>

Dalam contoh berikut, ganti `sequence store name` dengan nama yang Anda pilih untuk toko urutan Anda.

```
aws omics create-sequence-store --name sequence store name --fallback-location "s3://amzn-s3-demo-bucket"  
```

Anda menerima respons berikut di JSON, yang menyertakan nomor ID untuk penyimpanan urutan yang baru dibuat.

```
{
    "id": "3936421177",
    "arn": "arn:aws:omics:us-west-2:111122223333:sequenceStore/3936421177",
    "name": "sequence_store_example_name",
    "creationTime": "2022-07-13T20:09:26.038Z"
    "fallbackLocation" : "s3://amzn-s3-demo-bucket"
}
```

Anda juga dapat melihat semua toko urutan yang terkait dengan akun Anda dengan menggunakan **list-sequence-stores**perintah, seperti yang ditunjukkan pada berikut ini.

```
aws omics list-sequence-stores
```

Anda menerima tanggapan berikut.

```
{
    "sequenceStores": [
        {
            "arn": "arn:aws:omics:us-west-2:111122223333:sequenceStore/3936421177",
            "id": "3936421177",
            "name": "MySequenceStore",
            "creationTime": "2022-07-13T20:09:26.038Z",
            "updatedTime": "2024-09-13T04:11:31.242Z",
            "fallbackLocation" : "s3://amzn-s3-demo-bucket",
            "status": "Active"
        }
    ]
}
```

Anda dapat menggunakan **get-sequence-store**untuk mempelajari lebih lanjut tentang penyimpanan urutan dengan menggunakan ID-nya, seperti yang ditunjukkan pada contoh berikut:

```
aws omics get-sequence-store --id sequence store ID                             
```

Anda menerima tanggapan berikut:

```
{
  "arn": "arn:aws:omics:us-west-2:123456789012:sequenceStore/sequencestoreID",
  "creationTime": "2024-01-12T04:45:29.857Z",
  "updatedTime": "2024-09-13T04:11:31.242Z",
  "description": null,
  "fallbackLocation": null,
  "id": "2015356892",
  "name": "MySequenceStore",
  "s3Access": {
      "s3AccessPointArn": "arn:aws:s3:us-west-2:123456789012:accesspoint/592761533288-2015356892",
      "s3Uri": "s3://592761533288-2015356892-ajdpi90jdas90a79fh9a8ja98jdfa9jf98-s3alias/592761533288/sequenceStore/2015356892/",
      "accessLogLocation": "s3://IAD-seq-store-log/2015356892/"
  },
  "sseConfig": {
      "keyArn": "arn:aws:kms:us-west-2:123456789012:key/eb2b30f5-635d-4b6d-b0f9-d3889fe0e648",
      "type": "KMS"
  },
  "status": "Active",
  "statusMessage": null,
  "setTagsToSync": ["withdrawn","protocol"],
}
```

Setelah pembuatan, beberapa parameter toko juga dapat diperbarui. Ini dapat dilakukan melalui Console atau `updateSequenceStore` operasi API.

## Memperbarui toko urutan
<a name="update-sequence-store"></a>

Untuk memperbarui toko urutan, ikuti langkah-langkah ini:

1. Buka [konsol HealthOmics ](https://console.aws.amazon.com/omics/).

1.  Jika diperlukan, buka panel navigasi kiri (≡). Pilih **toko Sequence**.

1. Pilih toko urutan untuk diperbarui.

1. Di panel **Detail**, pilih **Edit**.

1. Pada halaman **Edit detail**, Anda dapat memperbarui bidang berikut:
   + **Nama toko urutan** - Nama unik untuk toko ini. 
   + **Deskripsi** - Deskripsi toko urutan ini.
   + **Lokasi mundur di S3**, tentukan lokasi Amazon S3. HealthOmics menggunakan lokasi fallback untuk menyimpan file apa pun yang gagal membuat set baca selama unggahan langsung. 
   + **Baca tombol tag set untuk propagasi S3** Anda dapat memasukkan hingga lima tombol set baca untuk disebarkan ke Amazon S3.
   + (Opsional) Untuk **pencatatan akses S3**, pilih `Enabled` apakah Anda ingin Amazon S3 mengumpulkan catatan log akses.

     Untuk **lokasi logging Access di S3**, tentukan lokasi Amazon S3 untuk menyimpan log. Bidang ini hanya terlihat jika Anda mengaktifkan pencatatan akses S3.
   + **Tag** (opsional) - Berikan hingga 50 tag untuk toko urutan ini.

## Memperbarui tag set baca untuk penyimpanan urutan
<a name="sequence-store-manage-tags"></a>

Untuk memperbarui tag set baca atau bidang lain untuk penyimpanan urutan, ikuti langkah-langkah berikut:

1. Buka [konsol HealthOmics ](https://console.aws.amazon.com/omics/).

1.  Jika diperlukan, buka panel navigasi kiri (≡). Pilih **toko Sequence**.

1. Pilih toko urutan yang ingin Anda perbarui.

1. Pilih tab **Detail**.

1. Pilih **Edit**.

1. Tambahkan tag set baca baru atau hapus tag yang ada, sesuai kebutuhan.

1. Perbarui nama, deskripsi, lokasi fallback, atau akses data S3, sesuai kebutuhan.

1. Pilih **Simpan perubahan**.

## Mengimpor file genom
<a name="import-genomic-files"></a>

Untuk mengimpor file genom ke penyimpanan urutan, ikuti langkah-langkah ini:

**Untuk mengimpor file genomik**

1. Buka [konsol HealthOmics ](https://console.aws.amazon.com/omics/).

1.  Jika diperlukan, buka panel navigasi kiri (≡). Pilih pilih **toko Urutan**.

1. Pada halaman **Sequence store**, pilih toko urutan yang ingin Anda impor file Anda.

1. Pada halaman penyimpanan urutan individual, pilih **Impor file genom**.

1. Pada halaman **Tentukan detail impor**, berikan informasi berikut
   + Peran **IAM - Peran** IAM yang dapat mengakses file genom di Amazon S3.
   + **Genom referensi** - Genom referensi untuk data genomik ini.

1. Pada halaman **Tentukan manifes impor**, tentukan informasi berikut **File manifes**. File manifes adalah file JSON atau YAMG yang menjelaskan informasi penting dari data genomik Anda. Untuk informasi tentang file manifes, lihat[Mengimpor set baca ke toko HealthOmics urutan](import-sequence-store.md).

1. Klik **Buat pekerjaan impor**.

# Menghapus HealthOmics referensi dan toko urutan
<a name="deleting-reference-and-sequence-stores"></a>

Penyimpanan referensi dan urutan dapat dihapus. Toko urutan hanya dapat dihapus jika tidak berisi set baca, dan toko referensi hanya dapat dihapus jika tidak berisi referensi. Menghapus urutan atau toko referensi juga menghapus tag apa pun yang terkait dengan toko itu.

Contoh berikut menunjukkan cara menghapus toko referensi dengan menggunakan AWS CLI. Jika tindakan berhasil, Anda tidak akan menerima tanggapan. Dalam contoh berikut, ganti `reference store ID` dengan ID toko referensi Anda.

```
aws omics delete-reference-store --id reference store ID              
```

Contoh berikut menunjukkan cara menghapus toko urutan. Anda tidak menerima tanggapan jika tindakan berhasil. Dalam contoh berikut, ganti `sequence store ID` dengan ID toko urutan Anda.

```
aws omics delete-sequence-store --id sequence store ID            
```

Anda juga dapat menghapus referensi di toko referensi seperti yang ditunjukkan pada contoh berikut. Referensi hanya dapat dihapus jika tidak digunakan dalam set baca, toko varian, atau penyimpanan anotasi. Dalam contoh berikut, ganti `reference store ID` dengan ID toko referensi Anda, dan ganti `reference ID` dengan ID untuk referensi yang ingin Anda hapus.

```
aws omics delete-reference  --id reference ID --reference-store-id reference store ID          
```

# Mengimpor set baca ke toko HealthOmics urutan
<a name="import-sequence-store"></a>

Setelah Anda membuat toko urutan, buat pekerjaan impor untuk mengunggah set baca ke penyimpanan data. Anda dapat mengunggah file dari bucket Amazon S3, atau Anda dapat mengunggah langsung menggunakan operasi API sinkron. Bucket Amazon S3 Anda harus berada di Wilayah yang sama dengan toko urutan Anda.

Anda dapat mengunggah kombinasi set baca yang selaras dan tidak selaras ke dalam penyimpanan urutan Anda, namun, jika ada set baca dalam impor Anda yang selaras, Anda harus menyertakan genom referensi.

Anda dapat menggunakan kembali kebijakan akses IAM yang Anda gunakan untuk membuat toko Referensi. 

Topik berikut menjelaskan langkah-langkah utama yang Anda ikuti untuk mengimpor set baca ke dalam penyimpanan urutan Anda dan kemudian mendapatkan informasi tentang data yang diimpor. 

**Topics**
+ [Unggah file ke Amazon S3](#upload-files-to-s3)
+ [Membuat file manifes](#create-manifest-file)
+ [Memulai pekerjaan impor](#start-import-job)
+ [Pantau pekerjaan impor](#monitor-import-job)
+ [Temukan file urutan yang diimpor](#list-read-sets)
+ [Dapatkan detail tentang set baca](#get-read-set-metadata)
+ [Unduh file data set baca](#get-read-set-data)

## Unggah file ke Amazon S3
<a name="upload-files-to-s3"></a>

Contoh berikut menunjukkan cara memindahkan file ke bucket Amazon S3 Anda. 

```
aws s3 cp s3://1000genomes/phase1/data/HG00100/alignment/HG00100.chrom20.ILLUMINA.bwa.GBR.low_coverage.20101123.bam s3://your-bucket
aws s3 cp s3://1000genomes/phase3/data/HG00146/sequence_read/SRR233106_1.filt.fastq.gz s3://your-bucket
aws s3 cp s3://1000genomes/phase3/data/HG00146/sequence_read/SRR233106_2.filt.fastq.gz s3://your-bucket
aws s3 cp s3://1000genomes/data/HG00096/alignment/HG00096.alt_bwamem_GRCh38DH.20150718.GBR.low_coverage.cram s3://your-bucket 
aws s3 cp s3://gatk-test-data/wgs_ubam/NA12878_20k/NA12878_A.bam s3://your-bucket
```

Sampel `BAM` dan `CRAM` digunakan dalam contoh ini memerlukan referensi genom yang berbeda, `Hg19` dan`Hg38`. Untuk mempelajari lebih lanjut atau mengakses referensi ini, lihat [Referensi Genom Luas](https://registry.opendata.aws/broad-references/) di Registri Data Terbuka di AWS.

## Membuat file manifes
<a name="create-manifest-file"></a>

Anda juga harus membuat file manifes di JSON untuk memodelkan pekerjaan impor `import.json` (lihat contoh berikut). Jika Anda membuat penyimpanan urutan di konsol, Anda tidak perlu menentukan `sequenceStoreId` atau`roleARN`, jadi file manifes Anda dimulai dengan `sources` input.

------
#### [ API manifest ]

Contoh berikut mengimpor tiga set baca dengan menggunakan API: satu`FASTQ`, satu`BAM`, dan satu`CRAM`.

```
{
  "sequenceStoreId": "3936421177",
  "roleArn": "arn:aws:iam::555555555555:role/OmicsImport",
  "sources":
  [
      {
          "sourceFiles":
          {
              "source1": "s3://amzn-s3-demo-bucket/HG00100.chrom20.ILLUMINA.bwa.GBR.low_coverage.20101123.bam"
          },
          "sourceFileType": "BAM",
          "subjectId": "mySubject",
          "sampleId": "mySample",
          "referenceArn": "arn:aws:omics:us-west-2:555555555555:referenceStore/0123456789/reference/0000000001",
          "name": "HG00100",
          "description": "BAM for HG00100",
          "generatedFrom": "1000 Genomes"
      },
      {
          "sourceFiles":
          {
              "source1": "s3://amzn-s3-demo-bucket/SRR233106_1.filt.fastq.gz",
              "source2": "s3://amzn-s3-demo-bucket/SRR233106_2.filt.fastq.gz"
          },
          "sourceFileType": "FASTQ",
          "subjectId": "mySubject",
          "sampleId": "mySample",
          // NOTE: there is no reference arn required here
          "name": "HG00146",
          "description": "FASTQ for HG00146",
          "generatedFrom": "1000 Genomes"
      },
      {
          "sourceFiles":
          {
              "source1": "s3://amzn-s3-demo-bucket/HG00096.alt_bwamem_GRCh38DH.20150718.GBR.low_coverage.cram"
          },
          "sourceFileType": "CRAM",
          "subjectId": "mySubject",
          "sampleId": "mySample",
          "referenceArn": "arn:aws:omics:us-west-2:555555555555:referenceStore/0123456789/reference/0000000001",
          "name": "HG00096",
          "description": "CRAM for HG00096",
          "generatedFrom": "1000 Genomes"
      },
      {
          "sourceFiles":
          {
              "source1": "s3://amzn-s3-demo-bucket/NA12878_A.bam"
          },
          "sourceFileType": "UBAM",
          "subjectId": "mySubject",
          "sampleId": "mySample",
          // NOTE: there is no reference arn required here
          "name": "NA12878_A",
          "description": "uBAM for NA12878",
          "generatedFrom": "GATK Test Data"
      }
  ]
}
```

------
#### [ Console manifest ]

Kode contoh ini digunakan untuk mengimpor satu set baca dengan menggunakan konsol.

```
[    
  {
      "sourceFiles":
      {
          "source1": "s3://amzn-s3-demo-bucket/HG00100.chrom20.ILLUMINA.bwa.GBR.low_coverage.20101123.bam"
      },
      "sourceFileType": "BAM",
      "subjectId": "mySubject",
      "sampleId": "mySample",
      "name": "HG00100",
      "description": "BAM for HG00100",
      "generatedFrom": "1000 Genomes"
  },
  {
      "sourceFiles":
      {
          "source1": "s3://amzn-s3-demo-bucket/SRR233106_1.filt.fastq.gz",
          "source2": "s3://amzn-s3-demo-bucket/SRR233106_2.filt.fastq.gz"
      },
      "sourceFileType": "FASTQ",
      "subjectId": "mySubject",
      "sampleId": "mySample",
      "name": "HG00146",
      "description": "FASTQ for HG00146",
      "generatedFrom": "1000 Genomes"
  },
  {
      "sourceFiles":
      {
          "source1": "s3://your-bucket/HG00096.alt_bwamem_GRCh38DH.20150718.GBR.low_coverage.cram"
      },
      "sourceFileType": "CRAM",
      "subjectId": "mySubject",
      "sampleId": "mySample",
      "name": "HG00096",
      "description": "CRAM for HG00096",
      "generatedFrom": "1000 Genomes"
  },
  {
      "sourceFiles":
      {
          "source1": "s3://amzn-s3-demo-bucket/NA12878_A.bam"
      },
      "sourceFileType": "UBAM",
      "subjectId": "mySubject",
      "sampleId": "mySample",
      "name": "NA12878_A",
      "description": "uBAM for NA12878",
      "generatedFrom": "GATK Test Data"
  }
]
```

------

Atau, Anda dapat mengunggah file manifes dalam format YAMAL.

## Memulai pekerjaan impor
<a name="start-import-job"></a>

Untuk memulai pekerjaan impor, gunakan AWS CLI perintah berikut.

```
aws omics start-read-set-import-job --cli-input-json file://import.json      
```

Anda menerima tanggapan berikut, yang menunjukkan penciptaan lapangan kerja yang sukses.

```
{
  "id": "3660451514",
  "sequenceStoreId": "3936421177",
  "roleArn": "arn:aws:iam::111122223333:role/OmicsImport",
  "status": "CREATED",
  "creationTime": "2022-07-13T22:14:59.309Z"
}
```

## Pantau pekerjaan impor
<a name="monitor-import-job"></a>

Setelah pekerjaan impor dimulai, Anda dapat memantau kemajuannya dengan perintah berikut. Dalam contoh berikut, ganti `sequence store id` dengan ID penyimpanan urutan Anda, dan ganti `job import ID` dengan ID impor.

```
aws omics get-read-set-import-job --sequence-store-id sequence store id --id job import ID 
```

Berikut ini menunjukkan status untuk semua pekerjaan impor yang terkait dengan ID penyimpanan urutan yang ditentukan.

```
{
  "id": "1234567890",
  "sequenceStoreId": "1234567890",
  "roleArn": "arn:aws:iam::111122223333:role/OmicsImport",
  "status": "RUNNING",
  "statusMessage": "The job is currently in progress.",
  "creationTime": "2022-07-13T22:14:59.309Z",
  "sources": [    
      {
          "sourceFiles":
          {
              "source1": "s3://amzn-s3-demo-bucket/HG00100.chrom20.ILLUMINA.bwa.GBR.low_coverage.20101123.bam"
          },
          "sourceFileType": "BAM",
          "status": "IN_PROGRESS",
          "statusMessage": "The job is currently in progress."
          "subjectId": "mySubject",
          "sampleId": "mySample",
          "referenceArn": "arn:aws:omics:us-west-2:111122223333:referenceStore/3242349265/reference/8625408453",
          "name": "HG00100",
          "description": "BAM for HG00100",
          "generatedFrom": "1000 Genomes",
          "readSetID": "1234567890"
      },
      {
          "sourceFiles":
          {
              "source1": "s3://amzn-s3-demo-bucket/SRR233106_1.filt.fastq.gz",
              "source2": "s3://amzn-s3-demo-bucket/SRR233106_2.filt.fastq.gz"
          },
          "sourceFileType": "FASTQ",
          "status": "IN_PROGRESS",
          "statusMessage": "The job is currently in progress."
          "subjectId": "mySubject",
          "sampleId": "mySample",
          "name": "HG00146",
          "description": "FASTQ for HG00146",
          "generatedFrom": "1000 Genomes",
          "readSetID": "1234567890"
      },
      {
          "sourceFiles":
          {
              "source1": "s3://amzn-s3-demo-bucket/HG00096.alt_bwamem_GRCh38DH.20150718.GBR.low_coverage.cram"
          },
          "sourceFileType": "CRAM",
          "status": "IN_PROGRESS",
          "statusMessage": "The job is currently in progress."
          "subjectId": "mySubject",
          "sampleId": "mySample",
          "referenceArn": "arn:aws:omics:us-west-2:111122223333:referenceStore/3242349265/reference/1234568870",
          "name": "HG00096",
          "description": "CRAM for HG00096",
          "generatedFrom": "1000 Genomes",
          "readSetID": "1234567890"
      },
      {
          "sourceFiles":
          {
              "source1": "s3://amzn-s3-demo-bucket/NA12878_A.bam"
          },
          "sourceFileType": "UBAM",
          "status": "IN_PROGRESS",
          "statusMessage": "The job is currently in progress."
          "subjectId": "mySubject",
          "sampleId": "mySample",
          "name": "NA12878_A",
          "description": "uBAM for NA12878",
          "generatedFrom": "GATK Test Data",
          "readSetID": "1234567890"
      }
  ]
}
```

## Temukan file urutan yang diimpor
<a name="list-read-sets"></a>

Setelah pekerjaan selesai, Anda dapat menggunakan operasi **list-read-sets**API untuk menemukan file urutan yang diimpor. Dalam contoh berikut, ganti `sequence store id` dengan ID toko urutan Anda.

```
aws omics list-read-sets --sequence-store-id sequence store id
```

Anda menerima tanggapan berikut.

```
{
  "readSets": [
      {
          "id": "0000000001",
          "arn": "arn:aws:omics:us-west-2:111122223333:sequenceStore/01234567890/readSet/0000000001",
          "sequenceStoreId": "1234567890",
          "subjectId": "mySubject",
          "sampleId": "mySample",
          "status": "ACTIVE",
          "name": "HG00100",
          "description": "BAM for HG00100",
          "referenceArn": "arn:aws:omics:us-west-2:111122223333:referenceStore/01234567890/reference/0000000001",
          "fileType": "BAM",
          "sequenceInformation": {
              "totalReadCount": 9194,
              "totalBaseCount": 928594,
              "generatedFrom": "1000 Genomes",
              "alignment": "ALIGNED"
          },
          "creationTime": "2022-07-13T23:25:20Z"
          "creationType": "IMPORT", 
          "etag": {
              "algorithm": "BAM_MD5up",
              "source1": "d1d65429212d61d115bb19f510d4bd02"
          }
      },
      {
          "id": "0000000002",
          "arn": "arn:aws:omics:us-west-2:111122223333:sequenceStore/0123456789/readSet/0000000002",
          "sequenceStoreId": "0123456789",
          "subjectId": "mySubject",
          "sampleId": "mySample",
          "status": "ACTIVE",
          "name": "HG00146",
          "description": "FASTQ for HG00146",
          "fileType": "FASTQ",
          "sequenceInformation": {
              "totalReadCount": 8000000,
              "totalBaseCount": 1184000000,
              "generatedFrom": "1000 Genomes",
              "alignment": "UNALIGNED"
          },
          "creationTime": "2022-07-13T23:26:43Z"
          "creationType": "IMPORT",
          "etag": {
              "algorithm": "FASTQ_MD5up",
              "source1": "ca78f685c26e7cc2bf3e28e3ec4d49cd"
          }
      },
      {
          "id": "0000000003",
          "arn": "arn:aws:omics:us-west-2:111122223333:sequenceStore/0123456789/readSet/0000000003",
          "sequenceStoreId": "0123456789",
          "subjectId": "mySubject",
          "sampleId": "mySample",
          "status": "ACTIVE",
          "name": "HG00096",
          "description": "CRAM for HG00096",
          "referenceArn": "arn:aws:omics:us-west-2:111122223333:referenceStore/0123456789/reference/0000000001",
          "fileType": "CRAM",
          "sequenceInformation": {
              "totalReadCount": 85466534,
              "totalBaseCount": 24000004881,
              "generatedFrom": "1000 Genomes",
              "alignment": "ALIGNED"
          },
          "creationTime": "2022-07-13T23:30:41Z"
          "creationType": "IMPORT",
          "etag": {
              "algorithm": "CRAM_MD5up",
              "source1": "66817940f3025a760e6da4652f3e927e"
          }
      },
      {
          "id": "0000000004",
          "arn": "arn:aws:omics:us-west-2:111122223333:sequenceStore/0123456789/readSet/0000000004",
          "sequenceStoreId": "0123456789",
          "subjectId": "mySubject",
          "sampleId": "mySample",
          "status": "ACTIVE",
          "name": "NA12878_A",
          "description": "uBAM for NA12878",
          "fileType": "UBAM",
          "sequenceInformation": {
              "totalReadCount": 20000,
              "totalBaseCount": 5000000,
              "generatedFrom": "GATK Test Data",
              "alignment": "ALIGNED"
          },
          "creationTime": "2022-07-13T23:30:41Z"
          "creationType": "IMPORT",
          "etag": {
              "algorithm": "BAM_MD5up",
              "source1": "640eb686263e9f63bcda12c35b84f5c7"
          }
      }
  ]
}
```

## Dapatkan detail tentang set baca
<a name="get-read-set-metadata"></a>

Untuk melihat detail selengkapnya tentang set baca, gunakan operasi **GetReadSetMetadata**API. Dalam contoh berikut, ganti `sequence store id` dengan ID penyimpanan urutan Anda, dan ganti `read set id` dengan ID set baca Anda.

```
aws omics get-read-set-metadata --sequence-store-id sequence store id --id read set id     
```

Anda menerima tanggapan berikut.

```
{
"arn": "arn:aws:omics:us-west-2:123456789012:sequenceStore/2015356892/readSet/9515444019",
"creationTime": "2024-01-12T04:50:33.548Z",
"creationType": "IMPORT",
"creationJobId": "33222111",
"description": null,
"etag": {
  "algorithm": "FASTQ_MD5up",
  "source1": "00d0885ba3eeb211c8c84520d3fa26ec",
  "source2": "00d0885ba3eeb211c8c84520d3fa26ec"
},
"fileType": "FASTQ",
"files": {
  "index": null,
  "source1": {
    "contentLength": 10818,
    "partSize": 104857600,
    "s3Access": {
      "s3Uri": "s3://accountID-sequence store ID-ajdpi90jdas90a79fh9a8ja98jdfa9jf98-s3alias/592761533288/sequenceStore/2015356892/readSet/9515444019/import_source1.fastq.gz"
},
    "totalParts": 1
  },
  "source2": {
    "contentLength": 10818,
    "partSize": 104857600,
    "s3Access": {        
      "s3Uri": "s3://accountID-sequence store ID-ajdpi90jdas90a79fh9a8ja98jdfa9jf98-s3alias/592761533288/sequenceStore/2015356892/readSet/9515444019/import_source1.fastq.gz"
    },
    "totalParts": 1
  }
},
"id": "9515444019",
"name": "paired-fastq-import",
"sampleId": "sampleId-paired-fastq-import",
"sequenceInformation": {
  "alignment": "UNALIGNED",
  "generatedFrom": null,
  "totalBaseCount": 30000,
  "totalReadCount": 200
},
"sequenceStoreId": "2015356892",
"status": "ACTIVE",
"statusMessage": null,
"subjectId": "subjectId-paired-fastq-import"
}
```

## Unduh file data set baca
<a name="get-read-set-data"></a>

Anda dapat mengakses objek untuk set baca aktif menggunakan operasi Amazon S3 **GetObject** API. URI untuk objek dikembalikan dalam respons **GetReadSetMetadata**API. Untuk informasi selengkapnya, lihat [Mengakses set HealthOmics baca dengan Amazon S3 URIs](s3-access.md).

Atau, gunakan operasi HealthOmics **GetReadSet** API. Anda dapat menggunakan **GetReadSet** untuk mengunduh secara paralel dengan mengunduh bagian-bagian individual. Bagian-bagian ini mirip dengan bagian Amazon S3. Berikut ini adalah contoh cara mengunduh bagian 1 dari set baca. Dalam contoh berikut, ganti `sequence store id` dengan ID penyimpanan urutan Anda, dan ganti `read set id` dengan ID set baca Anda.

```
aws omics get-read-set --sequence-store-id sequence store id --id read set id  --part-number 1 outfile.bam  
```

Anda juga dapat menggunakan HealthOmics Transfer Manager untuk mengunduh file untuk HealthOmics referensi atau set baca. Anda dapat mengunduh HealthOmics Transfer Manager [di sini](https://pypi.org/project/amazon-omics-tools/). Untuk informasi selengkapnya tentang menggunakan dan menyiapkan Manajer Transfer, lihat [GitHubRepositori](https://github.com/awslabs/amazon-omics-tools/) ini.

# Unggah langsung ke toko HealthOmics urutan
<a name="synchronous-uploads"></a>

Kami menyarankan Anda menggunakan Manajer HealthOmics Transfer untuk menambahkan file ke toko urutan Anda. Untuk informasi selengkapnya tentang menggunakan Manajer Transfer, lihat [GitHubRepositori](https://github.com/awslabs/amazon-omics-tools/) ini. Anda juga dapat mengunggah set baca langsung ke toko urutan melalui operasi API unggahan langsung. 

Set baca unggahan langsung ada terlebih dahulu dalam `PROCESSING_UPLOAD` status. Ini berarti bahwa bagian file saat ini sedang diunggah, dan Anda dapat mengakses metadata set baca. Setelah bagian diunggah dan checksum divalidasi, set baca menjadi `ACTIVE` dan berperilaku sama seperti set baca yang diimpor. 

Jika unggahan langsung gagal, status set baca ditampilkan sebagai`UPLOAD_FAILED`. Anda dapat mengonfigurasi bucket Amazon S3 sebagai lokasi fallback untuk file yang gagal diunggah. Lokasi fallback tersedia untuk toko urutan yang dibuat setelah 15 Mei 2023.

**Topics**
+ [Unggah langsung ke toko urutan menggunakan AWS CLI](#synchronous-uploads-api)
+ [Konfigurasikan lokasi fallback](#synchronous-uploads-fallback)

## Unggah langsung ke toko urutan menggunakan AWS CLI
<a name="synchronous-uploads-api"></a>

Untuk memulai, mulai upload multipart. Anda dapat melakukan ini dengan menggunakan AWS CLI, seperti yang ditunjukkan pada contoh berikut.

**Untuk mengunggah langsung menggunakan AWS CLI perintah**

1. Buat bagian dengan memisahkan data Anda, seperti yang ditunjukkan pada contoh berikut.

   ```
    split -b 100MiB SRR233106_1.filt.fastq.gz source1_part_ 
   ```

1. Setelah file sumber Anda berada di beberapa bagian, buat unggahan set baca multibagian, seperti yang ditunjukkan pada contoh berikut. Ganti `sequence store ID` dan parameter lainnya dengan ID penyimpanan urutan Anda dan nilai lainnya.

   ```
   aws omics create-multipart-read-set-upload \
   --sequence-store-id sequence store ID \
   --name upload name \
   --source-file-type FASTQ \
   --subject-id subject ID \
   --sample-id sample ID \
   --description "FASTQ for HG00146" "description of upload" \
   --generated-from "1000 Genomes""source of imported files"
   ```

   Anda mendapatkan metadata `uploadID` dan lainnya dalam respons. Gunakan `uploadID` untuk langkah selanjutnya dari proses pengunggahan.

   ```
   {
   "sequenceStoreId": "1504776472",
   "uploadId": "7640892890",
   "sourceFileType": "FASTQ",
   "subjectId": "mySubject",
   "sampleId": "mySample",
   "generatedFrom": "1000 Genomes",
   "name": "HG00146",
   "description": "FASTQ for HG00146",
   "creationTime": "2023-11-20T23:40:47.437522+00:00"
   }
   ```

1. Tambahkan set baca Anda ke unggahan. Jika file Anda cukup kecil, Anda hanya perlu melakukan langkah ini sekali. Untuk file yang lebih besar, Anda melakukan langkah ini untuk setiap bagian file Anda. Jika Anda mengunggah bagian baru dengan menggunakan nomor bagian yang sebelumnya digunakan, bagian tersebut akan menimpa bagian yang diunggah sebelumnya.

   Dalam contoh berikut, ganti`sequence store ID`,`upload ID`, dan parameter lainnya dengan nilai-nilai Anda.

   ```
   aws omics upload-read-set-part \
   --sequence-store-id sequence store ID \
   --upload-id upload ID \
   --part-source SOURCE1 \
   --part-number part number \
   --payload  source1/source1_part_aa.fastq.gz
   ```

   Responsnya adalah ID yang dapat Anda gunakan untuk memverifikasi bahwa file yang diunggah cocok dengan file yang Anda inginkan.

   ```
   {
   "checksum": "984979b9928ae8d8622286c4a9cd8e99d964a22d59ed0f5722e1733eb280e635"
   }
   ```

1. Lanjutkan mengunggah bagian-bagian file Anda, jika perlu. Untuk memverifikasi bahwa set baca Anda telah diunggah, gunakan operasi API **list-read-set-upload-parts**, seperti yang ditunjukkan pada berikut ini. Dalam contoh berikut, ganti`sequence store ID `,`upload ID`, dan `part source` dengan masukan Anda sendiri.

   ```
   aws omics list-read-set-upload-parts \
    --sequence-store-id sequence store ID \
    --upload-id upload ID \
    --part-source SOURCE1
   ```

   Respons mengembalikan jumlah set baca, ukuran, dan stempel waktu saat terbaru diperbarui.

   ```
   {
   "parts": [
       {
           "partNumber": 1,
           "partSize": 104857600,
           "partSource": "SOURCE1",
           "checksum": "MVMQk+vB9C3Ge8ADHkbKq752n3BCUzyl41qEkqlOD5M=",
           "creationTime": "2023-11-20T23:58:03.500823+00:00",
           "lastUpdatedTime": "2023-11-20T23:58:03.500831+00:00"
       },
       {
           "partNumber": 2,
           "partSize": 104857600,
           "partSource": "SOURCE1",
           "checksum": "keZzVzJNChAqgOdZMvOmjBwrOPM0enPj1UAfs0nvRto=",
           "creationTime": "2023-11-21T00:02:03.813013+00:00",
           "lastUpdatedTime": "2023-11-21T00:02:03.813025+00:00"
       },
       {
           "partNumber": 3,
           "partSize": 100339539,
           "partSource": "SOURCE1",
           "checksum": "TBkNfMsaeDpXzEf3ldlbi0ipFDPaohKHyZ+LF1J4CHk=",
           "creationTime": "2023-11-21T00:09:11.705198+00:00",
           "lastUpdatedTime": "2023-11-21T00:09:11.705208+00:00"
       }
   ]
   }
   ```

1. Untuk melihat semua unggahan set baca multibagian aktif, gunakan **list-multipart-read-set-upload,** seperti yang ditunjukkan pada berikut ini. Ganti `sequence store ID` dengan ID untuk toko urutan Anda sendiri.

   ```
   aws omics list-multipart-read-set-uploads --sequence-store-id 
                sequence store ID
   ```

   API ini hanya mengembalikan unggahan set baca multibagian yang sedang berlangsung. Setelah set baca yang dicerna`ACTIVE`, atau jika unggahan gagal, unggahan tidak akan dikembalikan sebagai respons terhadap **list-multipart-read-set-uploads** API. Untuk melihat set baca aktif, gunakan **list-read-sets**API. Contoh respon untuk **list-multipart-read-set-upload** ditampilkan di berikut ini. 

   ```
   {
   "uploads": [
       {
           "sequenceStoreId": "1234567890",
           "uploadId": "8749584421",
           "sourceFileType": "FASTQ",
           "subjectId": "mySubject",
           "sampleId": "mySample",
           "generatedFrom": "1000 Genomes",
           "name": "HG00146",
           "description": "FASTQ for HG00146",
           "creationTime": "2023-11-29T19:22:51.349298+00:00"
       },
       {
           "sequenceStoreId": "1234567890",
           "uploadId": "5290538638",
           "sourceFileType": "BAM",
           "subjectId": "mySubject",
           "sampleId": "mySample",
           "generatedFrom": "1000 Genomes",
           "referenceArn": "arn:aws:omics:us-west-2:123456789012:referenceStore/8168613728/reference/2190697383",
           "name": "HG00146",
           "description": "BAM for HG00146",
           "creationTime": "2023-11-29T19:23:33.116516+00:00"
       },
       {
           "sequenceStoreId": "1234567890",
           "uploadId": "4174220862",
           "sourceFileType": "BAM",
           "subjectId": "mySubject",
           "sampleId": "mySample",
           "generatedFrom": "1000 Genomes",
           "referenceArn": "arn:aws:omics:us-west-2:123456789012:referenceStore/8168613728/reference/2190697383",
           "name": "HG00147",
           "description": "BAM for HG00147",
           "creationTime": "2023-11-29T19:23:47.007866+00:00"
       }
   ]
   }
   ```

1. Setelah Anda mengunggah semua bagian file Anda, gunakan **complete-multipart-read-set-upload** untuk mengakhiri proses upload, seperti yang ditunjukkan pada contoh berikut. Ganti `sequence store ID``upload ID`,, dan parameter untuk bagian dengan nilai Anda sendiri.

   ```
   aws omics complete-multipart-read-set-upload \
   --sequence-store-id sequence store ID \
   --upload-id upload ID \
   --parts '[{"checksum":"gaCBQMe+rpCFZxLpoP6gydBoXaKKDA/Vobh5zBDb4W4=","partNumber":1,"partSource":"SOURCE1"}]'
   ```

   Respons untuk **complete-multipart-read-set-upload** adalah set baca IDs untuk set baca yang Anda impor. 

   ```
   {
   "readSetId": "0000000001"
   }
   ```

1. Untuk menghentikan unggahan, gunakan **abort-multipart-read-set-upload** dengan ID upload untuk mengakhiri proses upload. Ganti `sequence store ID` dan `upload ID` dengan nilai parameter Anda sendiri.

   ```
   aws omics abort-multipart-read-set-upload \
   --sequence-store-id sequence store ID \
   --upload-id upload ID
   ```

1. Setelah unggahan selesai, ambil data Anda dari set baca dengan menggunakan **get-read-set**, seperti yang ditunjukkan pada berikut ini. Jika unggahan masih diproses, **get-read-set**mengembalikan metadata terbatas, dan file indeks yang dihasilkan tidak tersedia. Ganti `sequence store ID` dan parameter lainnya dengan input Anda sendiri.

   ```
   aws omics get-read-set 
    --sequence-store-id sequence store ID \
    --id read set ID \
    --file SOURCE1 \
    --part-number 1 myfile.fastq.gz
   ```

1. Untuk memeriksa metadata, termasuk status unggahan Anda, gunakan operasi **get-read-set-metadata**API.

   ```
   aws omics get-read-set-metadata --sequence-store-id sequence store ID --id read set ID    
   ```

   Responsnya mencakup detail metadata seperti jenis file, ARN referensi, jumlah file, dan panjang urutan. Ini juga termasuk status. Status yang mungkin adalah`PROCESSING_UPLOAD`,`ACTIVE`, dan`UPLOAD_FAILED`.

   ```
   {
   "id": "0000000001",
   "arn": "arn:aws:omics:us-west-2:555555555555:sequenceStore/0123456789/readSet/0000000001",
   "sequenceStoreId": "0123456789",
   "subjectId": "mySubject",
   "sampleId": "mySample",
   "status": "PROCESSING_UPLOAD",
   "name": "HG00146",
   "description": "FASTQ for HG00146",
   "fileType": "FASTQ",
   "creationTime": "2022-07-13T23:25:20Z",
   "files": {
       "source1": {
           "totalParts": 5,
           "partSize": 123456789012,
           "contentLength": 6836725,
   
       },
       "source2": {
           "totalParts": 5,
           "partSize": 123456789056,
           "contentLength": 6836726
       }
   },
   'creationType": "UPLOAD"
   }
   ```

## Konfigurasikan lokasi fallback
<a name="synchronous-uploads-fallback"></a>

Saat membuat atau memperbarui penyimpanan urutan, Anda dapat mengonfigurasi bucket Amazon S3 sebagai lokasi fallback untuk file yang gagal diunggah. Bagian file untuk set baca tersebut ditransfer ke lokasi fallback. Lokasi fallback tersedia untuk toko urutan yang dibuat setelah 15 Mei 2023. 

Buat kebijakan bucket Amazon S3 untuk memberikan akses HealthOmics tulis ke lokasi fallback Amazon S3, seperti yang ditunjukkan pada contoh berikut:

```
{
    "Effect": "Allow",
    "Principal": {
        "Service": "omics.amazonaws.com"
    },
    "Action": "s3:PutObject",
    "Resource": "arn:aws:s3:::amzn-s3-demo-bucket/*"
}
```

Jika bucket Amazon S3 untuk fallback atau log akses menggunakan kunci terkelola pelanggan, tambahkan izin berikut ke kebijakan kunci:

```
 {
    "Sid": "Allow use of key",
    "Effect": "Allow",
    "Principal": {
        "Service": "omics.amazonaws.com"
    },
    "Action": [
        "kms:Decrypt",
        "kms:GenerateDataKey*"
    ],
    "Resource": "*"
}
```

# Mengekspor set HealthOmics baca ke bucket Amazon S3
<a name="read-set-exports"></a>

Anda dapat mengekspor set baca sebagai pekerjaan ekspor batch ke bucket Amazon S3. Untuk melakukannya, pertama-tama buat kebijakan IAM yang memiliki akses tulis ke bucket, mirip dengan contoh kebijakan IAM berikut. 

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "s3:PutObject",
        "s3:GetBucketLocation"
      ],
      "Resource": [
        "arn:aws:s3:::amzn-s3-demo-bucket1",
        "arn:aws:s3:::amzn-s3-demo-bucket1/*"
      ]
    }
  ]
}
```

------

------
#### [ JSON ]

****  

```
{
"Version":"2012-10-17",		 	 	 
"Statement": [
  {
      "Effect": "Allow",
      "Principal": {
          "Service": [
              "omics.amazonaws.com"
          ]
      },
      "Action": "sts:AssumeRole"
  }
]
}
```

------

Setelah kebijakan IAM diberlakukan, mulailah pekerjaan ekspor set baca Anda. Contoh berikut menunjukkan cara melakukannya dengan menggunakan operasi **start-read-set-export-job** API. Dalam contoh berikut, ganti semua parameter, seperti`sequence store ID`,,`destination`, dan `role ARN``sources`, dengan masukan Anda.

```
aws omics start-read-set-export-job 
--sequence-store-id sequence store id \
--destination valid s3 uri \
--role-arn role ARN \
--sources readSetId=read set id_1 readSetId=read set id_2
```

Anda menerima respons berikut dengan informasi tentang toko urutan asal dan bucket Amazon S3 tujuan. 

```
{
"id": <job-id>,
"sequenceStoreId": <sequence-store-id>,
"destination": <destination-s3-uri>,
"status": "SUBMITTED",
"creationTime": "2022-10-22T01:33:38.079000+00:00"
}
```

Setelah pekerjaan dimulai, Anda dapat menentukan statusnya dengan menggunakan operasi **get-read-set-export-job** API, seperti yang ditunjukkan pada berikut ini. Ganti `sequence store ID` dan `job ID` dengan ID toko urutan dan ID pekerjaan Anda, masing-masing. 

```
aws omics get-read-set-export-job --id job-id --sequence-store-id sequence store ID
```

Anda dapat melihat semua pekerjaan ekspor yang diinisialisasi untuk penyimpanan urutan dengan menggunakan operasi API ** list-read-set-export-jobs**, seperti yang ditunjukkan di bawah ini. Ganti `sequence store ID` dengan ID toko urutan Anda.

```
aws omics list-read-set-export-jobs --sequence-store-id sequence store ID.
```

```
{
"exportJobs": [
  {
      "id": <job-id>,
      "sequenceStoreId": <sequence-store-id>,
      "destination": <destination-s3-uri>,
      "status": "COMPLETED",
      "creationTime": "2022-10-22T01:33:38.079000+00:00",
      "completionTime": "2022-10-22T01:34:28.941000+00:00"
  }
]
}
```

Selain mengekspor set baca Anda, Anda juga dapat membagikannya dengan menggunakan akses Amazon URIs S3. Untuk mempelajari informasi lebih lanjut, lihat [Mengakses set HealthOmics baca dengan Amazon S3 URIs](s3-access.md). 

# Mengakses set HealthOmics baca dengan Amazon S3 URIs
<a name="s3-access"></a>

Anda dapat menggunakan jalur URI Amazon S3 untuk mengakses set baca penyimpanan urutan aktif Anda. 

Dengan jalur URI Amazon S3, Anda dapat menggunakan operasi Amazon S3 untuk membuat daftar, berbagi, dan mengunduh set baca Anda. Akses melalui S3 APIs mempercepat kolaborasi dan integrasi alat mengingat banyak alat industri sudah dibangun untuk dibaca dari S3. Selain itu, Anda dapat berbagi akses ke S3 APIs dengan akun lain dan memberikan akses baca lintas wilayah ke data. 

HealthOmics tidak mendukung akses URI Amazon S3 ke set baca yang diarsipkan. Ketika Anda mengaktifkan set baca, itu dikembalikan ke jalur URI yang sama setiap kali. 

Dengan data yang dimuat ke HealthOmics toko, karena URI Amazon S3 didasarkan pada titik akses Amazon S3, Anda dapat langsung berintegrasi dengan alat standar industri yang membaca Amazon S3, seperti berikut URIs ini:
+ Aplikasi analisis visual seperti Integrative Genomics Viewer (IGV) atau UCSC Genome Browser.
+ Alur kerja umum dengan ekstensi Amazon S3 seperti CWL, WDL, dan Nextflow.
+ Alat apa pun yang dapat mengautentikasi dan membaca dari titik akses Amazon URIs S3 atau membaca Amazon S3 yang telah ditetapkan sebelumnya. URIs
+ Utilitas Amazon S3 seperti Mountpoint atau. CloudFront

Amazon S3 Mountpoint memungkinkan Anda menggunakan bucket Amazon S3 sebagai sistem file lokal. Untuk mempelajari lebih lanjut tentang Mountpoint dan menginstalnya untuk digunakan, lihat [Mountpoint untuk Amazon](https://github.com/awslabs/mountpoint-s3) S3.

Amazon CloudFront adalah layanan jaringan pengiriman konten (CDN) yang dibuat untuk kinerja tinggi, keamanan, dan kenyamanan pengembang. Untuk mempelajari lebih lanjut tentang menggunakan Amazon CloudFront, lihat [ CloudFront dokumentasi Amazon](https://docs.aws.amazon.com/cloudfront/). Untuk mengatur CloudFront dengan toko urutan, hubungi AWS HealthOmics tim. 

Akun root pemilik data diaktifkan untuk tindakan S3:GetObject, S3:GetObjectTagging, dan S3:List Bucket pada awalan penyimpanan urutan. Agar pengguna di akun dapat mengakses data, Anda membuat kebijakan IAM dan melampirkannya ke pengguna atau peran. Untuk contoh kebijakan, lihat [Izin untuk akses data menggunakan Amazon S3 URIs](s3-sharing.md).

Anda dapat menggunakan operasi Amazon S3 API berikut pada set baca aktif untuk mencantumkan dan mengambil data Anda. Anda dapat mengakses set baca yang diarsipkan melalui Amazon URIs S3 setelah diaktifkan.
+ [GetObject](https://docs.aws.amazon.com/AmazonS3/latest/API/API_GetObject.html)— Mengambil objek dari Amazon S3.
+ [HeadObject](https://docs.aws.amazon.com/AmazonS3/latest/API/API_HeadObject.html.html)— Operasi HEAD mengambil metadata dari objek tanpa mengembalikan objek itu sendiri. Operasi ini berguna jika Anda hanya menginginkan metadata objek.
+ [ListObjects dan ListObject v2](https://docs.aws.amazon.com/AmazonS3/latest/API/API_ListObjects.html) - Mengembalikan beberapa atau semua (hingga 1.000) objek dalam ember.
+ [CopyObject](https://docs.aws.amazon.com/AmazonS3/latest/API/API_CopyObject.html)— Membuat salinan objek yang sudah disimpan di Amazon S3. HealthOmicsmendukung penyalinan ke jalur akses Amazon S3, tetapi tidak menulis ke titik akses.

HealthOmics toko urutan mempertahankan identitas semantik file melalui. ETags Sepanjang siklus hidup file, Amazon ETag S3, yang didasarkan pada identitas bitwise, dapat berubah, HealthOmics ETag namun tetap sama. Untuk mempelajari selengkapnya, lihat [HealthOmics ETags dan asal-usul data](etags-and-provenance.md).

**Topics**
+ [Struktur URI Amazon S3 dalam penyimpanan HealthOmics](#s3-uri-structure)
+ [Menggunakan IGV yang Dihosting atau Lokal untuk mengakses set baca](#s3-access-igv)
+ [Menggunakan Samtools atau HTSlib di HealthOmics](#s3-access-Samtools)
+ [Menggunakan Mountpoint HealthOmics](#s3-access-Mountpoint)
+ [Menggunakan CloudFront dengan HealthOmics](#s3-access-CloudFront)

## Struktur URI Amazon S3 dalam penyimpanan HealthOmics
<a name="s3-uri-structure"></a>

Semua file dengan Amazon S3 URIs memiliki `omics:subjectId` dan tag `omics:sampleId` sumber daya. Anda dapat menggunakan tag ini untuk berbagi akses dengan menggunakan kebijakan IAM melalui pola seperti`"s3:ExistingObjectTag/omics:subjectId": "pattern desired"`.

 Struktur file adalah sebagai berikut: 

`.../account_id/sequenceStore/seq_store_id/readSet/read_set_id/files.`

Untuk file yang diimpor ke toko urutan dari Amazon S3, toko urutan mencoba mempertahankan nama sumber asli. Ketika nama bertentangan, sistem menambahkan informasi set baca untuk memastikan bahwa nama file unik. Misalnya, untuk set baca fastq, jika kedua nama file sama, untuk membuat nama unik, dimasukkan sebelum .fastq.gz `sourceX` atau.fq.gz. Untuk upload langsung, nama file mengikuti pola berikut:
+ Untuk FASTQ— *read\$1set\$1name* \$1 .fastq.gz *sourcex* 
+ Untuk uBAM/BAM/CRAM —*read\$1set\$1name*. *file extension*dengan ekstensi `.bam` atau`.cram`. Contohnya adalah `NA193948.bam`.

Untuk set baca yang BAM atau CRAM, file indeks secara otomatis dihasilkan selama proses konsumsi. Untuk file indeks yang dihasilkan, ekstensi indeks yang tepat di akhir nama file diterapkan. Ini memiliki pola *<name of the Source the index is on>.<file index extension>.* Ekstensi indeks adalah `.bai` atau`.crai`.

## Menggunakan IGV yang Dihosting atau Lokal untuk mengakses set baca
<a name="s3-access-igv"></a>

IGV adalah browser genom yang digunakan untuk menganalisis file BAM dan CRAM. Ini membutuhkan file dan indeks karena hanya menampilkan sebagian genom pada satu waktu. IGV dapat diunduh dan digunakan secara lokal, dan ada panduan untuk membuat IGV yang dihosting AWS. Versi web publik tidak didukung karena membutuhkan CORS. 

IGV lokal bergantung pada AWS konfigurasi lokal untuk mengakses file. Pastikan peran yang digunakan dalam konfigurasi tersebut memiliki kebijakan yang dilampirkan yang memungkinkan GetObject izin kms: Dekripsi dan s3: ke URI s3 dari kumpulan baca yang diakses. Setelah itu, di IGV, Anda dapat menggunakan “File> load from URL” dan paste di URI untuk sumber dan indeks. Atau, presigned URLs dapat dibuat dan digunakan dengan cara yang sama, yang akan melewati konfigurasi AWS. Perhatikan bahwa CORS tidak didukung dengan akses Amazon S3 URI, jadi permintaan yang mengandalkan CORS tidak didukung.

Contoh AWS Hosted IGV bergantung pada AWS Cognito untuk membuat konfigurasi dan izin yang benar di dalam lingkungan. Pastikan kebijakan dibuat dengan izin enableSKMS:Decrypt dan s3: GetObject ke URI Amazon S3 dari set baca yang sedang diakses, dan tambahkan kebijakan ini ke peran yang ditetapkan ke kumpulan pengguna Cognito. Setelah itu, di IGV, Anda dapat menggunakan “File> load from URL” dan masukkan URI untuk sumber dan indeks. Atau, presigned URLs dapat dibuat dan digunakan dengan cara yang sama, yang melewati konfigurasi AWS. 

Perhatikan bahwa toko urutan tidak akan muncul di bawah tab “Amazon” karena itu hanya menampilkan bucket yang Anda miliki di Wilayah tempat AWS profil dikonfigurasi. 

## Menggunakan Samtools atau HTSlib di HealthOmics
<a name="s3-access-Samtools"></a>

HTSlib adalah pustaka inti yang dibagikan oleh beberapa alat seperti Samtools, RSAMTools PySam, dan lainnya. Gunakan HTSlib versi 1.20 atau yang lebih baru untuk mendapatkan dukungan tanpa batas untuk Poin Akses Amazon S3. Untuk versi HTSlib pustaka yang lebih lama, Anda dapat menggunakan solusi berikut:
+ Tetapkan variabel lingkungan untuk host HTS Amazon S3 dengan:. `export HTS_S3_HOST="s3.region.amazonaws.com"`
+ Hasilkan URL presigned untuk file yang ingin Anda gunakan. Jika BAM atau CRAM sedang digunakan, pastikan bahwa URL presigned dihasilkan untuk file dan indeks. Setelah itu, kedua file dapat digunakan dengan perpustakaan. 
+ Gunakan Mountpoint untuk memasang urutan penyimpanan atau membaca awalan set di lingkungan yang sama tempat Anda menggunakan pustaka. HTSlib Dari sini, file dapat diakses dengan menggunakan jalur file lokal. 

## Menggunakan Mountpoint HealthOmics
<a name="s3-access-Mountpoint"></a>

Mountpoint untuk Amazon S3 adalah klien file throughput tinggi yang sederhana untuk memasang bucket [Amazon S3 sebagai sistem file lokal](https://aws.amazon.com/blogs/storage/the-inside-story-on-mountpoint-for-amazon-s3-a-high-performance-open-source-file-client/). Dengan Mountpoint untuk Amazon S3, aplikasi Anda dapat mengakses objek yang disimpan di Amazon S3 melalui operasi file seperti buka dan baca. Mountpoint untuk Amazon S3 secara otomatis menerjemahkan operasi ini ke dalam panggilan API objek Amazon S3, memberikan aplikasi Anda akses ke penyimpanan elastis dan throughput Amazon S3 melalui antarmuka file.

 Mountpoint dapat diinstal dengan menggunakan petunjuk instalasi [Mountpoint](https://github.com/awslabs/mountpoint-s3/blob/main/doc/INSTALL.md). Mountpoint menggunakan Profil AWS yang bersifat lokal untuk penginstalan dan berfungsi pada tingkat awalan Amazon S3. Pastikan profil yang digunakan memiliki kebijakan yang memungkinkan izin s3:GetObject, s3:ListBucket, dan kms: Dekripsi ke awalan URI Amazon S3 dari kumpulan baca atau penyimpanan urutan yang diakses. Setelah itu, ember dapat dipasang dengan menggunakan jalur berikut: 

```
mount-s3 access point arn local path to mount --prefix prefix to sequence store or read set --region region                                  
```

## Menggunakan CloudFront dengan HealthOmics
<a name="s3-access-CloudFront"></a>

Amazon CloudFront adalah layanan jaringan pengiriman konten (CDN) yang dibuat untuk kinerja tinggi, keamanan, dan kenyamanan pengembang. Pelanggan yang ingin menggunakan CloudFront harus bekerja dengan tim Layanan untuk mengaktifkan CloudFront distribusi. Bekerja dengan tim akun Anda untuk melibatkan tim HealthOmics layanan. 

# Mengaktifkan set baca di HealthOmics
<a name="activating-read-sets"></a>

Anda dapat mengaktifkan set baca yang diarsipkan dengan operasi **start-read-set-activation-job** API, atau melalui AWS CLI, seperti yang ditunjukkan pada contoh berikut. Ganti `sequence store ID` dan `read set id` dengan ID toko urutan Anda dan set baca IDs. 

```
aws omics start-read-set-activation-job 
     --sequence-store-id sequence store ID \
     --sources readSetId=read set ID readSetId=read set id_1 read set id_2
```

Anda menerima tanggapan yang berisi informasi pekerjaan aktivasi, seperti yang ditunjukkan di bawah ini.

```
{
    "id": "12345678",
    "sequenceStoreId": "1234567890",
    "status": "SUBMITTED",
    "creationTime": "2022-10-22T00:50:54.670000+00:00"
}
```

Setelah pekerjaan aktivasi dimulai, Anda dapat memantau kemajuannya dengan operasi API **get-read-set-activation-job**. Berikut ini adalah contoh cara menggunakan AWS CLI untuk memeriksa status pekerjaan aktivasi Anda. Ganti `job ID` dan `sequence store ID` dengan ID toko urutan dan pekerjaan Anda IDs, masing-masing. 

```
aws omics get-read-set-activation-job --id job ID --sequence-store-id sequence store ID                    
```

Respons merangkum pekerjaan aktivasi, seperti yang ditunjukkan pada berikut ini.

```
{
    "id": 123567890,
    "sequenceStoreId": 123467890,
    "status": "SUBMITTED",
    "statusUpdateReason": "The job is submitted and will start soon.",
    "creationTime": "2022-10-22T00:50:54.670000+00:00",
    "sources": [
        {
            "readSetId": <reads set id_1>,
            "status": "NOT_STARTED",
            "statusUpdateReason": "The source is queued for the job."
        },
        {
            "readSetId": <read set id_2>,
            "status": "NOT_STARTED",
            "statusUpdateReason": "The source is queued for the job."
        }
    ]
}
```

Anda dapat memeriksa status pekerjaan aktivasi dengan operasi **get-read-set-metadata**API. Status yang mungkin adalah`ACTIVE`,`ACTIVATING`, dan`ARCHIVED`. Dalam contoh berikut, ganti `sequence store ID` dengan ID penyimpanan urutan Anda, dan ganti `read set ID` dengan ID set baca Anda.

```
aws omics get-read-set-metadata --sequence-store-id sequence store ID --id read set ID
```

Tanggapan berikut menunjukkan kepada Anda bahwa set baca aktif.

```
{
    "id": "12345678",
    "arn": "arn:aws:omics:us-west-2:555555555555:sequenceStore/1234567890/readSet/12345678",
    "sequenceStoreId": "0123456789",
    "subjectId": "mySubject",
    "sampleId": "mySample",
    "status": "ACTIVE",
    "name": "HG00100",
    "description": "HG00100 aligned to HG38 BAM",
    "fileType": "BAM",
    "creationTime": "2022-07-13T23:25:20Z",
    "sequenceInformation": {
        "totalReadCount": 1513467,
        "totalBaseCount": 163454436,
        "generatedFrom": "Pulled from SRA",
        "alignment": "ALIGNED"
    },
    "referenceArn": "arn:aws:omics:us-west-2:555555555555:referenceStore/0123456789/reference/0000000001",
    "files": {
        "source1": {
            "totalParts": 2,
            "partSize":  10485760,
            "contentLength": 17112283,
            "s3Access": {
        "s3Uri": "s3://accountID-sequence store ID-ajdpi90jdas90a79fh9a8ja98jdfa9jf98-s3alias/592761533288/sequenceStore/2015356892/readSet/9515444019/import_source1.fastq.gz"
},
         },
        "index": {
            "totalParts": 1,
            "partSize": 53216,
            "contentLength": 10485760
            "s3Access": {
        "s3Uri": "s3://accountID-sequence store ID-ajdpi90jdas90a79fh9a8ja98jdfa9jf98-s3alias/592761533288/sequenceStore/2015356892/readSet/9515444019/import_source1.fastq.gz"
},
        }
    },
    "creationType": "IMPORT",
    "etag": {
        "algorithm": "BAM_MD5up",
        "source1": "d1d65429212d61d115bb19f510d4bd02"
    }
}
```

Anda dapat melihat semua pekerjaan aktivasi set baca dengan menggunakan **list-read-set-activation-jobs**, seperti yang ditunjukkan pada contoh berikut. Dalam contoh berikut, ganti `sequence store ID` dengan ID toko urutan Anda.

```
aws omics list-read-set-activation-jobs --sequence-store-id sequence store ID                
```

Anda menerima tanggapan berikut.

```
{
    "activationJobs": [
        {
            "id": 1234657890,
            "sequenceStoreId": "1234567890",
            "status": "COMPLETED",
            "creationTime": "2022-10-22T01:33:38.079000+00:00",
            "completionTime": "2022-10-22T01:34:28.941000+00:00"
        }
    ]
}
```