

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Melakukan migrasi data besar dengan AWS DataSync
<a name="datasync-large-migration"></a>

Migrasi data skala besar dapat melibatkan transfer volume data yang signifikan yang mencakup jutaan file atau objek dalam berbagai format. AWS DataSync menyederhanakan transfer kompleks ini dengan mengelola penjadwalan, pemantauan, enkripsi, dan verifikasi data.

## Apa itu migrasi data besar?
<a name="datasync-large-migration-definition"></a>

Migrasi data yang besar biasanya melibatkan transfer terabyte atau lebih dari data yang tersebar di berbagai sumber ke lingkungan penyimpanan tujuan baru (dalam hal ini,). AWS Migrasi ini memerlukan perencanaan dan koordinasi yang cermat dalam organisasi Anda untuk memindahkan data dengan sukses sambil meminimalkan gangguan bisnis.

DataSync dapat menyederhanakan migrasi ini, yang biasanya bersifat kompleks. Beberapa manfaat menggunakan DataSync untuk migrasi Anda meliputi:
+ Manajemen otomatis proses transfer data dan infrastruktur yang diperlukan untuk transfer data berkinerja tinggi dan aman.
+ End-to-end keamanan, termasuk enkripsi dan validasi integritas data, untuk membantu memastikan bahwa data Anda tiba dengan aman, utuh, dan siap digunakan.
+ Protokol jaringan yang dibangun khusus dan arsitektur paralel multi-threaded untuk mempercepat migrasi.

## Tahapan kunci dari migrasi data besar
<a name="datasync-large-migration-stages"></a>

Anda biasanya dapat memecah migrasi besar menjadi tahapan berikut:
+ **(Tahap 1) Merencanakan migrasi data Anda** - Pada tahap ini, Anda mencoba memahami mengapa Anda bermigrasi dan jenis data apa yang Anda gunakan. Kegiatan perencanaan meliputi:
  + Memahami mengapa Anda ingin bermigrasi 
  + Merakit tim untuk membantu Anda dengan semua aspek migrasi.
  + Mengidentifikasi lokasi data, format, dan pola penggunaan
  + Menilai sumber daya perangkat keras dan persyaratan jaringan yang tersedia (jika Anda bermigrasi dari pusat data lokal)
  + Menjalankan pengujian proof of concept (POC) DataSync untuk memperkirakan jadwal migrasi, merencanakan jendela cutover, dan memahami bagaimana Anda perlu mengonfigurasi DataSync
+ **(Tahap 2) Menerapkan migrasi data besar Anda** - Pada titik ini, Anda memvalidasi paket Anda dan memulai migrasi. Kegiatan implementasi meliputi:
  + Memvalidasi rencana migrasi
  + Menjalankan pemotongan bertahap yang mencakup pemantauan dan verifikasi transfer data Anda seperti yang diharapkan
  + Mengoptimalkan dan menyesuaikan sesuai kebutuhan di antara setiap cutover
  + Membersihkan sumber daya yang tidak terpakai setelah Anda selesai

## Sumber daya tambahan
<a name="review-migration-data-resources"></a>

AWS Panduan Preskriptif memiliki sumber daya berikut yang dapat membantu Anda merencanakan dan mengimplementasikan migrasi besar. Gunakan panduan ini untuk memahami DataSync cara kerja dalam konteks proses dan aktivitas migrasi umum. 
+ [Migrasi besar ke cloud AWS](https://aws.amazon.com/prescriptive-guidance/large-migrations/?large-migration-strategies.sort-by=item.additionalFields.sortText&large-migration-strategies.sort-order=desc&large-migration-playbooks.sort-by=item.additionalFields.sortText&large-migration-playbooks.sort-order=desc&large-migration-patterns.sort-by=item.additionalFields.sortText&large-migration-patterns.sort-order=desc)
+ [Strategi dan praktik terbaik untuk migrasi AWS besar](https://docs.aws.amazon.com/prescriptive-guidance/latest/strategy-large-scale-migrations/welcome.html)
+ [Memigrasi sistem file bersama dalam migrasi AWS besar](https://docs.aws.amazon.com/prescriptive-guidance/latest/patterns/migrate-shared-file-systems-in-an-aws-large-migration.html) — Sumber daya ini menyertakan **buku kerja SFS-Discovery-yang** dapat Anda unduh dan gunakan untuk merencanakan migrasi di tingkat berbagi file.

# Tahap 1: Merencanakan migrasi data besar Anda
<a name="datasync-large-migraton-stage-1"></a>

Perencanaan sangat penting saat memigrasikan kumpulan data besar. Anda harus memahami data yang Anda migrasi, motivasi Anda untuk migrasi, dan bagaimana AWS DataSync dapat membantu Anda mendapatkan data di tempat yang Anda inginkan.

**Topics**
+ [Mengumpulkan persyaratan untuk migrasi Anda](gathering-migration-requirements.md)
+ [Menjalankan DataSync bukti konsep](datasync-large-migration-poc.md)
+ [Memperkirakan jadwal migrasi](datasync-large-migration-timelines.md)

# Mengumpulkan persyaratan untuk migrasi Anda
<a name="gathering-migration-requirements"></a>

Langkah pertama dalam migrasi data besar memerlukan pengumpulan berbagai informasi di seluruh organisasi Anda.

Informasi ini membantu Anda membuat [proses](https://docs.aws.amazon.com/prescriptive-guidance/latest/strategy-large-scale-migrations/process.html) migrasi, yang untuk migrasi besar dapat mencakup beberapa transfer dan prosedur untuk memotong operasi (dilakukan dalam [gelombang](https://docs.aws.amazon.com/prescriptive-guidance/latest/application-portfolio-assessment-guide/wave-planning.html)) dari sumber Anda ke penyimpanan tujuan Anda.

## Memahami mengapa Anda ingin bermigrasi
<a name="define-migration-goals-why"></a>

Sebelum Anda dapat mulai bermigrasi ke AWS, Anda perlu memahami dengan jelas mengapa Anda memigrasikan data Anda. Ini membantu mengatasi tantangan migrasi umum seperti memenuhi tenggat waktu, mengelola sumber daya, dan berkoordinasi di seluruh tim.

Jika Anda memerlukan bantuan untuk menentukan motivasi Anda untuk migrasi, jawab pertanyaan-pertanyaan ini:
+ Apakah Anda membebaskan ruang penyimpanan lokal?
+ Apakah Anda memenuhi tenggat waktu kontrak dukungan perangkat keras?
+ Apakah ini untuk pintu keluar pusat data?
+ Apa timeline migrasi Anda?
+ Apakah Anda mentransfer data dari penyimpanan cloud lainnya?
+ Apakah Anda memigrasi kumpulan data sebagian atau lengkap?
+ Apakah ini untuk arsip data?
+ Apakah aplikasi atau pengguna memerlukan akses reguler ke data ini?

## Mencari tahu logistik
<a name="define-migration-goals-logistics"></a>

Mengatasi beberapa logistik dasar tentang lingkungan penyimpanan Anda, migrasi, dan organisasi Anda:

1. Dapatkan pemahaman dasar tentang infrastruktur penyimpanan data Anda saat ini.

1. Periksa apakah Anda membutuhkan [DataSync agen](do-i-need-datasync-agent.md). Misalnya, Anda memerlukan agen jika mentransfer dari penyimpanan lokal.

1. Jika Anda membutuhkan agen, pastikan Anda memahami [persyaratan agen](agent-requirements.md):
   + Agen dapat berjalan sebagai mesin virtual (VM) pada VMware ESXi, Linux Kernel-based Virtual Machine (KVM), dan Microsoft Hyper-V hypervisors. Anda juga dapat menerapkan agen sebagai instans Amazon EC2 di dalamnya. AWS
   + Migrasi besar biasanya intensif memori. Pastikan agen Anda memiliki RAM yang cukup.

1. Identifikasi pemangku kepentingan utama dari kepemimpinan, jaringan, penyimpanan, dan departemen TI Anda yang perlu terlibat dalam migrasi. Ini dapat mencakup:
   + Temukan [pemimpin berulir tunggal](https://docs.aws.amazon.com/prescriptive-guidance/latest/strategy-large-scale-migrations/people.html) yang berdedikasi pada proyek dan hasilnya.
   + Tentukan siapa yang bertanggung jawab atas kepemilikan dan klasifikasi data yang Anda migrasi.
   + Identifikasi siapa yang mengelola sumber Anda dan siapa yang pada akhirnya akan mengelola layanan AWS penyimpanan tempat Anda bermigrasi.
   + Cari tahu siapa yang akan membuat dan mengelola proses lain untuk data Anda setelah masuk AWS.

1. Membangun saluran komunikasi lintas departemen.

1. Buat rencana rollback untuk kemungkinan.

1. Dokumentasikan proses migrasi lengkap, termasuk gelombang, validasi, dan prosedur cutover. Gunakan ini sebagai runbook Anda untuk seluruh migrasi. Anda akan memperbarui proses ini saat Anda merencanakan dan menerapkan migrasi.

## Meninjau data yang Anda migrasi
<a name="review-migration-data"></a>

Bekerja dengan tim penyimpanan dan aplikasi Anda untuk menganalisis karakteristik data yang Anda migrasi. Informasi ini membantu Anda menentukan strategi migrasi yang dapat Anda jalankan DataSync.

**Contents**
+ [Menentukan pola penggunaan data](#review-migration-data-usage)
+ [Mengidentifikasi struktur dan tata letak data](#review-migration-data-structure)
+ [Mendokumentasikan saham dan folder](#review-migration-data-document-shares)
+ [Menganalisis ukuran file](#review-migration-data-file-sizes)

### Menentukan pola penggunaan data
<a name="review-migration-data-usage"></a>
+ Untuk data yang digunakan secara aktif dengan modifikasi yang sering, rencanakan beberapa gelombang transfer tambahan untuk menghindari gangguan operasi bisnis.
+ Untuk data hanya-baca yang mungkin dianggap sebagai arsip, Anda mungkin tidak perlu merencanakan gelombang.
+ Jika Anda memiliki campuran pola penggunaan data, rencanakan gelombang yang memigrasikan kumpulan data yang berbeda ini secara terpisah. Misalnya, Anda mungkin memiliki satu gelombang untuk data arsip, dengan gelombang lainnya yang didedikasikan untuk memigrasi data aktif.

### Mengidentifikasi struktur dan tata letak data
<a name="review-migration-data-structure"></a>
+ Tentukan apakah data diatur berdasarkan periode waktu (tahun, bulan, hari) atau pola lainnya.
+ Gunakan struktur organisasi ini untuk merencanakan gelombang migrasi Anda. Misalnya, Anda dapat memigrasikan data arsip selama satu tahun selama satu gelombang.

### Mendokumentasikan saham dan folder
<a name="review-migration-data-document-shares"></a>
+ Buat inventaris saham dan folder (termasuk jumlah file atau objek untuk masing-masing).
+ Identifikasi berbagi dan folder dengan kumpulan data aktif. Ini mungkin memerlukan transfer tambahan selama migrasi.
+ Tinjau [DataSync kuota](datasync-limits.md). Ini dapat membantu Anda merencanakan cara mempartisi kumpulan data Anda saat mengonfigurasi DataSync.

### Menganalisis ukuran file
<a name="review-migration-data-file-sizes"></a>
+ Harapkan throughput data yang lebih tinggi untuk transfer dengan file yang lebih besar (MB atau GB) dibandingkan dengan file yang lebih kecil (KB).
+ Jika Anda bekerja dengan banyak file yang lebih kecil, harapkan lebih banyak operasi metadata pada sistem penyimpanan Anda dan throughput data yang lebih rendah. DataSyncmelakukan operasi ini saat membandingkan dan memverifikasi lokasi sumber dan tujuan Anda.

## Mengidentifikasi persyaratan penyimpanan
<a name="determine-storage-requirements"></a>

Untuk memilih layanan AWS penyimpanan yang kompatibel untuk memigrasikan data Anda, Anda perlu mengevaluasi karakteristik dan kinerja sistem penyimpanan sumber Anda.

Informasi ini juga dapat membantu [Anda menjadwalkan transfer](task-scheduling.md) untuk meminimalkan dampak pada operasi bisnis selama migrasi.

**Contents**
+ [Menentukan dukungan penyimpanan sumber](#determine-storage-requirements-protocols)
+ [Meninjau persyaratan pelestarian metadata](#determine-storage-requirements-metadata)
+ [Mengumpulkan metrik kinerja dari penyimpanan sumber](#determine-storage-requirements-performance)
+ [Memilih layanan AWS penyimpanan tujuan](#determine-storage-requirements-destination)

### Menentukan dukungan penyimpanan sumber
<a name="determine-storage-requirements-protocols"></a>

DataSync dapat bekerja dengan berbagai sistem penyimpanan yang memungkinkan akses melalui klien penyimpanan objek yang kompatibel dengan NFS, SMB, HDFS, dan S3. 

Jika Anda bermigrasi dari penyimpanan cloud lain, verifikasi bahwa itu DataSync dapat berfungsi dengan penyedia tersebut. Untuk daftar lokasi sumber yang didukung, lihat [Di mana saya dapat mentransfer data saya AWS DataSync?](working-with-locations.md)

### Meninjau persyaratan pelestarian metadata
<a name="determine-storage-requirements-metadata"></a>

DataSync dapat menyimpan file atau objek metadata selama transfer. Bagaimana metadata Anda dipertahankan tergantung pada lokasi transfer Anda dan jika lokasi tersebut menggunakan jenis metadata yang serupa.

DataSync dalam beberapa kasus memerlukan izin tambahan untuk mempertahankan metadata file, seperti daftar akses diskresioner NTFS (). DACLs

Untuk informasi selengkapnya, lihat [Memahami cara DataSync menangani metadata file dan objek](metadata-copied.md).

### Mengumpulkan metrik kinerja dari penyimpanan sumber
<a name="determine-storage-requirements-performance"></a>

Ukur IOPS dasar dan throughput disk selama beban kerja rata-rata dan puncak untuk penyimpanan sumber Anda. Mentransfer data menambah I/O overhead ke sistem penyimpanan sumber dan tujuan Anda.

Bandingkan data kinerja ini dengan spesifikasi sistem penyimpanan Anda untuk menentukan sumber daya kinerja yang tersedia.

### Memilih layanan AWS penyimpanan tujuan
<a name="determine-storage-requirements-destination"></a>

Pada titik ini, Anda mungkin memiliki ide layanan AWS penyimpanan apa yang masuk akal untuk data Anda. Jika tidak, pola penggunaan data dan kinerja penyimpanan adalah beberapa area yang perlu dipikirkan saat memutuskan. Misalnya, Anda dapat mempertimbangkan Amazon S3 jika Anda memiliki data arsip dan Amazon atau FSx Amazon EFS untuk data aktif.

Untuk membantu Anda menentukan objek yang tepat atau penyimpanan berbasis file untuk data Anda, lihat [Memilih layanan AWS penyimpanan](https://docs.aws.amazon.com/decision-guides/latest/storage-on-aws-how-to-choose/choosing-aws-storage-service.html).

## Menentukan persyaratan jaringan
<a name="datasync-migration-network-requirements"></a>

Untuk memigrasikan data Anda DataSync, Anda harus membuat koneksi jaringan antara penyimpanan sumber, agen, dan AWS. Anda juga perlu merencanakan bandwidth dan infrastruktur jaringan yang cukup.

Bekerja dengan teknisi jaringan dan administrator penyimpanan Anda untuk mengumpulkan persyaratan jaringan berikut.

**Contents**
+ [Menilai bandwidth jaringan Anda yang tersedia](#datasync-migration-network-bandwidth)
+ [Mempertimbangkan opsi untuk menghubungkan jaringan Anda ke AWS](#datasync-migration-network-connection-options)
+ [Memilih titik akhir layanan untuk komunikasi agen](#datasync-migration-network-service-endpoint)
+ [Merencanakan infrastruktur jaringan yang cukup](#datasync-migration-network-interfaces)

### Menilai bandwidth jaringan Anda yang tersedia
<a name="datasync-migration-network-bandwidth"></a>

Bandwidth jaringan yang tersedia menjadi faktor kecepatan transfer dan waktu migrasi secara keseluruhan. Jika Anda mentransfer dari sistem penyimpanan lokal, lakukan hal berikut: 
+ Bekerja dengan tim jaringan Anda untuk menentukan pemanfaatan bandwidth rata-rata dan puncak. 
+ Identifikasi jendela ketika Anda dapat mentransfer data dan menghindari mengganggu operasi harian. Ini akan menginformasikan kapan gelombang migrasi dan pemotongan Anda terjadi.

Anda dapat mengontrol berapa banyak bandwidth yang DataSync digunakan. Untuk informasi selengkapnya, lihat [Menetapkan batas bandwidth untuk AWS DataSync tugas Anda](configure-bandwidth.md).

Karena transfer dari penyimpanan cloud lainnya biasanya terjadi melalui internet publik, biasanya ada lebih sedikit batasan bandwidth dan pertimbangan dengan transfer ini.

### Mempertimbangkan opsi untuk menghubungkan jaringan Anda ke AWS
<a name="datasync-migration-network-connection-options"></a>

Pertimbangkan opsi berikut untuk membangun konektivitas jaringan untuk DataSync transfer Anda:
+ **Direct Connect**- Tinjau [arsitektur dan contoh perutean](direct-connect-architecture.md) untuk menggunakan Direct Connect dengan DataSync. Anda dapat memantau aktivitas Direct Connect menggunakan [Amazon CloudWatch](https://docs.aws.amazon.com/directconnect/latest/UserGuide/monitoring-cloudwatch.html).
+ **VPN** - [AWS Site-to-Site VPN](https://docs.aws.amazon.com/vpn/latest/s2svpn/VPC_VPN.html)menawarkan throughput hingga 1,25 Gbps per terowongan.
+ **Internet publik** - Kontak dengan penyedia layanan internet Anda untuk data penggunaan jaringan.

### Memilih titik akhir layanan untuk komunikasi agen
<a name="datasync-migration-network-service-endpoint"></a>

DataSync Agen menggunakan [titik akhir layanan](choose-service-endpoint.md) untuk berkomunikasi dengan DataSync layanan. Jenis titik akhir yang Anda gunakan tergantung pada bagaimana Anda menghubungkan jaringan Anda. AWS

### Merencanakan infrastruktur jaringan yang cukup
<a name="datasync-migration-network-interfaces"></a>

Untuk setiap tugas transfer yang Anda buat, DataSync secara otomatis menghasilkan dan mengelola infrastruktur jaringan untuk transfer data Anda. Infrastruktur ini dikenal sebagai *antarmuka jaringan atau antarmuka* *jaringan elastis*, yang merupakan komponen jaringan logis dalam cloud pribadi virtual Amazon (VPC) yang mewakili kartu jaringan virtual. Untuk informasi selengkapnya, lihat [https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/using-eni.html](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/using-eni.html).

Setiap antarmuka jaringan menggunakan satu alamat IP di subnet VPC tujuan Anda. Untuk memastikan bahwa Anda memiliki infrastruktur jaringan yang cukup untuk migrasi Anda, lakukan hal berikut:
+ Perhatikan jumlah [antarmuka jaringan](required-network-interfaces.md) yang DataSync akan dibuat untuk lokasi DataSync tujuan Anda.
+ Pastikan subnet Anda memiliki alamat IP yang cukup untuk DataSync tugas Anda. Misalnya, tugas yang menggunakan agen membutuhkan empat alamat IP. Jika Anda membuat empat tugas untuk migrasi Anda, itu berarti Anda memerlukan 16 alamat IP yang tersedia di subnet Anda. 

# Menjalankan DataSync bukti konsep
<a name="datasync-large-migration-poc"></a>

Menjalankan bukti konsep (POC) dengan AWS DataSync membantu Anda memvalidasi aspek-aspek berikut dari perencanaan migrasi data Anda:
+ Verifikasi konektivitas jaringan antara lokasi sumber dan tujuan.
+ Validasi konfigurasi DataSync tugas awal Anda.
+ Ukur kinerja transfer data.
+ Perkirakan jadwal migrasi.
+ Tentukan kriteria keberhasilan dengan pemangku kepentingan utama yang bekerja pada migrasi.

## Memulai dengan bukti konsep Anda
<a name="datasync-large-migration-poc-getting-started"></a>

1. Buat DataSync agen Anda:

   1. [Menyebarkan agen Anda](deploy-agents.md).

   1. [Pilih titik akhir layanan](choose-service-endpoint.md) untuk agen Anda.

   1. [Aktifkan agen Anda](activate-agent.md).

   1. [Verifikasi koneksi jaringan agen Anda](test-agent-connections.md).

1. Pilih subset kecil data yang mewakili data yang Anda migrasi.

   Misalnya, jika penyimpanan sumber Anda memiliki campuran file besar dan kecil, subset data yang Anda transfer di POC Anda harus mencerminkan hal itu. Ini memberi Anda pemahaman awal tentang kinerja dari sistem penyimpanan, jaringan Anda, dan DataSync.

1. Buat lokasi DataSync sumber untuk sistem penyimpanan [cloud lokal](transferring-on-premises-storage.md) [atau lainnya](transferring-other-cloud-storage.md).

1. Buat lokasi DataSync tujuan untuk [layanan AWS penyimpanan](transferring-aws-storage.md) Anda.

1. [Buat tugas DataSync transfer](create-task-how-to.md) dengan [filter](filtering.md) yang hanya mentransfer subset data Anda.

1. [Mulai DataSync tugas Anda](run-task.md).

1. Kumpulkan metrik performa transfer dengan memantau hal-hal berikut:
   + Data eksekusi tugas dan throughput file Anda. Anda dapat melakukan ini melalui DataSync konsol atau [DescribeTaskExecution](https://docs.aws.amazon.com/datasync/latest/userguide/API_DescribeTaskExecution.html)operasi. Jika Anda menggunakan`DescribeTaskExecution`, inilah cara Anda menghitung metrik ini:
     + **Throughput data**: Bagilah `BytesWritten` dengan `TransferDuration`
     + **Throughput file**: Bagilah `FilesTransferred` dengan `TransferDuration`
   + Pemanfaatan penyimpanan sumber dan tujuan. Bekerja sama dengan administrator penyimpanan Anda untuk mendapatkan informasi ini.
   + Penggunaan jaringan.

1. Verifikasi data yang ditransfer di lokasi tujuan Anda:
   + Tinjau CloudWatch log Anda untuk kesalahan eksekusi tugas.
   + Verifikasi bahwa izin dan metadata dipertahankan di lokasi tujuan.
   + Konfirmasikan bahwa aplikasi dan pengguna dapat mengakses data tujuan seperti yang diharapkan.
   + Atasi masalah apa pun yang Anda temui. Untuk informasi selengkapnya, lihat [Memecahkan masalah AWS DataSync](troubleshooting-datasync.md).

1. Jalankan tugas Anda beberapa kali lagi untuk mendapatkan ide berapa lama waktu yang dibutuhkan DataSync untuk  mempersiapkan, mentransfer, dan memverifikasi data Anda. (Untuk informasi selengkapnya, lihat [Status eksekusi tugas](run-task.md#understand-task-execution-statuses).)

   Jika Anda menjalankan tugas lebih dari sekali, secara DataSync default melakukan transfer tambahan dan hanya menyalin data yang diubah dari tugas sebelumnya.

   Meskipun waktu transfer kemungkinan akan lebih pendek untuk transfer tambahan, DataSync akan selalu mempersiapkan transfer Anda dengan cara yang sama dengan memindai dan membandingkan lokasi Anda untuk mengidentifikasi apa yang akan ditransfer. Anda dapat menggunakan waktu persiapan ini untuk [memperkirakan batas waktu migrasi](datasync-large-migration-timelines.md#datasync-large-migration-cutover-timelines) Anda.

1. Jika perlu, perbarui rencana migrasi Anda berdasarkan apa yang Anda pelajari selama POC.

# Memperkirakan jadwal migrasi
<a name="datasync-large-migration-timelines"></a>

Dengan menggunakan informasi yang telah Anda kumpulkan hingga saat ini, Anda dapat memperkirakan berapa lama migrasi akan digunakan AWS DataSync.

## Memperkirakan jadwal transfer data
<a name="datasync-large-migration-transfer-timelines"></a>

Anda dapat memperkirakan berapa lama waktu yang dibutuhkan DataSync untuk mentransfer data Anda berdasarkan informasi berikut yang Anda kumpulkan selama pengumpulan persyaratan migrasi dan DataSync bukti konsep (POC) Anda:
+ [Bandwidth jaringan Anda yang tersedia](gathering-migration-requirements.md#datasync-migration-network-bandwidth)
+ Metrik pemanfaatan penyimpanan sumber dan tujuan
+ [Metrik kinerja dari POC Anda DataSync ](datasync-large-migration-poc.md)

**Untuk memperkirakan timeline transfer data**

1. Bandingkan data dan throughput file dari POC Anda dengan bandwidth jaringan yang tersedia.

1. Jika throughput Anda lebih rendah dari bandwidth yang tersedia (seperti 300 MiB/s untuk throughput dengan 10 Gbps bandwidth jaringan), pertimbangkan untuk mempartisi dataset Anda menjadi beberapa tugas untuk memaksimalkan penggunaan bandwidth.

   DataSync memiliki beberapa opsi untuk mempartisi dataset Anda. Untuk informasi selengkapnya, lihat [Mempercepat migrasi Anda dengan partisi data](datasync-large-migration-data-partitioning.md).

1. Hitung berapa hari transfer dengan menggunakan rumus berikut, yang memberikan waktu transfer minimum teoritis:

   ```
   (DATA_SIZE * 8 bits per byte)/(CIRCUIT * NETWORK_UTILIZATION percentage * 3600 seconds per hour * AVAILABLE_HOURS) = Number of days
   ```

   Saat menggunakan rumus ini, ganti yang berikut ini dengan nilai Anda sendiri:
   + `DATA_SIZE`: Jumlah data yang Anda migrasi (dinyatakan dalam byte).
   + `CIRCUIT`: Bandwidth jaringan Anda yang tersedia (dinyatakan dalam bit per detik).
   + `NETWORK_UTILIZATION`Berapa persen dari jaringan Anda yang digunakan.
   + `AVAILABLE_HOURS`: Jumlah jam operasional yang tersedia setiap hari.

   Misalnya, Anda akan menghitung migrasi dengan 100 TB data, koneksi internet 1 Gbps, pemanfaatan jaringan 80 persen, dan ketersediaan 24 jam per hari seperti ini:

   `(100,000,000,000,000 bytes * 8) / (1,000,000,000 bps * 0.80 * 3600 * 24) = 11.57 days`

   Dalam hal ini, migrasi akan memakan waktu hampir 12 hari sebelum memperhitungkan kondisi dunia nyata.

1. Sesuaikan durasi transfer yang dihitung untuk memperhitungkan kondisi dunia nyata:
   + Fluktuasi kinerja jaringan
   + Variasi kinerja penyimpanan
   + Waktu henti antara gelombang migrasi

## Memperkirakan garis waktu cutover
<a name="datasync-large-migration-cutover-timelines"></a>

Jika Anda memigrasi kumpulan data aktif, Anda mungkin memerlukan pemotongan sehingga Anda tidak mengganggu operasi bisnis.

Jangan meremehkan berapa lama pemotongan. Dengan migrasi besar, tidak jarang aktivitas cutover memakan waktu hingga 30 persen dari keseluruhan waktu migrasi Anda.

1. Evaluasi apakah Anda perlu melakukan cutover dalam gelombang untuk mengurangi jumlah data yang dipindai untuk perubahan bertahap.

   Salah satu strategi untuk melakukan ini adalah memotong kumpulan data yang Anda partisi berdasarkan berbagi, folder, atau sistem penyimpanan.

1. Tinjau berapa lama waktu yang dibutuhkan DataSync untuk mempersiapkan, mentransfer, dan memverifikasi data Anda selama POC.

   Perhatikan secara khusus durasi persiapan eksekusi tugas Anda. Untuk menemukan informasi ini, jalankan [DescribeTaskExecution](https://docs.aws.amazon.com/datasync/latest/userguide/API_DescribeTaskExecution.html)operasi, lalu periksa nilai [PrepareDuration](https://docs.aws.amazon.com/datasync/latest/userguide/API_TaskExecutionResultDetail.html#DataSync-Type-TaskExecutionResultDetail-PrepareDuration)untuk durasi waktu (dalam milidetik).

1. Perkirakan berapa lama waktu yang dibutuhkan cutover dengan mengukur delta waktu di seluruh tugas paralel.

   Untuk informasi selengkapnya tentang tugas paralel, lihat[Mempercepat migrasi Anda dengan partisi data](datasync-large-migration-data-partitioning.md).

1. Gunakan estimasi cutover Anda untuk menjadwalkan cutover Anda. Ini pada dasarnya adalah jendela pemeliharaan ketika data sumber Anda tidak dapat dimodifikasi.

## Langkah selanjutnya
<a name="estimate-cutover-timelines-next-steps"></a>

Setelah memperkirakan jadwal Anda, Anda siap untuk mulai menerapkan migrasi Anda.

# Tahap 2: Menerapkan migrasi data besar Anda
<a name="datasync-large-migraton-stage-2"></a>

Dengan informasi yang Anda kumpulkan selama perencanaan, Anda dapat mulai menggunakan AWS DataSync untuk bermigrasi ke sistem penyimpanan baru Anda. Jika Anda belum melakukannya, sebaiknya tinjau [sumber panduan AWS preskriptif untuk](datasync-large-migration.md#review-migration-data-resources) migrasi besar.

**Topics**
+ [Mempercepat migrasi Anda dengan partisi data](datasync-large-migration-data-partitioning.md)
+ [Menjalankan tugas DataSync transfer Anda](datasync-large-migration-running-tasks.md)
+ [Memantau transfer Anda](datasync-large-migration-monitoring.md)

# Mempercepat migrasi Anda dengan partisi data
<a name="datasync-large-migration-data-partitioning"></a>

Dengan migrasi besar, kami sarankan untuk mempartisi kumpulan data Anda dengan beberapa tugas. DataSync Mempartisi data sumber Anda di beberapa tugas (dan mungkin agen) memungkinkan Anda memparalelkan transfer Anda dan mengurangi timeline migrasi.

Partisi juga membantu Anda tetap dalam DataSync [kuota](datasync-limits.md) dan menyederhanakan pemantauan dan debugging tugas Anda. 

Diagram berikut menunjukkan bagaimana Anda dapat menggunakan beberapa DataSync tugas dan agen untuk mentransfer data dari lokasi penyimpanan sumber yang sama. Dalam skenario ini, setiap tugas berfokus pada folder tertentu di lokasi sumber. Untuk informasi dan contoh selengkapnya tentang pendekatan ini, lihat [Cara mempercepat transfer data Anda dengan AWS DataSync skala arsitektur](https://aws.amazon.com/blogs/storage/how-to-accelerate-your-data-transfers-with-aws-datasync-scale-out-architectures/).

![\[Diagram yang menunjukkan satu pendekatan DataSync untuk mempartisi data sumber Anda untuk membantu mempercepat migrasi besar.\]](http://docs.aws.amazon.com/id_id/datasync/latest/userguide/images/datasync-partition-by-folder.png)


## Mempartisi dataset Anda berdasarkan folder atau awalan
<a name="configure-task-by-folder"></a>

Saat membuat lokasi DataSync sumber, Anda dapat menentukan folder, direktori, atau awalan yang DataSync berbunyi. Misalnya, jika Anda memigrasikan berbagi file dengan direktori tingkat atas, Anda dapat membuat beberapa lokasi yang menentukan jalur direktori yang berbeda. Anda kemudian dapat menggunakan lokasi ini untuk menjalankan beberapa DataSync tugas selama migrasi.

## Mempartisi dataset Anda dengan filter
<a name="configure-task-with-filters"></a>

Anda dapat menerapkan [filter](filtering.md) untuk menyertakan atau mengecualikan data dari lokasi sumber Anda dalam transfer. Dalam konteks migrasi besar, filter dapat membantu Anda menjangkau tugas ke bagian tertentu dari kumpulan data Anda.

Misalnya, jika Anda memigrasikan data arsip yang diatur berdasarkan tahun, Anda dapat membuat filter sertakan agar cocok untuk tahun tertentu atau beberapa tahun. Anda juga dapat memodifikasi filter setiap kali Anda menjalankan tugas agar sesuai dengan tahun yang berbeda.

## Mempartisi kumpulan data Anda dengan manifes
<a name="configure-task-with-manifest"></a>

[Manifes](transferring-with-manifest.md) adalah daftar file atau objek yang DataSync ingin Anda transfer. Dengan manifes, DataSync tidak harus membaca semuanya di lokasi sumber untuk menentukan apa yang akan ditransfer.

Anda dapat membuat manifes dari inventaris penyimpanan sumber Anda atau melalui pendekatan berbasis peristiwa (misalnya, lihat [Menerapkan AWS DataSync dengan ratusan juta objek](https://aws.amazon.com/blogs/storage/implementing-aws-datasync-with-hundreds-of-millions-of-objects/)). Anda juga dapat menggunakan manifes yang berbeda setiap kali memulai tugas, memungkinkan Anda mentransfer kumpulan data yang berbeda dengan tugas yang sama.

# Menjalankan tugas DataSync transfer Anda
<a name="datasync-large-migration-running-tasks"></a>

Selama setiap gelombang migrasi Anda, transfer data Anda biasanya mengikuti proses umum yang sama:

1. Jalankan transfer penuh awal data Anda.

1. Verifikasi data di tujuan.

1. Jalankan transfer tambahan untuk data apa pun yang mungkin telah berubah sejak transfer awal.

1. Potong operasi ke lokasi tujuan Anda.

1. Tinjau hasil cutover.

## Menjalankan tugas Anda
<a name="datasync-large-migration-running-tasks-how-to"></a>

Anda mungkin perlu menjalankan tugas DataSync transfer Anda selama jam kerja untuk meminimalkan waktu migrasi Anda secara keseluruhan. Adalah umum dalam situasi ini untuk menjalankan transfer penuh awal diikuti oleh transfer tambahan yang memperhitungkan perubahan lokasi sumber Anda dari pengguna dan aplikasi.

Untuk menghindari masalah terkait jaringan selama jam kerja, Anda dapat membatasi jumlah bandwidth yang digunakan tugas Anda. Untuk informasi selengkapnya, lihat [Menetapkan batas bandwidth untuk AWS DataSync tugas Anda](configure-bandwidth.md).

1. Jalankan transfer penuh awal:

   1. [Mulai DataSync tugas Anda](run-task.md) (atau tugas jika Anda menjalankan tugas secara paralel).

   1. Pantau kemajuan dan kinerja eksekusi tugas Anda.

   1. Verifikasi bahwa data Anda ditransfer seperti yang Anda harapkan (misalnya, metadata file dipertahankan).

1. Jalankan transfer tambahan:

   1. [Jadwalkan tugas Anda](task-scheduling.md) untuk dijalankan secara berkala.

   1. Pantau eksekusi tugas Anda dan perbaiki kesalahan jika ditemui.

## Melakukan cutover
<a name="datasync-migration-cutting-over-how-to"></a>

Setelah transfer awal dan tambahan Anda, Anda dapat memulai proses memotong operasi ke lokasi tujuan Anda.

1. Mulai jendela pemeliharaan terjadwal.

1. Perbarui sistem penyimpanan sumber Anda untuk dibaca hanya untuk aplikasi dan pengguna.

1. Jalankan transfer tambahan akhir untuk menyalin delta yang tersisa antara lokasi sumber dan tujuan Anda.

1. Melakukan validasi data menyeluruh (misalnya, dengan meninjau CloudWatch log dan [laporan tugas](task-reports.md)).

1. Alihkan aplikasi dan pengguna Anda ke lingkungan baru di lokasi tujuan Anda.

1. Uji fungsionalitas aplikasi dan pastikan pengguna dapat mengakses data di lokasi tujuan Anda.

1. Jadwalkan pertemuan retrospektif untuk meninjau transfer dengan tim migrasi. Ajukan contoh pertanyaan menyelidik berikut:
   + Apakah cutover berhasil? Jika tidak, apa masalahnya?
   + Apakah kita menggunakan semua bandwidth yang tersedia?
   + Apakah penyimpanan sumber dan tujuan dimanfaatkan sepenuhnya?
   + Bisakah kita mendapatkan lebih banyak throughput data dengan tugas tambahan?
   + Apakah kita perlu merencanakan jendela perawatan yang lebih lama?

1. Jika perlu, perbarui rencana migrasi Anda sebelum memulai gelombang berikutnya.

# Memantau transfer Anda
<a name="datasync-large-migration-monitoring"></a>

AWS DataSync menyediakan beberapa opsi pemantauan untuk membantu Anda memvalidasi dan men-debug transfer Anda.

## Memantau transfer Anda dengan CloudWatch metrik
<a name="datasync-migration-monitoring-cloudwatch-metrics"></a>

Anda dapat membuat CloudWatch dasbor khusus dengan metrik dari eksekusi DataSync tugas Anda. Untuk informasi selengkapnya, lihat [Memantau transfer data dengan CloudWatch metrik Amazon](monitor-datasync.md).

## Memantau transfer Anda dengan laporan tugas
<a name="datasync-migration-monitoring-task-reports"></a>

Jika Anda mentransfer jutaan file atau objek, pertimbangkan untuk menggunakan laporan tugas. Laporan tugas memberikan informasi terperinci tentang DataSync upaya untuk mentransfer, melewati, memverifikasi, dan menghapus selama pelaksanaan tugas. Untuk informasi selengkapnya, lihat [Memantau transfer data Anda dengan laporan tugas](task-reports.md).

Anda juga dapat memvisualisasikan laporan tugas Anda dengan menggunakan AWS layanan seperti AWS Glue, Amazon Athena, dan Amazon Quick. Untuk informasi selengkapnya, lihat [Blog AWS Penyimpanan](https://aws.amazon.com/blogs/storage/derive-insights-from-aws-datasync-task-reports-using-aws-glue-amazon-athena-and-amazon-quicksight/).

## Memantau transfer Anda dengan CloudWatch Log
<a name="datasync-migration-monitoring-cloudwatch-logs"></a>

Minimal, kami menyarankan Anda mengonfigurasi tugas Anda untuk mencatat informasi dasar dan mentransfer kesalahan. Untuk informasi lebih lanjut, lihat[Memantau transfer data dengan Amazon CloudWatch Logs](configure-logging.md). 