Menyeimbangkan beban kerja - FSxuntuk ONTAP

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menyeimbangkan beban kerja

Jika Anda memiliki sistem file dengan beberapa pasangan ketersediaan tinggi (HA), maka throughput dan penyimpanannya tersebar di setiap pasangan HA Anda. FSx untuk ONTAP secara otomatis menyeimbangkan file Anda saat ditulis ke sistem file Anda, tetapi data beban kerja dan I/O Anda tidak lagi seimbang setelah Anda menambahkan pasangan HA. Selain itu, dalam kasus yang jarang terjadi, data beban kerja atau I/O Anda dapat menjadi tidak seimbang di seluruh pasangan HA sistem file Anda yang ada, yang dapat memengaruhi kinerja keseluruhan beban kerja Anda. Jika beban kerja Anda tidak seimbang, Anda dapat menyeimbangkannya kembali di setiap pasangan HA sistem file Anda (dan server dan agregat file yang sepadan — kumpulan penyimpanan yang membentuk tingkat penyimpanan utama Anda).

Saldo pemanfaatan penyimpanan primer

Kapasitas penyimpanan utama sistem file Anda dibagi secara merata di antara masing-masing pasangan HA Anda di kumpulan penyimpanan yang disebut agregat. Setiap pasangan HA memiliki satu agregat. Kami menyarankan Anda mempertahankan pemanfaatan rata-rata tidak lebih dari 80% untuk tingkat penyimpanan utama Anda secara berkelanjutan. Untuk sistem file dengan beberapa pasangan HA, kami menyarankan Anda mempertahankan pemanfaatan rata-rata hingga 80% untuk setiap agregat.

Mempertahankan pemanfaatan 80% memastikan ada ruang kosong untuk data baru yang masuk, dan mempertahankan overhead yang sehat untuk operasi pemeliharaan yang sementara dapat mengklaim ruang kosong pada agregat Anda.

Jika Anda melihat bahwa agregat Anda tidak seimbang, Anda dapat meningkatkan kapasitas penyimpanan utama sistem file Anda (sepadan meningkatkan kapasitas penyimpanan setiap agregat), atau Anda dapat memindahkan volume Anda antar agregat. Untuk informasi selengkapnya, lihat Memindahkan volume antar agregat.

Ketidakseimbangan pemanfaatan kinerja file server dan disk

Kemampuan kinerja total sistem file Anda (seperti throughput jaringan, file server ke throughput disk dan IOPS, dan IOPS disk) dibagi secara merata di antara pasangan HA sistem file Anda. Kami menyarankan Anda mempertahankan pemanfaatan rata-rata di bawah 50% (dan pemanfaatan puncak maksimum di bawah 80%) untuk semua batas kinerja secara berkelanjutan—ini berlaku untuk pemanfaatan keseluruhan sumber daya server file sistem file Anda di semua pasangan HA, serta pada basis server per file.

Jika Anda melihat bahwa pemanfaatan kinerja server file Anda tidak seimbang—dan server file di mana beban kerja Anda tidak seimbang memiliki pemanfaatan berkelanjutan lebih dari 80% —Anda dapat menggunakan ONTAP CLI dan REST API untuk mendiagnosis lebih lanjut penyebab ketidakseimbangan kinerja dan memperbaikinya. Berikut ini adalah tabel indikator ketidakseimbangan yang mungkin dan langkah selanjutnya untuk diagnosis lebih lanjut.

Jika sistem file Anda... Maka...

Throughput disk server file atau IOPS disk server file tidak seimbang

Anda mungkin mengalami hotspotting I/O pada subset pasangan HA (subset volume Anda yang berisi sejumlah besar data yang diakses) yang dapat membatasi kinerja keseluruhan beban kerja Anda karena terhambat terhadap subset pasangan HA. Untuk setiap server file yang sangat digunakan, periksa volume yang paling banyak digunakan untuk melihat volume mana yang memiliki aktivitas paling banyak dalam agregat. Untuk informasi lebih lanjut tentang prosedur ini, lihatMenyeimbangkan kembali volume.

Throughput jaringan tidak seimbang, tetapi throughput disk server file Anda, IOPS disk server file, atau IOPS disk Anda tidak seimbang

Data Anda didistribusikan secara merata di seluruh pasangan HA, tetapi klien Anda tidak. Untuk server file yang memiliki lebih banyak pemanfaatan throughput jaringan daripada yang lain, periksa klien teratas untuk setiap server file, kemudian menyeimbangkan kembali klien tersebut dengan melepas volume apa pun dari klien tersebut dan mengatur ulang mereka menggunakan titik akhir yang berbeda pada pasangan HA yang berbeda. Untuk informasi lebih lanjut tentang prosedur ini, lihatMenyeimbangkan kembali klien.

Memetakan CloudWatch dimensi ke sumber daya ONTAP CLI dan REST API

Sistem file generasi kedua Anda memiliki CloudWatch metrik Amazon dengan dimensi atau. FileServer Aggregate Untuk mendiagnosis lebih lanjut kasus ketidakseimbangan, Anda perlu memetakan nilai dimensi ini ke server file tertentu (atau node) dan agregat di ONTAP CLI atau REST API.

  • Untuk server file, setiap nama server file memetakan ke nama server file (atau node) di ONTAP (misalnya,FsxId01234567890abcdef-01). Server file bernomor ganjil adalah server file yang disukai (yaitu, mereka melayani lalu lintas kecuali sistem file gagal ke server file sekunder), sedangkan server file bernomor genap adalah server file sekunder (yaitu, mereka melayani lalu lintas hanya ketika mitra mereka tidak tersedia). Karena itu, server file sekunder biasanya akan menunjukkan pemanfaatan yang lebih sedikit daripada server file pilihan.

  • Untuk agregat, setiap nama agregat memetakan ke agregat di ONTAP (misalnya,). aggr1 Ada satu agregat untuk setiap pasangan HA, artinya agregat aggr1 dibagikan oleh server file FsxId01234567890abcdef-01 (server file aktif) dan FsxId01234567890abcdef-02 (server file sekunder) dalam pasangan HA, agregat aggr2 dibagikan oleh server file FsxId01234567890abcdef-03 danFsxId01234567890abcdef-04, dan seterusnya.

Anda dapat melihat pemetaan antara semua agregat dan server file menggunakan CLI ONTAP.

  1. Untuk SSH ke NetApp CLI ONTAP sistem file Anda, ikuti langkah-langkah yang didokumentasikan di bagian Panduan Pengguna Amazon FSx untuk ONTAP. Menggunakan CLI NetApp ONTAP NetApp

    ssh fsxadmin@file-system-management-endpoint-ip-address
  2. Gunakan perintah show agregat penyimpanan, tentukan parameternya-fields node.

    ::> storage aggregate show -fields node aggregate node ------------------------------- ------------------------- aggr1 FsxId01234567890abcdef-01 aggr2 FsxId01234567890abcdef-03 aggr3 FsxId01234567890abcdef-05 aggr4 FsxId01234567890abcdef-07 aggr5 FsxId01234567890abcdef-09 aggr6 FsxId01234567890abcdef-11 6 entries were displayed.

Menyeimbangkan kembali klien

Setelah menambahkan pasangan HA atau jika Anda mengalami ketidakseimbangan I/O di seluruh server file (khususnya dengan pemanfaatan throughput jaringan), Anda dapat menyeimbangkan kembali klien Anda. Jika Anda menyeimbangkan kembali klien setelah menambahkan pasangan HA, Anda dapat melompat ke. Remounting klien Jika tidak, Anda harus terlebih dahulu mengidentifikasi klien dengan lalu lintas tinggi yang ingin Anda pindahkan untuk menyeimbangkan kembali I/O beban kerja Anda.

Jika Anda mengalami ketidakseimbangan I/O di seluruh server file (khususnya dengan pemanfaatan throughput Jaringan), klien I/O yang tinggi mungkin menjadi penyebabnya. Untuk mengidentifikasi klien dengan lalu lintas tinggi, gunakan ONTAP CLI.

Identifikasi klien dengan lalu lintas tinggi
  1. Untuk SSH ke NetApp CLI ONTAP sistem file Anda, ikuti langkah-langkah yang didokumentasikan di bagian Panduan Pengguna Amazon FSx untuk ONTAP. Menggunakan CLI NetApp ONTAP NetApp

    ssh fsxadmin@file-system-management-endpoint-ip-address
  2. Untuk melihat klien dengan lalu lintas tertinggi, gunakan statistik klien teratas yang menunjukkan perintah CLI ONTAP. Anda dapat secara opsional menentukan -node parameter untuk hanya melihat klien teratas untuk server file tertentu. Jika Anda mendiagnosis ketidakseimbangan untuk server file tertentu, gunakan -node parameter, ganti node_name dengan nama server file (misalnya,FsxId01234567890abcdef-01).

    Anda dapat menambahkan -interval parameter secara opsional, memberikan interval untuk mengukur (dalam detik) sebelum setiap laporan dikeluarkan. Meningkatkan interval (misalnya, hingga maksimum 300 detik) memberikan sampel jangka panjang untuk jumlah lalu lintas yang didorong ke setiap volume. Defaultnya adalah 5 (detik).

    ::> statistics top client show -node FsxId01234567890abcdef-01 [-interval [5,300]]

    Dalam output, klien teratas ditunjukkan oleh alamat IP dan port mereka.

    *Total Total Client Vserver Node Ops (Bps) ------------------ --------- ------------------------- ------ --------- 172.17.236.53:938 svm01 FsxId01234567890abcdef-01 2143 140443648 172.17.236.160:898 svm02 FsxId01234567890abcdef-01 812 53215232
Remounting klien
  • Anda dapat menyeimbangkan kembali klien ke pasangan HA lainnya. Untuk melakukannya, lepaskan volume dari klien dan pasang kembali menggunakan nama DNS untuk titik akhir NFS/SMB SVM—ini mengembalikan titik akhir acak yang sesuai dengan pasangan HA acak.

    Kami menyarankan Anda menggunakan kembali nama DNS, tetapi Anda memiliki opsi untuk secara eksplisit memilih pasangan HA mana yang dipasang klien tertentu. Untuk menjamin bahwa Anda memasang klien ke titik akhir yang berbeda, Anda dapat menentukan alamat IP titik akhir yang berbeda dari yang sesuai dengan server file yang mengalami lalu lintas tinggi. Anda dapat melakukannya dengan menjalankan perintah berikut:

    ::> network interface show -vserver svm_name -lif nfs_smb_management* -fields address,curr-node vserver lif address curr-node --------- -------------------- ------------ ------------------------- svm01 nfs_smb_management_1 172.31.15.89 FsxId01234567890abcdef-01 svm01 nfs_smb_management_3 172.31.8.112 FsxId01234567890abcdef-03 2 entries were displayed.

    Menurut contoh output untuk statistics top client show perintah, klien 172.17.236.53 mengarahkan lalu lintas tinggi keFsxId01234567890abcdef-01. Output dari network interface show perintah menunjukkan ini adalah alamatnya172.31.15.89. Untuk me-mount ke titik akhir yang berbeda, pilih alamat lain (dalam contoh ini, satu-satunya alamat lainnya adalah172.31.8.112, sesuai denganFsxId01234567890abcdef-03).

Menyeimbangkan kembali volume

Jika Anda mengalami ketidakseimbangan I/O di seluruh volume atau agregat, Anda dapat menyeimbangkan kembali volume untuk mendistribusikan kembali lalu lintas I/O di seluruh volume Anda.

catatan

Jika Anda mengalami ketidakseimbangan pemanfaatan penyimpanan di seluruh agregat Anda, umumnya tidak ada dampak kinerja kecuali pemanfaatan yang tinggi digabungkan dengan ketidakseimbangan I/O. Meskipun Anda dapat memindahkan volume antar agregat untuk menyeimbangkan pemanfaatan penyimpanan, kami sarankan hanya memindahkan volume jika Anda melihat dampak kinerja, karena volume bergerak dapat berdampak buruk pada kinerja jika Anda juga tidak mempertimbangkan I/O yang didorong ke setiap volume yang Anda pertimbangkan untuk dipindahkan.

  1. Untuk SSH ke NetApp CLI ONTAP sistem file Anda, ikuti langkah-langkah yang didokumentasikan di bagian Panduan Pengguna Amazon FSx untuk ONTAP. Menggunakan CLI NetApp ONTAP NetApp

    ssh fsxadmin@file-system-management-endpoint-ip-address
  2. Gunakan perintah statistik volume show ONTAP CLI untuk melihat volume lalu lintas tertinggi untuk agregat tertentu, dengan perubahan berikut:

    • Ganti aggregate_name dengan nama agregat (misalnya,). aggr1

    • Anda dapat menambahkan -interval parameter secara opsional, memberikan interval untuk mengukur (dalam detik) sebelum setiap laporan dikeluarkan. Meningkatkan interval (misalnya, hingga maksimum 300 detik) memberikan sampel jangka panjang untuk jumlah lalu lintas yang didorong ke setiap volume. Defaultnya adalah 5 (detik).

    ::> statistics volume show -aggregate aggregate_name -sort-key total_ops [-interval [5,300]]

    Tergantung pada interval yang Anda pilih, dibutuhkan waktu hingga 5 menit untuk menampilkan data. Perintah menunjukkan semua volume dalam agregat, bersama dengan jumlah lalu lintas yang didorong ke setiap agregat.

    *Total Read Write Other Read Write Latency Volume Vserver Aggregate Ops Ops Ops Ops (Bps) (Bps) (us) ---------- ------- --------- ------ ---- ----- ----- --------- ----- ------- vol1__0007 svm1 aggr1 4078 4078 0 0 267255808 0 1092 vol1__0005 svm1 aggr1 4078 4078 0 0 267255808 0 1086 vol1__0003 svm1 aggr1 4077 4077 0 0 267223040 0 1086 vol1__0001 svm1 aggr1 4077 4077 0 0 267239424 0 1087 vol1__0008 svm1 aggr2 2314 2314 0 0 151650304 0 1112 vol1__0006 svm1 aggr2 2144 2144 0 0 140509184 0 1104 vol1__0002 svm1 aggr2 2183 2183 0 0 143065088 0 1106 vol1__0004 svm1 aggr2 2183 2183 0 0 143065088 0 1103

    Statistik volume ditampilkan berdasarkan per-konstituen (misalnya, vol1__0015 adalah konstituen ke-15 untuk). FlexGroup vol1 Anda dapat melihat dari contoh output, konstituen untuk lebih banyak aggr1 digunakan daripada konstituen untuk. aggr2 Untuk menyeimbangkan lalu lintas antar agregat, Anda dapat memindahkan volume konstituen antar agregat sehingga lalu lintas lebih merata.

  3. Jika Anda telah menambahkan pasangan HA baru, maka Anda harus memindahkan volume yang ada ke agregat baru. Untuk informasi selengkapnya, lihat Memindahkan volume antar agregat.