Memecahkan masalah kinerja Amazon EFS - Sistem File Elastis Amazon

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memecahkan masalah kinerja Amazon EFS

Secara umum, jika Anda mengalami masalah dengan Amazon EFS yang mengalami masalah dalam penyelesaian, konfirmasikan bahwa Anda menggunakan kernel Linux terbaru. Jika Anda menggunakan distribusi Linux perusahaan, kami merekomendasikan hal berikut:

  • Amazon Linux 2 dengan kernel 4.3 atau yang lebih baru

  • Amazon Linux 2015.09 atau yang lebih baru

  • RHEL7.3 atau yang lebih baru

  • Semua versi Ubuntu 16.04

  • Ubuntu 14.04 dengan kernel 3.13.0-83 atau yang lebih baru

  • SLES12 Sp2 atau yang lebih baru

Jika Anda menggunakan distribusi lain atau kernel khusus, kami merekomendasikan kernel versi 4.3 atau yang lebih baru.

catatan

RHEL6.9 mungkin kurang optimal untuk beban kerja tertentu karena. Kinerja buruk saat membuka banyak file secara paralel

Tidak dapat membuat sistem EFS berkas

Permintaan untuk membuat sistem EFS file gagal dengan pesan berikut:

User: arn:aws:iam::111122223333:user/username is not authorized to perform: elasticfilesystem:CreateFileSystem on the specified resource.
Tindakan yang harus diambil

Periksa kebijakan AWS Identity and Access Management (IAM) Anda untuk mengonfirmasi bahwa Anda berwenang untuk membuat sistem EFS file dengan kondisi sumber daya yang ditentukan. Untuk informasi selengkapnya, lihat Manajemen identitas dan akses untuk Amazon EFS.

Akses ditolak ke file yang diizinkan pada sistem NFS file

Ketika pengguna yang ditugaskan lebih dari 16 grup akses IDs (GIDs) mencoba untuk melakukan operasi pada sistem NFS file, mereka dapat ditolak akses ke file yang diizinkan pada sistem file. Masalah ini terjadi karena NFS protokol mendukung maksimum 16 GIDs per pengguna, dan tambahan apa pun GIDs dipotong dari permintaan NFS klien, seperti yang didefinisikan dalam RFC 5531.

Tindakan yang harus diambil

Merestrukturisasi pemetaan NFS pengguna dan grup Anda sehingga setiap pengguna ditetapkan tidak lebih dari 16 grup akses (). GIDs

Kesalahan saat mengakses konsol Amazon EFS

Bagian ini menjelaskan kesalahan yang mungkin dialami pengguna saat mengakses konsol EFS manajemen Amazon.

Kesalahan mengautentikasi kredensional untuk ec2:DescribeVPCs

Pesan galat berikut ditampilkan saat mengakses EFS konsol Amazon:

AuthFailure: An error occurred authenticating your credentials for ec2:DescribeVPCs.

Kesalahan ini menunjukkan bahwa kredensi login Anda tidak berhasil mengautentikasi dengan layanan Amazon. EC2 EFSKonsol Amazon memanggil EC2 layanan Amazon atas nama Anda saat membuat sistem EFS file VPC yang Anda pilih.

Tindakan yang harus diambil

Pastikan waktu klien mengakses EFS konsol Amazon diatur dengan benar.

EC2Instans Amazon hang

EC2Instans Amazon dapat hang karena Anda menghapus target pemasangan sistem file tanpa terlebih dahulu melepas sistem file.

Tindakan yang harus diambil

Sebelum Anda menghapus target pemasangan sistem file, lepaskan sistem file. Untuk informasi selengkapnya tentang melepas sistem EFS file Amazon Anda, lihatMelepaskan sistem file.

Aplikasi menulis sejumlah besar data hang

Aplikasi yang menulis sejumlah besar data ke Amazon EFS hang dan menyebabkan instance reboot.

Tindakan yang harus diambil

Jika aplikasi membutuhkan waktu terlalu lama untuk menulis semua datanya ke AmazonEFS, Linux mungkin reboot karena tampaknya prosesnya menjadi tidak responsif. Dua parameter konfigurasi kernel menentukan perilaku ini, kernel.hung_task_panic dankernel.hung_task_timeout_secs.

Dalam contoh berikut, keadaan proses hang dilaporkan oleh ps perintah dengan D sebelum instance reboot, menunjukkan bahwa proses sedang menunggu I/O.

$ ps aux | grep large_io.py root 33253 0.5 0.0 126652 5020 pts/3 D+ 18:22 0:00 python large_io.py /efs/large_file

Untuk mencegah reboot, tingkatkan periode batas waktu atau nonaktifkan kepanikan kernel saat tugas yang macet terdeteksi. Perintah berikut menonaktifkan kepanikan kernel tugas yang digantung di sebagian besar sistem Linux.

$ sudo sysctl -w kernel.hung_task_panic=0

Kinerja buruk saat membuka banyak file secara paralel

Aplikasi yang membuka banyak file secara paralel tidak mengalami peningkatan kinerja paralelisasi I/O yang diharapkan.

Tindakan yang harus diambil

Masalah ini terjadi pada klien Network File System versi 4 (NFSv4) dan pada RHEL 6 klien yang menggunakan NFSv4 .1 karena NFS klien ini membuat serial NFS OPEN dan CLOSE operasi. Gunakan NFS protokol versi 4.1 dan salah satu distribusi Linux yang disarankan yang tidak memiliki masalah ini.

Jika Anda tidak dapat menggunakan NFSv4 .1, ketahuilah bahwa klien Linux NFSv4 .0 membuat serial permintaan buka dan tutup berdasarkan ID pengguna dan grup. IDs Serialisasi ini terjadi meskipun beberapa proses atau beberapa utas mengeluarkan permintaan secara bersamaan. Klien hanya mengirim satu operasi buka atau tutup ke NFS server pada satu waktu, ketika semua IDs pertandingan. Untuk mengatasi masalah ini, Anda dapat melakukan salah satu tindakan berikut:

  • Anda dapat menjalankan setiap proses dari ID pengguna yang berbeda pada EC2 instance Amazon yang sama.

  • Anda dapat membiarkan pengguna sama IDs di semua permintaan terbuka, dan memodifikasi kumpulan grup IDs sebagai gantinya.

  • Anda dapat menjalankan setiap proses dari EC2 instans Amazon yang terpisah.

NFSPengaturan khusus yang menyebabkan penundaan penulisan

Anda memiliki pengaturan NFS klien khusus, dan dibutuhkan hingga tiga detik untuk EC2 instance Amazon untuk melihat operasi tulis yang dilakukan pada sistem file dari EC2 instans Amazon lainnya.

Tindakan yang harus diambil

Jika Anda mengalami masalah ini, Anda dapat menyelesaikannya dengan salah satu cara berikut:

  • Jika NFS klien di EC2 instans Amazon yang membaca data telah mengaktifkan caching atribut, lepaskan sistem file Anda. Kemudian pasang kembali dengan noac opsi untuk menonaktifkan caching atribut. Caching atribut di NFSv4 .1 diaktifkan secara default.

    catatan

    Menonaktifkan caching sisi klien berpotensi mengurangi kinerja aplikasi Anda.

  • Anda juga dapat menghapus cache atribut sesuai permintaan dengan menggunakan bahasa pemrograman yang kompatibel dengan NFS prosedur. Untuk melakukan ini, Anda dapat mengirim permintaan ACCESS prosedur segera sebelum permintaan baca.

    Misalnya, menggunakan bahasa pemrograman Python, Anda dapat membuat panggilan berikut.

    # Does an NFS ACCESS procedure request to clear the attribute cache, given a path to the file import os os.access(path, os.W_OK)

Membuat backup dengan Oracle Recovery Manager lambat

Membuat backup dengan Oracle Recovery Manager bisa lambat jika Oracle Recovery Manager berhenti selama 120 detik sebelum memulai pekerjaan backup.

Tindakan yang harus diambil

Jika Anda mengalami masalah ini, nonaktifkan Oracle DirectNFS, seperti yang dijelaskan dalam Mengaktifkan dan Menonaktifkan Kontrol NFS Klien Langsung NFS di Pusat Bantuan Oracle.

catatan

Amazon EFS tidak mendukung Oracle DirectNFS.