Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Remediasi peringatan otomatis AMS
Setelah verifikasi, AWS Managed Services (AMS) secara otomatis memulihkan peringatan tertentu sesuai dengan kondisi dan proses tertentu yang dijelaskan di bagian ini.
| Nama peringatan | Deskripsi | Ambang batas | Tindakan |
|---|---|---|---|
Saluran aman rusak |
Alarm Saluran Aman Rusak dipicu pada Instans EC2 Windows ketika instans kehilangan koneksi dengan Pengontrol Domain AD. |
Ambang batas berada di atas nilai yang ditentukan 10 kali dalam 15 menit terakhir. |
Remediasi otomatis AMS memvalidasi bahwa instance sedang online di SSM, nama host tidak diduplikasi, dan Objek Komputer AD selaras dengan tumpukan. CloudFormation Remediasi memperbaiki koneksi saluran aman untuk memulihkan akses ke instance. |
Pemeriksaan Status Gagal |
Kemungkinan kegagalan perangkat keras atau keadaan kesalahan instance. |
Sistem telah mendeteksi status gagal setidaknya sekali dalam 15 menit terakhir. |
Remediasi otomatis AMS pertama kali memvalidasi jika instance dapat diakses. Jika instance tidak dapat diakses, maka instance dihentikan dan dimulai ulang. Stop and start memungkinkan instance untuk bermigrasi ke perangkat keras baru yang mendasarinya. Untuk informasi lebih lanjut, lihat bagian berikut “Otomatisasi Remediasi Kegagalan Pemeriksaan Status EC2.” |
AMSLinuxDiskUsage |
Picu saat penggunaan disk 1 titik pemasangan (ruang yang ditentukan pada volume) pada instans EC2 Anda terisi. |
Ambang batas berada di atas nilai yang ditentukan 6 kali pada 30 menit terakhir. |
Remediasi otomatis AMS pertama menghapus file sementara. Jika itu tidak membebaskan ruang disk yang cukup, itu memperpanjang volume untuk mencegah downtime jika volume menjadi penuh. |
AMSWindowsDiskUsage |
Saat penggunaan disk dari 1 titik pemasangan (ruang yang ditentukan pada volume) pada instans EC2 Anda terisi. |
Ambang batas berada di atas nilai yang ditentukan 6 kali selama 30 menit terakhir. |
Remediasi otomatis AMS pertama menghapus file sementara. Jika itu tidak membebaskan ruang disk yang cukup, itu memperpanjang volume untuk mencegah downtime jika volume menjadi penuh. |
RDS-EVENT-0089 |
Instans DB telah mengonsumsi lebih dari 90% dari penyimpanan yang dialokasikan. |
Penyimpanan lebih dari 90% dialokasikan. |
Remediasi otomatis AMS pertama-tama memvalidasi bahwa DB berada dalam keadaan yang dapat dimodifikasi dan tersedia atau penuh penyimpanan. Kemudian mencoba untuk meningkatkan penyimpanan yang dialokasikan, IOPS, dan throughput penyimpanan melalui changeset. CloudFormation Jika stack drift sudah terdeteksi, itu jatuh kembali ke RDS API untuk mencegah downtime. Fitur ini dapat dipilih keluar dengan menambahkan tag berikut ke Instans RDS DB: |
RDS-EVENT-0007 |
Penyimpanan yang dialokasikan untuk instans DB telah habis. Untuk mengatasinya, alokasikan penyimpanan tambahan. |
Penyimpanan dialokasikan 100%. |
Remediasi otomatis AMS pertama-tama memvalidasi bahwa DB berada dalam keadaan yang dapat dimodifikasi dan tersedia atau penuh penyimpanan. Kemudian mencoba untuk meningkatkan penyimpanan yang dialokasikan, IOPS, dan throughput penyimpanan melalui changeset. CloudFormation Jika stack drift sudah terdeteksi, itu jatuh kembali ke RDS API untuk mencegah downtime. Fitur ini dapat dipilih keluar dengan menambahkan tag berikut ke Instans RDS DB: |
RDS-EVENT-0224 |
Penyimpanan yang dialokasikan yang diminta mencapai atau melebihi ambang batas penyimpanan maksimum yang dikonfigurasi. |
Ambang penyimpanan maksimum untuk instans DB telah habis atau lebih besar dari atau sama dengan penyimpanan yang dialokasikan yang diminta. |
Remediasi otomatis AMS pertama-tama memvalidasi bahwa jumlah penyimpanan RDS yang diminta akan melanggar ambang penyimpanan maksimal. Jika dikonfirmasi, AMS mencoba meningkatkan ambang penyimpanan maksimal sebesar 30% dengan CloudFormation set perubahan, atau mengarahkan RDS API jika sumber daya tidak disediakan. CloudFormation Fitur ini dapat dipilih keluar dengan menambahkan tag berikut ke Instans RDS DB: |
Kapasitas penyimpanan RDS |
Kurang dari 1GB tersisa di penyimpanan yang dialokasikan untuk instans DB. |
Penyimpanan dialokasikan 99%. |
Remediasi otomatis AMS pertama-tama memvalidasi bahwa DB berada dalam keadaan yang dapat dimodifikasi dan tersedia atau penuh penyimpanan. Kemudian mencoba untuk meningkatkan penyimpanan yang dialokasikan, IOPS, dan throughput penyimpanan melalui changeset. CloudFormation Jika stack drift sudah terdeteksi, itu jatuh kembali ke RDS API untuk mencegah downtime. Fitur ini dapat dipilih keluar dengan menambahkan tag berikut ke Instans RDS DB: |
AMSFSXONTAPVolumeCapacityUtilization |
Amazon FSx untuk volume NetApp ONTAP telah mengkonsumsi lebih dari penyimpanan default yang dialokasikan (80%). |
FSx untuk Pemanfaatan Kapasitas Volume ONTAP lebih besar dari 80% selama dua jam (nilai default). |
Remediasi otomatis AMS pertama-tama memvalidasi bahwa status siklus hidup volume berada dalam status yang dapat dimodifikasi, kemudian memperluas ukuran volume sebesar 10% saat memverifikasi terhadap kapasitas maksimum sistem file. Jika sistem file tidak memiliki kapasitas penyimpanan yang cukup untuk ekspansi volume, baik volume dan sistem file diperluas bersama-sama. Ekspansi ini dibatasi maksimal tiga kali dalam periode tujuh hari. Batas penyimpanan maksimum yang diperluas AMS Automation adalah 5120 GiB. catatanJika iSCSI LUN dikonfigurasi di atas volume, perluas iSCSI LUN di tingkat sistem operasi. Untuk informasi selengkapnya, lihat Mengapa saya FSx untuk ONTAP LUN dalam mode hanya-baca |
Saluran Aman Rusak Amazon EC2: Catatan otomatisasi remediasi
Sebelum remediasi otomatis AWS Managed Services (AMS) melakukan remediasi pada Amazon EC2 Windows Broken Secure Channel, otomatisasi melakukan pra-pemeriksaan berikut dan membuat laporan insiden untuk penyelidikan lebih lanjut:
Memvalidasi bahwa status SSM instans Amazon EC2 adalah “Online.”
Memvalidasi apakah instans Amazon EC2 merupakan bagian dari grup Auto Scaling dan apakah semua instance dalam grup Auto Scaling memiliki nama host yang sama.
Memeriksa apakah instans Amazon EC2 adalah bagian dari CloudFormation tumpukan yang digunakan untuk menyediakannya. Jika instance telah dihapus dari CloudFormation tumpukan, otomatisasi memverifikasi apakah Active Directory Organizational Unit (OU) terkait masih mereferensikan tumpukan.
Setelah validasi di atas berlalu, otomatisasi berlanjut untuk memulihkan saluran Broken Secure.
Langkah-langkah Remediasi:
Remediasi otomatis mencoba memperbaiki saluran aman antara instans EC2 dan Domain AD, memulihkan akses ke instans.
Pasca remediasi otomatisasi memeriksa apakah saluran aman dibuat. Jika tidak berhasil, AMS membuat insiden dan melibatkan operasi AMS untuk menyelidiki.
Kegagalan pemeriksaan status EC2: Catatan otomatisasi remediasi
Cara kerja remediasi otomatis AMS dengan masalah kegagalan pemeriksaan status EC2:
Jika instans Amazon EC2 Anda tidak dapat dijangkau, instans harus dihentikan dan dimulai lagi sehingga dapat dimigrasikan ke perangkat keras baru dan dipulihkan.
Jika akar masalahnya ada di dalam OS (perangkat yang hilang di fstab, korupsi kernel, dan sebagainya), otomatisasi tidak dapat memulihkan instance Anda.
Jika instans Anda termasuk dalam grup Auto Scaling, otomatisasi tidak memerlukan tindakan—tindakan AutoScalingGroup penskalaan menggantikan instance.
Jika instans Anda mengaktifkan EC2 Auto Recovery, remediasi tidak akan mengambil tindakan.
Otomatisasi remediasi penggunaan volume EC2
Cara kerja remediasi otomatis AWS Managed Services (AMS) dengan masalah penggunaan volume EC2:
Otomatisasi pertama memvalidasi jika ekspansi volume diperlukan dan jika dapat dilakukan. Jika ekspansi dianggap tepat, otomatisasi dapat meningkatkan kapasitas volume. Proses otomatis ini menyeimbangkan kebutuhan akan pertumbuhan dengan ekspansi yang terkendali dan terbatas.
Sebelum memperluas volume, otomatisasi melakukan tugas pembersihan (Windows: Disk Cleaner, Linux: Logrotate+Penghapusan Log Agen Manajer Layanan Sederhana) pada instance untuk mencoba mengosongkan ruang.
catatan
Tugas pembersihan tidak dijalankan pada instance keluarga EC2 “T” karena ketergantungan mereka pada kredit CPU untuk fungsionalitas lanjutan.
Di Linux, otomatisasi hanya mendukung perluasan sistem file tipe EXT2, EXT3, EXT4 dan XFS.
Pada Windows, otomatisasi hanya mendukung New Technology File System (NTFS) dan Resilient File System (ReFS).
Otomatisasi tidak memperluas volume yang merupakan bagian dari Logical Volume Manager (LVM) atau array RAID.
Otomatisasi tidak memperluas volume penyimpanan instance.
Otomatisasi tidak mengambil tindakan jika volume yang terpengaruh sudah lebih besar dari 2 TiB.
Ekspansi melalui otomatisasi dibatasi maksimal tiga kali per minggu dan lima kali total selama masa pakai sistem.
Otomatisasi tidak memperluas volume jika ekspansi sebelumnya terjadi dalam enam jam terakhir.
Ketika aturan ini mencegah otomatisasi mengambil tindakan, AMS menghubungi Anda melalui permintaan layanan keluar untuk menentukan tindakan selanjutnya yang harus diambil.
Otomatisasi remediasi acara penyimpanan rendah Amazon RDS
Cara kerja remediasi otomatis AWS Managed Services (AMS) dengan masalah peristiwa penyimpanan rendah Amazon RDS:
Sebelum mencoba memperluas penyimpanan instans Amazon RDS, otomatisasi melakukan beberapa pemeriksaan untuk memastikan instans Amazon RDS berada dalam status yang dapat dimodifikasi dan tersedia, atau penuh penyimpanan.
Di mana CloudFormation stack drift terdeteksi, remediasi terjadi melalui Amazon RDS API.
-
Bergantung pada peristiwa pemicu, remediasi memodifikasi properti
MaxAllocatedStorage,,AllocatedStorage,Iopsatau.StorageThroughputProperti instans Amazon RDS lainnya tidak dimodifikasi. Untuk informasi selengkapnya, lihat Pengaturan untuk instans DB. Tindakan remediasi tidak berjalan dalam skenario berikut:
Status instans Amazon RDS tidak “tersedia” atau “penuh penyimpanan”.
Penyimpanan instans Amazon RDS saat ini tidak dapat dimodifikasi (seperti ketika penyimpanan telah dimodifikasi dalam enam jam terakhir).
Instans Amazon RDS memiliki penyimpanan auto-scaling yang diaktifkan.
Remediasi terbatas pada satu ekspansi per enam jam dan tidak lebih dari tiga ekspansi dalam periode empat belas hari bergulir.
Ketika skenario ini terjadi, AMS menghubungi Anda dengan insiden keluar untuk menentukan tindakan selanjutnya.
Otomatisasi remediasi kapasitas volume ONTAP
Cara kerja remediasi otomatis AWS Managed Services (AMS) dengan masalah kapasitas volume ONTAP:
Sebelum memperluas volume, otomatisasi memvalidasi bahwa status siklus hidup volume berada dalam keadaan yang dapat dimodifikasi.
Otomatisasi memperluas ukuran volume sebesar 10% sambil memverifikasi terhadap kapasitas maksimum sistem file.
Jika sistem file tidak memiliki kapasitas penyimpanan yang cukup untuk mengakomodasi ekspansi volume, volume dan kapasitas sistem file diperluas.
Remediasi dibatasi tidak lebih dari tiga pembaruan dalam periode tujuh hari.
Batas penyimpanan maksimum yang diperluas AMS Automation adalah 5120 GiB.
Jika iSCSI LUN dikonfigurasi di atas volume, Anda harus memperluas iSCSI LUN secara manual di tingkat OS setelah remediasi otomatis selesai. Untuk informasi selengkapnya, lihat Mengapa saya FSx untuk ONTAP LUN dalam mode hanya-baca
?