Tujuan tingkat layanan (SLO) - Amazon CloudWatch

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Tujuan tingkat layanan (SLO)

Anda dapat menggunakan Sinyal Aplikasi untuk membuat tujuan tingkat layanan bagi layanan-layanan untuk operasi bisnis penting Anda. Dengan membuat SLO pada layanan ini, Anda akan dapat melacaknya di dasbor SLO, memberi Anda at-a-glance gambaran tentang operasi terpenting Anda.

Selain membuat tampilan cepat yang dapat digunakan operator Anda untuk melihat status operasi kritis saat ini, Anda dapat menggunakan SLO untuk melacak performa jangka panjang layanan Anda, untuk memastikan bahwa layanan tersebut memenuhi harapan Anda. Jika Anda memiliki perjanjian tingkat layanan dengan pelanggan, SLO merupakan alat yang hebat untuk memastikan bahwa perjanjian tersebut terpenuhi.

Menilai kondisi kesehatan layanan Anda dengan SLO dimulai dengan menetapkan tujuan yang jelas dan terukur berdasarkan metrik-metrik performa utama— indikator tingkat layanan (SLI). SLO melacak performa SLI terhadap ambang batas dan sasaran yang Anda tetapkan, dan melaporkan seberapa jauh atau seberapa dekat performa aplikasi Anda dengan ambang batas.

Sinyal Aplikasi membantu Anda mengatur SLO pada metrik performa utama Anda. Sinyal Aplikasi secara otomatis mengumpulkan metrik Latency dan Availability untuk setiap layanan dan operasi yang ditemukannya, dan metrik-metrik ini seringkali ideal untuk digunakan sebagai SLI. Dengan pemandu pembuatan SLO, Anda dapat menggunakan metrik ini untuk SLO Anda. Anda kemudian dapat melacak status semua SLO Anda dengan menggunakan dasbor Sinyal Aplikasi.

Anda dapat mengatur SLO pada operasi tertentu yang dipanggil atau digunakan layanan Anda. Anda dapat menggunakan ekspresi CloudWatch metrik atau metrik apa pun sebagai SLI, selain menggunakan Latency dan Availability metrik.

Membuat SLO sangat penting untuk mendapatkan manfaat maksimal dari Sinyal CloudWatch Aplikasi. Setelah membuat SLO, Anda dapat melihat statusnya di konsol Sinyal Aplikasi untuk melihat layanan dan operasi penting Anda yang berperforma baik dan mana yang tidak sehat dengan cepat. Memiliki SLO untuk dilacak akan memberikan manfaat-manfaat utama berikut:

  • Lebih mudah bagi para operator layanan Anda untuk melihat kondisi kesehatan operasional saat ini dari layanan kritis yang diukur berdasarkan SLI. Kemudian mereka dapat dengan cepat melakukan penilaian awal dan mengidentifikasi layanan dan operasi yang sedang dalam kondisi tidak sehat.

  • Anda dapat melacak performa layanan Anda terhadap sasaran bisnis yang terukur dalam jangka waktu yang lebih lama.

Dengan memilih apa yang akan diatur SLO, Anda dapat memprioritaskan hal apa saja yang penting bagi Anda. Dasbor Sinyal Aplikasi secara otomatis akan menyajikan informasi mengenai apa yang telah Anda prioritaskan.

Saat Anda membuat SLO, Anda juga dapat memilih untuk membuat CloudWatch alarm pada saat yang sama untuk memantau SLO. Anda dapat mengatur alarm yang memantau terjadinya pelanggaran ambang batas, dan juga alarm untuk tingkat-tingkat peringatan. Alarm-alarm ini dapat secara otomatis memberikan notifikasi kepada Anda jika metrik-metrik SLO melanggar ambang batas yang Anda tetapkan, atau jika mendekati ambang peringatan. Misalnya, SLO yang mendekati ambang peringatannya dapat memberi tahu Anda bahwa tim Anda mungkin perlu memperlambat churn dalam aplikasi untuk memastikan bahwa tujuan performa jangka panjang terpenuhi.

Konsep-konsep SLO

Suatu SLO mencakup komponen-komponen berikut:

  • Indikator tingkat layanan (SLI), yang merupakan sebuah metrik performa utama yang Anda tentukan. Ini mewakili tingkat performa yang diinginkan untuk aplikasi Anda. Sinyal Aplikasi secara otomatis mengumpulkan metrik kunci Latency dan Availability untuk setiap layanan dan operasi yang ditemukannya, dan metrik-metrik kunci ini seringkali menjadi metrik yang ideal untuk mengatur SLO.

    Anda memilih ambang batas yang akan Anda gunakan untuk SLI Anda. Seperti, 200 ms untuk latensi.

  • Tujuan atau tujuan pencapaian, yang merupakan persentase waktu yang diharapkan SLI untuk memenuhi ambang batas selama setiap interval waktu. Interval waktu tersebut bisa dalam hitungan jam atau selama setahun.

    Interval dapat berupa interval kalender atau interval bergulir.

    • Interval kalender diselaraskan dengan kalender, seperti SLO yang dilacak per bulan. CloudWatch Secara otomatis menyesuaikan kesehatan, anggaran, dan angka pencapaian berdasarkan jumlah hari dalam sebulan. Interval kalender lebih cocok untuk tujuan-tujuan bisnis yang diukur berdasarkan kalender yang sudah diselaraskan.

    • Interval bergulir dihitung secara bergulir. Interval bergulir lebih cocok untuk melakukan pelacakan terhadap pengalaman pengguna terbaru dari aplikasi Anda.

  • Periode adalah jangka waktu yang lebih pendek, dan banyak periode membentuk interval. Performa aplikasi dibandingkan dengan SLI selama masing-masing periode dalam interval. Untuk setiap periode, aplikasi ditentukan telah mencapai atau tidak mencapai performa yang diperlukan.

Sebagai contoh, tujuan 99% dengan interval kalender satu hari dan periode 1 menit berarti bahwa aplikasi harus memenuhi atau mencapai ambang keberhasilan selama 99% dari periode 1 menit di siang hari. Jika ya, artinya SLO terpenuhi untuk hari itu. Hari berikutnya adalah interval evaluasi baru, dan aplikasi tersebut harus memenuhi atau mencapai ambang keberhasilan selama 99% dari periode 1 menit selama hari kedua untuk memenuhi SLO untuk hari kedua itu.

SLI dapat didasarkan pada salah satu metrik aplikasi standar baru yang dikumpulkan Sinyal Aplikasi. Atau, itu bisa berupa ekspresi CloudWatch metrik atau metrik apa pun. Metrik aplikasi standar yang dapat Anda gunakan untuk SLI adalah Latency dan Availability. Availability mewakili respons yang berhasil dibagi dengan total permintaan. Ini dihitung sebagai (1 - Tingkat Kegagalan)*100, di mana respons Kegagalan adalah kesalahan 5xx. Respons keberhasilan adalah respons tanpa kesalahan 5XX. Respons 4XX dianggap berhasil.

catatan

Saat ini hanya penghitungan berbasis periode yang didukung. Dukungan untuk penghitungan berbasis volume atau permintaan direncanakan untuk rilis masa depan.

Hitung anggaran kesalahan dan pencapaian

Ketika Anda melihat informasi tentang SLO, Anda melihat status kesehatan saat ini dan anggaran kesalahannya. Anggaran kesalahan adalah jumlah waktu dalam interval yang dapat menembus ambang batas tetapi tetap membiarkan SLO dipenuhi. Anggaran kesalahan total adalah jumlah total waktu pelanggaran yang dapat ditoleransi di seluruh interval. Sisa anggaran kesalahan adalah sisa jumlah waktu pelanggaran yang dapat ditoleransi selama interval saat ini. Ini setelah jumlah waktu pelanggaran yang telah terjadi telah dikurangi total anggaran kesalahan.

Gambar berikut menggambarkan konsep anggaran pencapaian dan kesalahan untuk suatu tujuan dengan interval 30 hari, periode 1 menit, dan tujuan pencapaian 99%. 30 hari mencakup 43.200 periode 1 menit. 99% dari 43.200 adalah 42.768, jadi 42.768 menit selama sebulan harus sehat agar SLO terpenuhi. Sejauh ini dalam interval saat ini, 130 dari periode 1 menit berada kondisi tidak sehat.

Menentukan keberhasilan dalam masing-masing periode

Dalam masing-masing periode, data SLI akan dikumpulkan menjadi satu titik data berdasarkan statistik yang digunakan untuk SLI. Titik data ini mewakili durasi periode seluruhnya. Titik data tunggal itu dibandingkan dengan ambang batas SLI untuk menentukan apakah periode tersebut dalam kondisi sehat, atau tidak. Melihat periode yang tidak sehat selama rentang waktu saat ini di dasbor dapat mengingatkan para operator layanan Anda bahwa layanan perlu diprioritaskan.

Jika periode ditentukan tidak sehat, seluruh panjang periode dihitung sebagai gagal terhadap anggaran kesalahan. Melacak anggaran kesalahan memungkinkan Anda mengetahui apakah layanan mencapai performa yang Anda inginkan dalam jangka waktu yang lebih lama.

Membuat SLO

Kami menyarankan Anda untuk mengatur SLO latensi dan ketersediaan pada aplikasi penting Anda. Metrik yang dikumpulkan Sinyal Aplikasi ini selaras dengan tujuan bisnis bersama.

Anda juga dapat mengatur SLO pada CloudWatch metrik atau ekspresi matematika metrik apa pun yang menghasilkan satu deret waktu.

Pertama kali Anda membuat SLO di akun Anda, CloudWatch secara otomatis membuat peran AWSServiceRoleForCloudWatchApplicationSignalsterkait layanan di akun Anda, jika belum ada. Peran terkait layanan ini memungkinkan CloudWatch untuk mengumpulkan data CloudWatch Log, data jejak X-Ray, data CloudWatch metrik, dan data penandaan dari aplikasi di akun Anda. Untuk informasi selengkapnya tentang peran CloudWatch terkait layanan, lihat. Menggunakan peran terkait layanan untuk CloudWatch

Cara membuat sebuah SLO
  1. Buka CloudWatch konsol di https://console.aws.amazon.com/cloudwatch/.

  2. Pada panel navigasi, silakan pilih Tujuan Tingkat Layanan (SLO).

  3. Pilih Buat SLO.

  4. Masukkan nama untuk SLO. Menyertakan nama layanan atau operasi, bersama kata kunci yang sesuai seperti latensi atau ketersediaan, akan membantu Anda mengidentifikasi apa yang ditunjukkan status SLO selama triase dengan cepat.

  5. Untuk Mengatur Indikator Tingkat Layanan(SLI), lakukan salah satu hal berikut:

    • Untuk mengatur SLO pada salah satu metrik aplikasi standar Latency atau Availability:

      1. Pilih Operasi Layanan.

      2. Pilih layanan yang akan dipantau oleh SLO ini.

      3. Pilih operasi yang akan dipantau oleh SLO ini.

        Drop-down Pilih Layanan dan Pilih operasi diisi oleh layanan dan operasi yang telah aktif dalam 24 jam terakhir.

      4. Pilih Ketersediaan atau Latensi dan kemudian atur ambang batas.

    • Untuk mengatur SLO pada CloudWatch metrik atau ekspresi matematika CloudWatch metrik apa pun:

      1. Pilih CloudWatch Metrik.

      2. Pilih Pilih CloudWatch metrik.

        Layar Pilih metrik muncul. Gunakan tab Jelajahi atau Kueri untuk menemukan metrik yang Anda inginkan, atau membuat ekspresi matematika metrik.

        Setelah Anda memilih metrik yang Anda inginkan, pilih tab Metrik bergrafik dan pilih Statistik dan Periode yang akan digunakan untuk SLO. Kemudian pilih Pilih metrik.

        Untuk informasi selengkapnya tentang metrik ini, silakan lihat Membuat sebuah grafik metrik dan Tambahkan ekspresi matematika ke CloudWatch grafik.

      3. Untuk Atur kondisi, pilih operator perbandingan dan ambang batas untuk SLO yang akan digunakan sebagai indikator keberhasilan.

  6. Jika Anda memilih Operasi Layanan di langkah 5, Anda dapat memilih Pengaturan tambahan secara opsional dan kemudian melakukan penyesuaian pada panjang periode untuk SLO ini.

  7. Atur interval dan tujuan pencapaian untuk SLO. Untuk informasi selengkapnya tentang interval dan pencapaian tujuan dan bagaimana keduanya bekerja sama, silakan lihat Konsep-konsep SLO.

  8. (Opsional) Atur satu atau lebih CloudWatch alarm atau ambang peringatan untuk SLO.

    1. CloudWatch alarm dapat menggunakan Amazon SNS untuk memberi tahu Anda secara proaktif jika aplikasi tidak sehat berdasarkan kinerja SLI-nya.

      Untuk membuat alarm, pilih salah satu kotak centang alarm dan masukkan atau buat topik Amazon SNS yang akan digunakan untuk notifikasi saat alarm masuk ke status ALARM. Untuk informasi selengkapnya tentang CloudWatch alarm, lihat Menggunakan CloudWatch alarm Amazon. Membuat alarm akan menimbulkan biaya. Untuk informasi selengkapnya tentang CloudWatch harga, lihat CloudWatch Harga Amazon.

    2. Jika Anda mengatur ambang batas peringatan, peringatan ini muncul di layar Sinyal Aplikasi untuk membantu Anda mengidentifikasi SLO yang berisiko tidak terpenuhi, bahkan jika saat ini sehat.

      Untuk mengatur ambang batas peringatan, masukkan nilai ambang batas di Ambang batas peringatan. Ketika anggaran kesalahan SLO lebih rendah dari ambang batas peringatan, SLO ditandai dengan Peringatan di beberapa layar Sinyal Aplikasi. Ambang batas peringatan juga muncul pada grafik anggaran kesalahan. Anda juga dapat membuat alarm peringatan SLO yang didasarkan pada ambang batas peringatan.

  9. Untuk menambahkan tanda ke SLO ini, silakan pilih tab Tanda dan kemudian pilih Tambahkan tanda baru. Tanda dapat membantu Anda mengelola, mengidentifikasi, mengatur, dan memfilter sumber daya. Untuk informasi selengkapnya tentang penandaan, silakan lihat Menandai sumber daya AWS Anda.

    catatan

    Jika aplikasi yang terkait dengan SLO ini terdaftar AWS Service Catalog AppRegistry, Anda dapat menggunakan awsApplication tag untuk mengaitkan SLO ini dengan aplikasi itu. AppRegistry Untuk informasi lebih lanjut, lihat Apa itu AppRegistry?

  10. Pilih Buat SLO. Jika Anda juga memilih untuk membuat satu atau beberapa alarm, nama tombol berubah sehingga mencerminkan hal ini.

Menampilkan dan melakukan penilaian awal pada status SLO

Anda dapat dengan cepat melihat kesehatan SLO Anda menggunakan Tujuan Tingkat Layanan atau opsi Layanan di CloudWatch konsol. Tampilan Layanan memberikan at-a-glance tampilan rasio layanan yang tidak sehat, dihitung berdasarkan SLO yang telah Anda tetapkan. Untuk informasi selengkapnya tentang penggunaan opsi Layanan, silakan lihat Memantau kondisi kesehatan operasional aplikasi Anda dengan Sinyal Aplikasi.

Tampilan Tujuan Tingkat Layanan memberikan sebuah tampilan makro organisasi Anda. Anda dapat melihat SLO yang terpenuhi dan tidak terpenuhi secara keseluruhan. Ini memberi Anda gambaran tentang berapa banyak layanan dan operasi Anda yang berperforma sesuai harapan Anda selama periode waktu yang lebih lama, sesuai dengan SLI yang Anda pilih.

Cara melihat semua SLO Anda dengan menggunakan tampilan Tujuan Tingkat Layanan
  1. Buka CloudWatch konsol di https://console.aws.amazon.com/cloudwatch/.

  2. Pada panel navigasi, silakan pilih Tujuan Tingkat Layanan (SLO).

    Daftar Tujuan Tingkat Layanan (SLO) ditampilkan.

    Anda dapat dengan cepat melihat status dari SLO Anda saat ini di kolom status SLI. Untuk mengurutkan SLO sehingga semua yang kondisinya tidak sehat berada di bagian atas daftar, pilih kolom status SLI sampai semua SLO yang sedang dalam kondisi tidak sehat berada di atas.

    Tabel SLO memiliki kolom-kolom default berikut. Anda dapat menyesuaikan kolom-kolom mana saja yang ditampilkan dengan memilih ikon roda gigi yang ada di atas daftar. Untuk informasi selengkapnya tentang tujuan, SLI, pencapaian, dan interval, silakan lihat Konsep-konsep SLO.

    • Nama SLO.

    • Kolom Tujuan menampilkan persentase periode selama setiap interval yang harus berhasil memenuhi ambang batas SLI agar tujuan SLO terpenuhi. Ini juga menampilkan panjang interval untuk SLO tersebut.

    • Status SLI akan menampilkan apakah status operasional aplikasi saat ini sedang dalam kondisi yang sehat atau tidak sehat. Jika ada periode selama rentang waktu yang dipilih saat ini tidak sehat untuk SLO, status SLI menampilkan Tidak Sehat.

    • Pencapaian akhir adalah tingkat pencapaian yang dicapai pada akhir rentang waktu yang dipilih. Urutkan berdasarkan kolom ini untuk melihat SLO yang paling berisiko tidak terpenuhi.

    • Delta pencapaian adalah perbedaan tingkat pencapaian antara awal dan akhir rentang waktu yang dipilih. Delta negatif berarti bahwa metrik kecenderungannya sedang ke arah bawah. Urutkan berdasarkan kolom ini untuk melihat kecenderungan-kecenderungan terbaru SLO.

    • Anggaran kesalahan akhir (%) adalah persentase dari total waktu dalam periode yang dapat memiliki periode tidak sehat dan masih memiliki SLO yang berhasil dicapai. Jika Anda mengatur ini menjadi 5%, dan SLI sedang dalam kondisi tidak sehat dalam 5% atau kurang dari periode yang tersisa dalam interval, maka SLO masih berhasil dicapai.

    • Delta anggaran kesalahan adalah perbedaan anggaran kesalahan antara awal dan akhir rentang waktu yang dipilih. Delta negatif berarti bahwa metrik sedang mengarah ke arah yang gagal.

    • Anggaran kesalahan akhir (waktu) adalah jumlah waktu aktual dalam interval yang bisa tidak sehat dan masih memiliki SLO yang berhasil dicapai. Sebagai contoh, jika ini 14 menit, maka jika SLI tidak sehat selama kurang dari 14 menit selama interval yang tersisa, SLO akan tetap berhasil tercapai.

    • Kolom Layanan, Operasi, dan Tipe menampilkan informasi tentang layanan dan operasi apa yang diatur SLO ini.

  3. Untuk melihat grafik pencapaian dan kesalahan untuk SLO, pilih tombol radio di samping nama SLO.

    Grafik di bagian atas halaman menampilkan pencapaian SLO dan status Anggaran kesalahan. Sebuah grafik tentang metrik SLI yang dikaitkan dengan SLO ini juga ditampilkan.

  4. Untuk melakukan penilaian awal lebih lanjut SLO yang tidak memenuhi tujuannya, pilih nama layanan atau nama operasi yang terkait dengan SLO tersebut. Anda dibawa ke halaman detail di mana Anda dapat melakukan penilaian awal lebih lanjut. Untuk informasi selengkapnya, lihat Lihat detail aktivitas layanan dan kesehatan operasional dengan halaman detail layanan.

  5. Untuk mengubah rentang waktu grafik dan tabel pada halaman tersebut, pilih rentang waktu baru di dekat bagian atas layar.

Sunting SLO yang ada

Ikuti langkah-langkah ini untuk menyunting SLO yang ada. Saat Anda menyunting SLO, Anda hanya dapat mengubah ambang batas, interval, tujuan pencapaian, dan tag. Untuk mengubah aspek lain seperti layanan, operasi, atau metrik, buat SLO baru alih-alih menyunting yang sudah ada.

Mengubah bagian dari konfigurasi inti SLO, seperti periode atau ambang batas, membatalkan semua titik data sebelumnya dan penilaian tentang pencapaian dan kondisi kesehatan. Ini secara efektif menghapus dan membuat kembali SLO.

catatan

Jika Anda menyunting SLO, alarm yang terkait dengan SLO tersebut tidak diperbarui secara otomatis. Anda mungkin perlu memperbarui alarm-alarm tersebut agar tetap sinkron dengan SLO.

Cara menyunting SLO yang ada
  1. Buka CloudWatch konsol di https://console.aws.amazon.com/cloudwatch/.

  2. Pada panel navigasi, silakan pilih Tujuan Tingkat Layanan (SLO).

  3. Pilih tombol radio yang ada di samping SLO yang ingin Anda sunting, dan pilih Tindakan, Sunting SLO.

  4. Buat perubahan, lalu pilih Simpan perubahan.

Menghapus SLO

Ikuti langkah-langkah ini untuk menghapus SLO yang ada.

catatan

Saat Anda menghapus sebuah SLO, alarm yang terkait dengan SLO tersebut tidak akan dihapus secara otomatis. Anda harus menghapusnya sendiri. Untuk informasi selengkapnya, lihat Mengelola alarm-alarm.

Cara menghapus SLO
  1. Buka CloudWatch konsol di https://console.aws.amazon.com/cloudwatch/.

  2. Pada panel navigasi, silakan pilih Tujuan Tingkat Layanan (SLO).

  3. Pilih tombol radio di samping SLO yang ingin Anda sunting, dan pilih Tindakan, Hapus SLO.

  4. Pilih Konfirmasi.