

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Detail agen - Evaluasi
<a name="session-traces-evaluations"></a>

Evaluasi menyediakan metrik pemantauan kualitas berkelanjutan untuk agen AI Anda. Anda dapat menggunakan informasi yang disediakan oleh dasbor untuk menilai kinerja, kualitas, dan keandalan agen AI Anda. 

Alih-alih mengandalkan kasus uji simulasi, evaluasi menangkap sesi pengguna nyata dan interaksi agen, memberikan pandangan komprehensif tentang kinerja agen, dari input hingga output akhir. Dengan evaluasi agen, Anda dapat menentukan aturan pengambilan sampel untuk mengevaluasi hanya persentase sesi atau jejak, dan kemudian menerapkan berbagai evaluator untuk menilai dan menilai kinerja operasional agen AI. Penilaian dan skor yang dihasilkan ditampilkan di dasbor Evaluasi, memungkinkan Anda memantau tren, mengidentifikasi potensi masalah kualitas, mengatur alarm, dan menyelidiki serta mendiagnosis potensi masalah.

Dasbor Evaluasi mencantumkan semua evaluasi yang telah diaktifkan dan dikonfigurasi untuk agen yang dipilih. [Untuk informasi selengkapnya tentang mengonfigurasi evaluasi untuk agen, lihat AgentCore evaluasi.](https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/evaluations.html) Anda dapat memperluas setiap evaluasi untuk melihat sesi, jejak, dan rentang yang dievaluasi. 

![\[Evaluasi\]](http://docs.aws.amazon.com/id_id/AmazonCloudWatch/latest/monitoring/images/evals_overview.png)


**Topics**
+ [Rincian evaluasi](#session-traces-evaluations-details)
+ [Grafik evaluasi](#session-traces-evaluations-graphs)
+ [Bekerja dengan hasil evaluasi](#session-traces-evaluations-raw-results)

## Rincian evaluasi
<a name="session-traces-evaluations-details"></a>

Untuk setiap evaluasi, dasbor mencakup bagian-bagian berikut:

------
#### [ Evaluation configuration metrics ]

Menyediakan metrik untuk konfigurasi evaluasi keseluruhan. Evaluator mendefinisikan bagaimana menilai aspek tertentu dari kinerja agen AI. Untuk melihat detail selengkapnya tentang evaluator, pilih namanya di kolom **Evaluator**. Untuk melihat diagram batang dan menganalisis tren untuk evaluator, pilih nilai di kolom **Hitung**.

![\[Metrik konfigurasi evaluasi\]](http://docs.aws.amazon.com/id_id/AmazonCloudWatch/latest/monitoring/images/evals_01.png)


------
#### [ Session evaluations ]

Memberikan hasil evaluasi untuk evaluator di tingkat sesi. Sesi merupakan pengelompokan logis interaksi terkait dari satu pengguna atau alur kerja. Sesi dapat berisi satu atau lebih jejak. Anda dapat memilih sesi untuk memfilter ke daftar jejak dalam sesi tersebut di bagian **Evaluasi jejak**.

![\[Evaluasi sesi\]](http://docs.aws.amazon.com/id_id/AmazonCloudWatch/latest/monitoring/images/evals_02.png)


------
#### [ Trace evaluations ]

Memberikan hasil evaluasi untuk evaluator di tingkat jejak. Jejak adalah catatan lengkap dari eksekusi atau permintaan agen tunggal. Jejak dapat berisi satu atau lebih bentang. Pilih jejak untuk melihat detail jejak bersama dengan semua evaluator yang dijalankan pada jejak itu.

![\[Evaluasi jejak\]](http://docs.aws.amazon.com/id_id/AmazonCloudWatch/latest/monitoring/images/evals_03.png)


------
#### [ Span evaluations ]

Memberikan hasil evaluasi untuk evaluator di tingkat rentang. Rentang mewakili operasi individu yang dilakukan selama eksekusi itu. Pilih rentang untuk melihat detail rentang bersama dengan semua operasi yang dilakukan selama rentang itu.

![\[Evaluasi rentang\]](http://docs.aws.amazon.com/id_id/AmazonCloudWatch/latest/monitoring/images/evals_04.png)


------

## Grafik evaluasi
<a name="session-traces-evaluations-graphs"></a>

Dasbor Evaluasi juga menyertakan grafik batang untuk setiap evaluator. Grafik menunjukkan tren untuk setiap evaluator dari waktu ke waktu, dan memungkinkan Anda menyetel alarm untuk nilai metrik tertentu. Untuk mengatur alarm, klik bilah di grafik, lalu pilih ikon **Alarm** (bel). Untuk informasi selengkapnya, lihat [Menggunakan CloudWatch alarm Amazon](CloudWatch_Alarms.md).

![\[Grafik evaluasi\]](http://docs.aws.amazon.com/id_id/AmazonCloudWatch/latest/monitoring/images/evals_graphs.png)


## Bekerja dengan hasil evaluasi
<a name="session-traces-evaluations-raw-results"></a>

Jika Anda memerlukan akses langsung ke data hasil evaluasi, atau jika Anda ingin membuat visualisasi khusus atau bekerja di luar konsol AgentCore Evaluasi, Anda dapat mengakses hasil evaluasi secara langsung melalui CloudWatch Log, CloudWatch Metrik, dan dasbor. CloudWatch 

**Topics**
+ [Mengakses hasil evaluasi di Log CloudWatch](#accessing-evaluation-results-logs)
+ [Mengakses metrik evaluasi dalam Metrik CloudWatch](#accessing-evaluation-metrics)
+ [Membuat Dasbor Kustom](#creating-custom-dashboards)
+ [Menyetel alarm pada metrik evaluasi](#setting-alarms-evaluation-metrics)
+ [Sumber Daya Tambahan](#additional-resources)

### Mengakses hasil evaluasi di Log CloudWatch
<a name="accessing-evaluation-results-logs"></a>

Hasil evaluasi Anda secara otomatis dipublikasikan ke CloudWatch Log dalam Embedded Metric Format (EMF).

**Untuk menemukan grup log hasil evaluasi Anda**

1. Buka CloudWatch konsol.

1. Di panel navigasi, pilih **Manajemen Log** > **Grup log**.

1. Cari atau navigasikan ke grup log dengan awalan:`/aws/bedrock-agentcore/evaluations/`.

1. Dalam grup log ini, peristiwa log berisi hasil evaluasi.

Untuk informasi selengkapnya tentang bekerja dengan grup log dan menanyakan data log, lihat [Bekerja dengan Grup Log dan Aliran Log dan](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Working-with-log-groups-and-streams.html) [Menganalisis Data Log dengan Wawasan CloudWatch Log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html).

### Mengakses metrik evaluasi dalam Metrik CloudWatch
<a name="accessing-evaluation-metrics"></a>

Metrik hasil evaluasi secara otomatis diekstraksi dari log Embedded Metric Format (EMF) dan dipublikasikan ke Metrik. CloudWatch 

**Untuk menemukan metrik evaluasi Anda**

1. Buka CloudWatch konsol.

1. Di panel navigasi, pilih **Metrik > **Semua** metrik**.

1. Pilih namespace **Bedrock AgentCore /Evaluations**.

1. Jelajahi metrik yang tersedia berdasarkan dimensi.

Untuk informasi selengkapnya tentang melihat dan bekerja dengan metrik, lihat [Menggunakan CloudWatch Metrik dan Metrik](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) [Grafik](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/graph_metrics.html).

### Membuat Dasbor Kustom
<a name="creating-custom-dashboards"></a>

Anda dapat membuat dasbor khusus untuk memvisualisasikan metrik evaluasi Anda bersama metrik operasional lainnya.

**Untuk membuat dasbor dengan metrik evaluasi**

1. Di CloudWatch konsol, pilih **Dasbor** dari panel navigasi.

1. Pilih **Buat dasbor**.

1. Tambahkan widget dan pilih metrik dari namespace **Bedrock /Evaluations AgentCore**.

1. Sesuaikan rentang waktu, statistik, dan jenis visualisasi untuk kebutuhan Anda.

Untuk petunjuk terperinci, lihat [Membuat dan Bekerja dengan Dasbor Kustom](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/create_dashboard.html) dan [Menggunakan CloudWatch Dasbor](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html).

### Menyetel alarm pada metrik evaluasi
<a name="setting-alarms-evaluation-metrics"></a>

Anda dapat menyetel alarm untuk memberi tahu Anda saat metrik evaluasi melewati ambang batas tertentu yang telah Anda tentukan, seperti ketika kebenaran turun di bawah tingkat yang dapat diterima.

**Untuk membuat alarm pada metrik evaluasi**

1. Di CloudWatch konsol, pilih **Alarm > **Semua alarm****.

1. Pilih **Buat alarm**.

1. Pilih **Pilih metrik** dan arahkan ke ruang nama **Bedrock AgentCore /Evaluations**.

1. Pilih metrik yang ingin Anda pantau.

1. Konfigurasikan kondisi ambang batas (ambang deteksi anomali dinamis tersedia di mana Anda tidak perlu menentukan ambang angka statis) dan tindakan notifikasi.

Untuk petunjuk terperinci, lihat [Menggunakan CloudWatch Alarm](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Alarms.html) dan [Membuat CloudWatch Alarm Berdasarkan Ambang Statis](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ConsoleAlarms.html).

### Sumber Daya Tambahan
<a name="additional-resources"></a>
+ [CloudWatch Format Metrik Tertanam](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CloudWatch-Logs-Monitoring-CloudWatch-Metrics.html)
+ [CloudWatch Sintaks Kueri Wawasan Log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_QuerySyntax.html)
+ [Membuat Alarm Komposit](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Composite_Alarm.html)