Evaluasi kinerja model di Amazon Bedrock - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Evaluasi kinerja model di Amazon Bedrock

Gunakan evaluasi model untuk mengevaluasi kinerja dan efektivitas model Amazon Bedrock. Anda dapat membuat pekerjaan model otomatis untuk melihat metrik kinerja seperti ketahanan semantik model. Anda juga dapat memanfaatkan tim pekerja manusia untuk menilai dan memberikan masukan mereka untuk evaluasi.

Evaluasi otomatis menghasilkan skor dan metrik yang dihitung yang membantu Anda menilai efektivitas suatu model. Evaluasi berbasis manusia menggunakan tim orang yang memberikan peringkat dan preferensi mereka dalam kaitannya dengan metrik tertentu.

Untuk membuat pekerjaan evaluasi model, Anda harus memiliki akses ke setidaknya satu model Amazon Bedrock. Dukungan pekerjaan evaluasi model menggunakan model pondasi, model pondasi yang disesuaikan, dan untuk model yang telah Anda beli Throughput Tertentu.