Ringkasan teks untuk evaluasi model di Amazon Bedrock - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Ringkasan teks untuk evaluasi model di Amazon Bedrock

Ringkasan teks digunakan untuk tugas-tugas termasuk membuat ringkasan berita, dokumen hukum, makalah akademik, pratinjau konten, dan kurasi konten. Ambiguitas, koherensi, bias, dan kefasihan teks yang digunakan untuk melatih model serta kehilangan informasi, akurasi, relevansi, atau ketidakcocokan konteks dapat mempengaruhi kualitas tanggapan.

penting

Untuk ringkasan teks, ada masalah sistem yang diketahui yang mencegah model Cohere menyelesaikan evaluasi toksisitas dengan sukses.

Dataset bawaan berikut didukung untuk digunakan dengan jenis tugas ringkasan tugas.

Gigaword

Dataset Gigaword terdiri dari berita utama artikel. Dataset ini digunakan dalam tugas ringkasan teks.

Tabel berikut merangkum metrik yang dihitung, dan kumpulan data bawaan yang direkomendasikan. Untuk berhasil menentukan kumpulan data bawaan yang tersedia menggunakan AWS CLI, atau yang didukung AWS SDKmenggunakan nama parameter di kolom, Built-in dataset () API.

Set data bawaan yang tersedia untuk ringkasan teks di Amazon Bedrock
Jenis tugas Metrik Kumpulan data bawaan (konsol) Kumpulan data bawaan () API Metrik yang dihitung
Ringkasan teks Akurasi Gigaword Builtin.Gigaword BERTScore
Toksisitas Gigaword Builtin.Gigaword Toksisitas
Kekokohan Gigaword Builtin.Gigaword

BERTScoredan deltaBERTScore

Untuk mempelajari lebih lanjut tentang bagaimana metrik yang dihitung untuk setiap kumpulan data bawaan dihitung, lihat Tinjau laporan pekerjaan dan metrik evaluasi model di Amazon Bedrock