Mempersiapkan data pelatihan pengklasifikasi - Amazon Comprehend

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mempersiapkan data pelatihan pengklasifikasi

Untuk klasifikasi kustom, Anda melatih model dalam mode multi-kelas atau mode multi-label. Mode multi-kelas mengaitkan satu kelas dengan setiap dokumen. Mode multi-label mengaitkan satu atau lebih kelas dengan setiap dokumen. Format file input berbeda untuk setiap mode, jadi pilih mode yang akan digunakan sebelum Anda membuat data pelatihan.

catatan

Konsol Amazon Comprehend mengacu pada mode multi-kelas sebagai mode label tunggal.

Klasifikasi kustom mendukung model yang Anda latih dengan dokumen teks biasa dan model yang Anda latih dengan dokumen asli (seperti PDF, Word, atau gambar). Untuk informasi selengkapnya tentang model pengklasifikasi dan jenis dokumen yang didukung, lihatModel klasifikasi pelatihan.

Untuk menyiapkan data untuk melatih model pengklasifikasi kustom:

  1. Identifikasi kelas yang Anda ingin pengklasifikasi ini untuk dianalisis. Tentukan mode mana yang akan digunakan (multi-kelas atau multi-label).

  2. Tentukan jenis model pengklasifikasi, berdasarkan apakah model tersebut untuk menganalisis dokumen teks biasa atau dokumen semi-terstruktur.

  3. Kumpulkan contoh dokumen untuk masing-masing kelas. Untuk persyaratan pelatihan minimum, lihatKuota umum untuk klasifikasi dokumen.

  4. Untuk model teks biasa, pilih format file pelatihan yang akan digunakan (file CSV atau file manifes tambahan). Untuk melatih model dokumen asli, Anda selalu menggunakan file CSV.