Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Output untuk pekerjaan analisis asinkron
Setelah pekerjaan analisis selesai, ia menyimpan hasil di bucket S3 yang Anda tentukan dalam permintaan.
Output untuk input teks
Untuk salah satu format dokumen input teks (multi-kelas atau multi-label), output pekerjaan terdiri dari satu file bernama. output.tar.gz
Ini adalah file arsip terkompresi yang berisi file teks dengan output.
Keluaran multi-kelas
Saat Anda menggunakan pengklasifikasi yang dilatih dalam mode multi-kelas, hasil Anda akan ditampilkan. classes
Masing-masing classes
adalah kelas yang digunakan untuk membuat kumpulan kategori saat melatih pengklasifikasi Anda.
Untuk detail selengkapnya tentang bidang keluaran ini, lihat ClassifyDocumentdi Referensi Amazon Comprehend API.
Contoh berikut menggunakan kelas yang saling eksklusif berikut.
DOCUMENTARY
SCIENCE_FICTION
ROMANTIC_COMEDY
SERIOUS_DRAMA
OTHER
Jika format data input Anda adalah satu dokumen per baris, file output berisi satu baris untuk setiap baris di input. Setiap baris mencakup nama file, nomor baris berbasis nol dari baris input, dan kelas atau kelas yang ditemukan dalam dokumen. Itu berakhir dengan keyakinan bahwa Amazon Comprehend memiliki bahwa instance individu diklasifikasikan dengan benar.
Sebagai contoh:
{"File": "file1.txt", "Line": "0", "Classes": [{"Name": "Documentary", "Score": 0.8642}, {"Name": "Other", "Score": 0.0381}, {"Name": "Serious_Drama", "Score": 0.0372}]} {"File": "file1.txt", "Line": "1", "Classes": [{"Name": "Science_Fiction", "Score": 0.5}, {"Name": "Science_Fiction", "Score": 0.0381}, {"Name": "Science_Fiction", "Score": 0.0372}]} {"File": "file2.txt", "Line": "2", "Classes": [{"Name": "Documentary", "Score": 0.1}, {"Name": "Documentary", "Score": 0.0381}, {"Name": "Documentary", "Score": 0.0372}]} {"File": "file2.txt", "Line": "3", "Classes": [{"Name": "Serious_Drama", "Score": 0.3141}, {"Name": "Other", "Score": 0.0381}, {"Name": "Other", "Score": 0.0372}]}
Jika format data input Anda adalah satu dokumen per file, file output berisi satu baris untuk setiap dokumen. Setiap baris memiliki nama file dan kelas atau kelas yang ditemukan dalam dokumen. Itu berakhir dengan keyakinan bahwa Amazon Comprehend mengklasifikasikan instance individu secara akurat.
Sebagai contoh:
{"File": "file0.txt", "Classes": [{"Name": "Documentary", "Score": 0.8642}, {"Name": "Other", "Score": 0.0381}, {"Name": "Serious_Drama", "Score": 0.0372}]} {"File": "file1.txt", "Classes": [{"Name": "Science_Fiction", "Score": 0.5}, {"Name": "Science_Fiction", "Score": 0.0381}, {"Name": "Science_Fiction", "Score": 0.0372}]} {"File": "file2.txt", "Classes": [{"Name": "Documentary", "Score": 0.1}, {"Name": "Documentary", "Score": 0.0381}, {"Name": "Domentary", "Score": 0.0372}]} {"File": "file3.txt", "Classes": [{"Name": "Serious_Drama", "Score": 0.3141}, {"Name": "Other", "Score": 0.0381}, {"Name": "Other", "Score": 0.0372}]}
Keluaran multi-label
Saat Anda menggunakan pengklasifikasi yang dilatih dalam mode multi-label, hasil Anda akan ditampilkan. labels
Masing-masing labels
adalah label yang digunakan untuk membuat kumpulan kategori saat melatih pengklasifikasi Anda.
Contoh berikut menggunakan label unik ini.
SCIENCE_FICTION
ACTION
DRAMA
COMEDY
ROMANCE
Jika format data input Anda adalah satu dokumen per baris, file output berisi satu baris untuk setiap baris di input. Setiap baris mencakup nama file, nomor baris berbasis nol dari baris input, dan kelas atau kelas yang ditemukan dalam dokumen. Itu berakhir dengan keyakinan bahwa Amazon Comprehend memiliki bahwa instance individu diklasifikasikan dengan benar.
Sebagai contoh:
{"File": "file1.txt", "Line": "0", "Labels": [{"Name": "Action", "Score": 0.8642}, {"Name": "Drama", "Score": 0.650}, {"Name": "Science Fiction", "Score": 0.0372}]} {"File": "file1.txt", "Line": "1", "Labels": [{"Name": "Comedy", "Score": 0.5}, {"Name": "Action", "Score": 0.0381}, {"Name": "Drama", "Score": 0.0372}]} {"File": "file1.txt", "Line": "2", "Labels": [{"Name": "Action", "Score": 0.9934}, {"Name": "Drama", "Score": 0.0381}, {"Name": "Action", "Score": 0.0372}]} {"File": "file1.txt", "Line": "3", "Labels": [{"Name": "Romance", "Score": 0.9845}, {"Name": "Comedy", "Score": 0.8756}, {"Name": "Drama", "Score": 0.7723}, {"Name": "Science_Fiction", "Score": 0.6157}]}
Jika format data input Anda adalah satu dokumen per file, file output berisi satu baris untuk setiap dokumen. Setiap baris memiliki nama file dan kelas atau kelas yang ditemukan dalam dokumen. Itu berakhir dengan keyakinan bahwa Amazon Comprehend mengklasifikasikan instance individu secara akurat.
Sebagai contoh:
{"File": "file0.txt", "Labels": [{"Name": "Action", "Score": 0.8642}, {"Name": "Drama", "Score": 0.650}, {"Name": "Science Fiction", "Score": 0.0372}]} {"File": "file1.txt", "Labels": [{"Name": "Comedy", "Score": 0.5}, {"Name": "Action", "Score": 0.0381}, {"Name": "Drama", "Score": 0.0372}]} {"File": "file2.txt", "Labels": [{"Name": "Action", "Score": 0.9934}, {"Name": "Drama", "Score": 0.0381}, {"Name": "Action", "Score": 0.0372}]} {"File": "file3.txt”, "Labels": [{"Name": "Romance", "Score": 0.9845}, {"Name": "Comedy", "Score": 0.8756}, {"Name": "Drama", "Score": 0.7723}, {"Name": "Science_Fiction", "Score": 0.6157}]}
Output untuk dokumen input semi-terstruktur
Untuk dokumen input semi-terstruktur, output dapat mencakup bidang tambahan berikut:
DocumentMetadata — Informasi ekstraksi tentang dokumen. Metadata mencakup daftar halaman dalam dokumen, dengan jumlah karakter yang diekstraksi dari setiap halaman. Bidang ini hadir dalam respons jika permintaan menyertakan
Byte
parameter.DocumentType — Jenis dokumen untuk setiap halaman dalam dokumen input. Bidang ini hadir dalam respons jika permintaan menyertakan
Byte
parameter.Kesalahan — Kesalahan tingkat halaman yang terdeteksi sistem saat memproses dokumen input. Bidang kosong jika sistem tidak mengalami kesalahan.
Untuk detail selengkapnya tentang bidang keluaran ini, lihat ClassifyDocumentdi Referensi Amazon Comprehend API.
Contoh berikut menunjukkan output untuk file dipindai PDF dua halaman.
[{ #First page output "Classes": [ { "Name": "__label__2 ", "Score": 0.9993996620178223 }, { "Name": "__label__3 ", "Score": 0.0004330444789957255 } ], "DocumentMetadata": { "PageNumber": 1, "Pages": 2 }, "DocumentType": "ScannedPDF", "File": "file.pdf", "Version": "VERSION_NUMBER" }, #Second page output { "Classes": [ { "Name": "__label__2 ", "Score": 0.9993996620178223 }, { "Name": "__label__3 ", "Score": 0.0004330444789957255 } ], "DocumentMetadata": { "PageNumber": 2, "Pages": 2 }, "DocumentType": "ScannedPDF", "File": "file.pdf", "Version": "VERSION_NUMBER" }]