Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menjalankan pekerjaan analisis untuk pengenalan entitas kustom
Anda dapat menjalankan tugas analisis asinkron untuk mendeteksi entitas kustom dalam satu set dokumen atau beberapa.
Sebelum Anda memulai
Anda memerlukan model pengenalan entitas kustom (juga dikenal sebagai pengenal) sebelum Anda dapat mendeteksi entitas kustom. Untuk informasi lebih lanjut tentang model ini, lihatMelatih model pengenal entitas khusus.
Pengenal yang dilatih dengan anotasi teks biasa mendukung deteksi entitas hanya untuk dokumen teks biasa. Pengenal yang dilatih dengan anotasi dokumen PDF mendukung deteksi entitas untuk dokumen teks biasa, gambar, file PDF, dan dokumen Word. Untuk file selain file teks, Amazon Comprehend melakukan ekstraksi teks sebelum menjalankan analisis. Untuk informasi tentang file input, lihatMasukan untuk analisis kustom asinkron.
Jika Anda berencana untuk menganalisis file gambar atau dokumen PDF yang dipindai, kebijakan IAM Anda harus memberikan izin untuk menggunakan dua metode Amazon Textract API (dan). DetectDocumentText AnalyzeDocument Amazon Comprehend memanggil metode ini selama ekstraksi teks. Untuk contoh kebijakan, lihat Izin yang diperlukan untuk melakukan tindakan analisis dokumen.
Untuk menjalankan pekerjaan analisis asinkron, Anda melakukan langkah-langkah keseluruhan berikut:
-
Simpan dokumen dalam ember Amazon S3.
-
Gunakan API atau konsol untuk memulai pekerjaan analisis.
-
Pantau kemajuan pekerjaan analisis.
-
Setelah pekerjaan selesai, ambil hasil analisis dari bucket S3 yang Anda tentukan saat memulai pekerjaan.