Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Amazon Textract dapat mendeteksi dan menganalisis teks dalam dokumen multihalaman yang dalam format PDF atau TIFF. Ini termasuk faktur dan tanda terima. Pengolahan dokumen multipage merupakan operasi asinkron. Pengolahan dokumen asinkron berguna untuk memproses dokumen multipage yang besar. Misalnya, file PDF dengan lebih dari 1.000 halaman membutuhkan waktu untuk diproses. Memproses file PDF secara asinkron memungkinkan aplikasi Anda menyelesaikan tugas lain sementara menunggu proses selesai.
Bagian ini mencakup bagaimana Anda dapat menggunakan Amazon Textract untuk mendeteksi dan menganalisis teks secara asinkron pada dokumen multihalaman atau satu halaman. Dokumen multipage harus dalam format PDF atau TIFF. Dokumen satu halaman yang diproses dengan operasi asinkron dapat dalam format JPEG, PNG, TIFF atau PDF.
Anda dapat menggunakan operasi asinkron Amazon Texact untuk tujuan berikut:
-
Deteksi teks - Anda dapat mendeteksi baris dan kata-kata pada dokumen multipage. Operasi asinkronStartDocumentTextDetectiondanGetDocumentTextDetection. Untuk informasi selengkapnya, lihat Mendeteksi teks.
-
Analisis teks - Anda dapat mengidentifikasi hubungan antara teks yang terdeteksi pada dokumen multipage. Operasi asinkronStartDocumentAnalysisdanGetDocumentAnalysis. Untuk informasi selengkapnya, lihat Menganalisis Dokumen.
-
Analisis pengeluaran — Anda dapat mengidentifikasi hubungan data pada faktur dan tanda terima multipage. Amazon Textract memperlakukan setiap faktur atau halaman penerimaan dokumen multi-halaman sebagai tanda terima individu atau faktur. Ini tidak mempertahankan konteks dari satu halaman ke halaman lain dari dokumen multi-halaman. Operasi asinkronStartExpenseAnalysisdanGetExpenseAnalysis. Untuk informasi selengkapnya, lihat Menganalisis Faktur dan Penerimaan.