Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menganalisis Faktur dan Penerimaan
Amazon Textract mengekstrak data yang relevan seperti informasi kontak, item yang dibeli, dan nama vendor, dari hampir semua faktur atau tanda terima tanpa memerlukan templat atau konfigurasi apa pun. Faktur dan tanda terima sering menggunakan berbagai tata letak, sehingga sulit dan memakan waktu untuk mengekstrak data secara manual dalam skala besar. Amazon Textract menggunakan ML-nya untuk memahami konteks faktur dan tanda terima serta secara otomatis mengekstrak data seperti tanggal faktur atau tanda terima, nomor faktur atau tanda terima, harga barang, jumlah total, dan persyaratan pembayaran yang sesuai dengan kebutuhan bisnis Anda.
Amazon Textract juga mengidentifikasi nama vendor yang sangat penting untuk alur kerja Anda tetapi mungkin tidak diberi label secara eksplisit. Misalnya, Amazon Textract dapat menemukan nama vendor pada tanda terima meskipun hanya ditunjukkan dalam logo di bagian atas halaman tanpa kombinasi pasangan nilai kunci eksplisit. Amazon Textract juga memudahkan Anda untuk mengkonsolidasikan masukan dari beragam tanda terima dan faktur yang menggunakan kata berbeda untuk konsep yang sama. Misalnya, Amazon Textract memetakan hubungan antara nama lapangan dalam dokumen yang berbeda seperti nomor pelanggan, nomor pelanggan, dan ID akun, menampilkan taksonomi standar sebagaiINVOICE_RECEIPT_ID
. Dalam hal ini, Amazon Textract mewakili data secara konsisten di berbagai jenis dokumen. Bidang yang tidak sejajar dengan taksonomi standar dikategorikan sebagaiOTHER
.
Berikut ini adalah daftar bidang standar yang AnalyzeExpense saat ini mendukung:
-
Nama Vendor:
VENDOR_NAME
-
Total:
TOTAL
-
Alamat Penerima:
RECEIVER_ADDRESS
-
Tanggal Faktur/Tanda Terima:
INVOICE_RECEIPT_DATE
-
Faktur/Tanda Terima ID:
INVOICE_RECEIPT_ID
-
Ketentuan Pembayaran:
PAYMENT_TERMS
-
Subtotal:
SUBTOTAL
-
Tanggal jatuh tempo:
DUE_DATE
-
Pajak:
TAX
-
ID Pembayar Pajak Faktur (SSN/ITIN atau EIN):
TAX_PAYER_ID
-
Nama Item:
ITEM_NAME
-
Harga Item:
PRICE
-
Kuantitas Item:
QUANTITY
AnalyzeExpense API mengembalikan elemen berikut untuk halaman dokumen yang diberikan:
-
Jumlah penerimaan atau faktur dalam halaman diwakili sebagai
ExpenseIndex
-
Nama standar untuk bidang individu direpresentasikan sebagai
Type
-
Nama sebenarnya dari bidang seperti yang muncul pada dokumen, direpresentasikan sebagai
LabelDetection
-
Nilai bidang yang sesuai direpresentasikan sebagai
ValueDetection
-
Jumlah halaman dalam dokumen yang diajukan direpresentasikan sebagai
Pages
-
Nomor halaman di mana bidang, nilai, atau item baris terdeteksi, direpresentasikan sebagai
PageNumber
-
Geometri, yang mencakup kotak pembatas dan mengkoordinasikan lokasi bidang individu, nilai, atau item baris pada halaman, direpresentasikan sebagai
Geometry
-
Skor kepercayaan yang terkait dengan setiap bagian dari data yang terdeteksi pada dokumen, direpresentasikan sebagai
Confidence
-
Seluruh baris item baris individu yang dibeli, direpresentasikan sebagai
EXPENSE_ROW
Berikut ini adalah sebagian dari output API untuk tanda terima yang diproses oleh AnalyzeExpense yang menunjukkan Total: $55.64 dalam dokumen yang diekstrak sebagai bidang standarTOTAL
, teks aktual pada dokumen sebagai “Total”, Keyakinan Skor “97.1”, Halaman Nomor “1", Nilai total sebagai “$55.64" dan kotak pembatas dan koordinat poligon:
{ "Type": { "Text": "TOTAL", "Confidence": 99.94717407226562 }, "LabelDetection": { "Text": "Total:", "Geometry": { "BoundingBox": { "Width": 0.09809663146734238, "Height": 0.0234375, "Left": 0.36822840571403503, "Top": 0.8017578125 }, "Polygon": [ { "X": 0.36822840571403503, "Y": 0.8017578125 }, { "X": 0.466325044631958, "Y": 0.8017578125 }, { "X": 0.466325044631958, "Y": 0.8251953125 }, { "X": 0.36822840571403503, "Y": 0.8251953125 } ] }, "Confidence": 97.10792541503906 }, "ValueDetection": { "Text": "$55.64", "Geometry": { "BoundingBox": { "Width": 0.10395314544439316, "Height": 0.0244140625, "Left": 0.66837477684021, "Top": 0.802734375 }, "Polygon": [ { "X": 0.66837477684021, "Y": 0.802734375 }, { "X": 0.7723279595375061, "Y": 0.802734375 }, { "X": 0.7723279595375061, "Y": 0.8271484375 }, { "X": 0.66837477684021, "Y": 0.8271484375 } ] }, "Confidence": 99.85165405273438 }, "PageNumber": 1 }
Anda dapat menggunakan operasi sinkron untuk menganalisis faktur atau tanda terima. Untuk menganalisis dokumen-dokumen ini, Anda menggunakan operasi AnalyzeExpense dan memberikan tanda terima atau faktur untuk itu.AnalyzeExpense
mengembalikan seluruh rangkaian hasil. Untuk informasi selengkapnya, lihat Menganalisis Faktur dan Penerimaan dengan Amazon Textract.
Untuk menganalisis faktur dan tanda terima secara asinkron, gunakanStartExpenseAnalysisuntuk mulai memproses file dokumen input. Untuk mendapatkan hasilnya, hubungiGetExpenseAnalysis. Hasil untuk panggilan yang diberikan keStartExpenseAnalysisdikembalikan olehGetExpenseAnalysis
. Untuk informasi lebih lanjut dan contoh, lihat Memproses Dokumen dengan Operasi Asynchronous.