GetDocumentTextDetection - Amazon Textract

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

GetDocumentTextDetection

Mendapat hasil untuk operasi asinkron Amazon Texact yang mendeteksi teks dalam dokumen. Amazon Textract dapat mendeteksi baris teks dan kata-kata yang membentuk baris teks.

Anda memulai deteksi teks asinkron dengan meneleponStartDocumentTextDetection, yang mengembalikan pengenal pekerjaan (JobId). Ketika operasi deteksi teks selesai, Amazon Textract menerbitkan status penyelesaian ke topik Amazon Simple Notification Service (Amazon SNS) yang terdaftar dalam panggilan awal.StartDocumentTextDetection. Untuk mendapatkan hasil operasi deteksi teks, periksa terlebih dahulu bahwa nilai status yang diterbitkan ke topik Amazon SNS adalahSUCCEEDED. Jika ya, hubungiGetDocumentTextDetection, dan lulus pengenal pekerjaan (JobId) dari panggilan awal keStartDocumentTextDetection.

GetDocumentTextDetectionmengembalikan arrayBlockbenda.

Setiap halaman dokumen memiliki sebagai terkaitBlockjenis HALAMAN. Setiap HALAMANBlockobjek adalah induk dari LINEBlockobjek yang mewakili baris teks terdeteksi pada halaman. GARISBlockobjek adalah orang tua untuk setiap kata yang membentuk baris. Kata-kata diwakili olehBlockobjek tipe WORD.

Gunakan parameter MaxResults untuk membatasi jumlah blok yang dikembalikan. Jika hasil yang didapatkan lebih banyak daripada yang ditentukan dalam MaxResults, nilai NextToken dalam respons operasi berisi token pemberian nomor halaman untuk mendapatkan serangkaian hasil berikutnya. Untuk mendapatkan halaman hasil berikutnya, hubungiGetDocumentTextDetection, dan mengisiNextTokenparameter permintaan dengan nilai token yang dikembalikan dari panggilan sebelumnya keGetDocumentTextDetection.

Untuk informasi selengkapnya, lihatPendeteksi Teks.

Sintaksis Permintaan

{ "JobId": "string", "MaxResults": number, "NextToken": "string" }

Parameter Permintaan

Permintaan menerima data berikut dalam format JSON.

JobId

Pengidentifikasi unik untuk tugas deteksi teks. JobId dikembalikan dari StartDocumentTextDetection. SEBUAHJobIdNilai hanya berlaku selama 7 hari.

Jenis: String

Batasan Panjang: Panjang minimum 1. Panjang maksimum adalah 64.

Pola: ^[a-zA-Z0-9-_]+$

Diperlukan: Ya

MaxResults

Jumlah hasil maksimum untuk mengembalikan per panggilan yang diberi nomor halaman. Nilai terbesar yang dapat Anda tentukan adalah 1.000. Jika Anda menentukan nilai yang lebih besar dari 1.000, maksimum hasil dikembalikan adalah 1.000. Nilai default adalah 1,000.

Jenis: Bulat

Rentang yang Valid: Nilai minimum 1.

Diperlukan: Tidak

NextToken

Jika respons sebelumnya tidak lengkap (karena ada lebih banyak blok untuk diambil), Amazon Textract mengembalikan token pemberian nomor halaman sebagai responsnya. Anda dapat menggunakan token pemberian nomor halaman ini untuk mengambil set blok berikutnya.

Jenis: String

Batasan Panjang: Panjang minimum 1. Panjang maksimum 255.

Pola: .*\S.*

Diperlukan: Tidak

Sintaksis Respons

{ "Blocks": [ { "BlockType": "string", "ColumnIndex": number, "ColumnSpan": number, "Confidence": number, "EntityTypes": [ "string" ], "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Id": "string", "Page": number, "Relationships": [ { "Ids": [ "string" ], "Type": "string" } ], "RowIndex": number, "RowSpan": number, "SelectionStatus": "string", "Text": "string", "TextType": "string" } ], "DetectDocumentTextModelVersion": "string", "DocumentMetadata": { "Pages": number }, "JobStatus": "string", "NextToken": "string", "StatusMessage": "string", "Warnings": [ { "ErrorCode": "string", "Pages": [ number ] } ] }

Elemen Respons

Jika tindakan berhasil, layanan mengirimkan kembali respons HTTP 200.

Layanan mengembalikan data berikut dalam format JSON.

Blocks

Hasil operasi deteksi teks.

Jenis: ArrayBlockobjek

DetectDocumentTextModelVersion

Jenis: String

DocumentMetadata

Informasi tentang dokumen yang diproses Amazon Textract Texact.DocumentMetadatadikembalikan di setiap halaman respons yang diberi nomor halaman dari operasi video Amazon Textract.

Tipe: Objek DocumentMetadata

JobStatus

Status terkini tugas deteksi teks.

Jenis: Rangkaian

Nilai Valid: IN_PROGRESS | SUCCEEDED | FAILED | PARTIAL_SUCCESS

NextToken

Jika respons terpotong, Amazon Textract mengembalikan token ini. Anda dapat menggunakan token ini dalam permintaan berikutnya untuk mengambil set hasil deteksi teks berikutnya.

Jenis: String

Batasan Panjang: Panjang minimum 1. Panjang maksimum 255.

Pola: .*\S.*

StatusMessage

Pengembalian jika pekerjaan deteksi tidak dapat diselesaikan. Berisi penjelasan tentang kesalahan apa yang terjadi.

Jenis: String

Warnings

Daftar peringatan yang terjadi selama operasi deteksi teks untuk dokumen.

Jenis: ArrayWarningobjek

Kesalahan

AccessDeniedException

Anda tidak berwenang untuk melakukan tindakan. Gunakan Amazon Resource Name (ARN) dari pengguna resmi atau IAM role untuk melakukan operasi.

Kode Status HTTP: 400

InternalServerError

Amazon Textract Texact mengalami masalah layanan. Coba lagi panggilan Anda.

Kode Status HTTP: 500

InvalidJobIdException

Pengenal pekerjaan yang tidak valid diteruskan keGetDocumentAnalysisatau untukGetDocumentAnalysis.

Kode Status HTTP: 400

InvalidKMSKeyException

Menunjukkan bahwa Anda tidak memiliki izin mendekripsi dengan kunci KMS yang dimasukkan, atau kunci KMS dimasukkan secara tidak benar.

Kode Status HTTP: 400

InvalidParameterException

Parameter input melanggar batasan. Misalnya, dalam operasi sinkron,InvalidParameterExceptionpengecualian terjadi ketika salah satuS3ObjectatauBytesnilai-nilai yang disediakan dalamDocumentparameter permintaan. Validasi parameter Anda sebelum memanggil operasi API lagi.

Kode Status HTTP: 400

InvalidS3ObjectException

Amazon Textract tidak dapat mengakses objek S3 yang ditentukan dalam permintaan. untuk informasi selengkapnya,Konfigurasi Akses ke Amazon S3Untuk informasi pemecahan masalah, lihatPemecahan Masalah Amazon S3

Kode Status HTTP: 400

ProvisionedThroughputExceededException

Jumlah permintaan melebihi batas throughput Anda. Jika Anda ingin meningkatkan batas ini, hubungi Amazon Textract.

Kode Status HTTP: 400

ThrottlingException

Amazon Textract Texact untuk sementara tidak dapat memproses permintaan. Coba lagi panggilan Anda.

Kode Status HTTP: 500

Lihat Juga

Untuk informasi selengkapnya tentang penggunaan API di salah satu spesifik bahasaAWSSDK, lihat yang berikut ini: