Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mendapat hasil untuk operasi asinkron Amazon Texact yang menganalisis teks dalam dokumen.
Anda memulai analisis teks asinkron dengan meneleponStartDocumentAnalysis, yang mengembalikan pengenal pekerjaan (JobId
). Ketika operasi analisis teks selesai, Amazon Textract menerbitkan status selesai untuk topik Amazon Simple Notification Service (Amazon SNS) yang terdaftar dalam panggilan awal untukStartDocumentAnalysis
. Untuk mendapatkan hasil operasi deteksi teks, periksa terlebih dahulu bahwa nilai status yang diterbitkan ke topik Amazon SNS adalahSUCCEEDED
. Jika ya, hubungiGetDocumentAnalysis
, dan lulus pengenal pekerjaan (JobId
) dari panggilan awal keStartDocumentAnalysis
.
GetDocumentAnalysis
mengembalikan arrayBlockobjek. Jenis informasi berikut ini dikembalikan:
-
Data formulir (pasangan nilai kunci). Informasi terkait dikembalikan duaBlockobjek, masing-masing jenis
KEY_VALUE_SET
: KUNCIBlock
objek dan NILAIBlock
objek. Misalnya,Nama: Ana Silvaberisi kunci dan nilai. Nama:adalah kuncinya. Ana Silvaadalah nilai. -
Tabel dan data sel tabel. TABEL
Block
objek berisi informasi tentang tabel terdeteksi. SELBlock
objek dikembalikan untuk setiap sel dalam tabel. -
Garis dan kata-kata teks. GARIS
Block
objek berisi satu atau lebih WORDBlock
objek. Semua baris dan kata-kata yang terdeteksi dalam dokumen dikembalikan (termasuk teks yang tidak memiliki hubungan dengan nilaiStartDocumentAnalysis
FeatureTypes
parameter masukan).
Elemen seleksi seperti kotak centang dan tombol opsi (tombol radio) dapat dideteksi dalam data formulir dan dalam tabel. SELECTION_ELEMENTBlock
objek berisi informasi tentang elemen seleksi, termasuk status seleksi.
GunakanMaxResults
parameter untuk membatasi jumlah blok yang dikembalikan. Jika hasil yang didapatkan lebih banyak daripada yang ditentukan dalam MaxResults
, nilai NextToken
dalam respons operasi berisi token pemberian nomor halaman untuk mendapatkan serangkaian hasil berikutnya. Untuk mendapatkan halaman hasil berikutnya, hubungiGetDocumentAnalysis
, dan mengisiNextToken
parameter permintaan dengan nilai token yang dikembalikan dari panggilan sebelumnya keGetDocumentAnalysis
.
Untuk informasi selengkapnya, lihatAnalisis Teks Dokumen.
Sintaksis Permintaan
{
"JobId": "string
",
"MaxResults": number
,
"NextToken": "string
"
}
Parameter Permintaan
Permintaan menerima data berikut dalam format JSON.
- JobId
-
Pengenal unik untuk tugas deteksi teks.
JobId
dikembalikan dariStartDocumentAnalysis
. SEBUAHJobId
Nilai hanya berlaku selama 7 hari.Jenis: String
Batasan: Panjang minimum 1. Panjang maksimum adalah 64.
Pola:
^[a-zA-Z0-9-_]+$
Diperlukan: Ya
- MaxResults
-
Jumlah hasil maksimum untuk mengembalikan per panggilan yang diberi nomor halaman. Nilai terbesar yang dapat Anda tentukan adalah 1.000. Jika Anda menentukan nilai yang lebih besar dari 1.000, maksimum 1.000 hasil dikembalikan. Nilai default adalah 1,000.
Jenis: Bulat
Rentang yang Valid: Nilai minimum 1.
Diperlukan: Tidak
- NextToken
-
Jika respons sebelumnya tidak lengkap (karena ada lebih banyak blok untuk diambil), Amazon Textract token pemberian nomor halaman sebagai responsnya. Anda dapat menggunakan token pemberian nomor halaman ini untuk mengambil set blok berikutnya.
Jenis: String
Batasan: Panjang minimum 1. Panjang maksimum 255.
Pola:
.*\S.*
Diperlukan: Tidak
Sintaksis Respons
{
"AnalyzeDocumentModelVersion": "string",
"Blocks": [
{
"BlockType": "string",
"ColumnIndex": number,
"ColumnSpan": number,
"Confidence": number,
"EntityTypes": [ "string" ],
"Geometry": {
"BoundingBox": {
"Height": number,
"Left": number,
"Top": number,
"Width": number
},
"Polygon": [
{
"X": number,
"Y": number
}
]
},
"Id": "string",
"Page": number,
"Relationships": [
{
"Ids": [ "string" ],
"Type": "string"
}
],
"RowIndex": number,
"RowSpan": number,
"SelectionStatus": "string",
"Text": "string",
"TextType": "string"
}
],
"DocumentMetadata": {
"Pages": number
},
"JobStatus": "string",
"NextToken": "string",
"StatusMessage": "string",
"Warnings": [
{
"ErrorCode": "string",
"Pages": [ number ]
}
]
}
Elemen Respons
Jika tindakan berhasil, layanan mengirimkan kembali respons HTTP 200.
Layanan mengembalikan data berikut dalam format JSON.
- AnalyzeDocumentModelVersion
-
Jenis: String
- Blocks
-
Hasil operasi teks-analisis.
Jenis: ArrayBlockobjek
- DocumentMetadata
-
Informasi tentang dokumen yang diproses Amazon Textract Texact.
DocumentMetadata
dikembalikan di setiap halaman respons pemberian nomor halaman dari operasi Amazon Textract video.Tipe: Objek DocumentMetadata
- JobStatus
-
Status tugas deteksi teks.
Jenis: Rangkaian
Nilai Valid:
IN_PROGRESS | SUCCEEDED | FAILED | PARTIAL_SUCCESS
- NextToken
-
Jika respons terpotong, Amazon Textract mengembalikan token ini. Anda dapat menggunakan token ini dalam permintaan berikutnya untuk mengambil serangkaian hasil deteksi teks berikutnya.
Jenis: String
Batasan: Panjang minimum 1. Panjang maksimum 255.
Pola:
.*\S.*
- StatusMessage
-
Pengembalian jika pekerjaan deteksi tidak dapat diselesaikan. Berisi penjelasan tentang kesalahan apa yang terjadi.
Jenis: String
- Warnings
-
Daftar peringatan yang terjadi selama operasi dokumen-analisis.
Jenis: ArrayWarningobjek
Kesalahan
- AccessDeniedException
-
Anda tidak berwenang untuk melakukan tindakan. Gunakan Amazon Resource Name (ARN) dari pengguna resmi atau IAM role untuk melakukan operasi.
Kode Status HTTP: 400
- InternalServerError
-
Amazon Textract Texact mengalami masalah layanan. Coba lagi panggilan Anda.
Kode Status HTTP: 500
- InvalidJobIdException
-
Pengenal pekerjaan yang tidak valid diteruskan keGetDocumentAnalysisatau untukGetDocumentAnalysis.
Kode Status HTTP: 400
- InvalidKMSKeyException
-
Menunjukkan bahwa Anda tidak memiliki izin mendekripsi dengan kunci KMS yang dimasukkan, atau kunci KMS dimasukkan secara tidak benar.
Kode Status HTTP: 400
- InvalidParameterException
-
Parameter input melanggar batasan. Misalnya, dalam operasi sinkron,
InvalidParameterException
pengecualian terjadi ketika salah satuS3Object
atauBytes
nilai-nilai yang disediakan dalamDocument
parameter permintaan. Validasi parameter Anda sebelum memanggil operasi API lagi.Kode Status HTTP: 400
- InvalidS3ObjectException
-
Amazon Textract Texact tidak dapat mengakses objek S3 yang ditentukan dalam permintaan. untuk informasi selengkapnya,Mengkonfigurasi Akses ke Amazon S3Untuk informasi pemecahan masalah, lihatPemecahan Masalah Amazon S3
Kode Status HTTP: 400
- ProvisionedThroughputExceededException
-
Jumlah permintaan melebihi batas throughput Anda. Jika Anda ingin meningkatkan batas ini, hubungi Amazon Textract.
Kode Status HTTP: 400
- ThrottlingException
-
Amazon Textract Texact untuk sementara tidak dapat memproses permintaan. Coba lagi panggilan Anda.
Kode Status HTTP: 500
Lihat Juga
Untuk informasi selengkapnya tentang penggunaan API ini di salah satu bahasa khususAWSSDK, lihat yang berikut ini: