Gunakan Kondisi Aktivasi Loop Manusia Skema JSON dengan Amazon Texttract - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Gunakan Kondisi Aktivasi Loop Manusia Skema JSON dengan Amazon Texttract

Saat digunakan dengan Amazon A2I, AnalyzeDocument operasi mendukung input berikut dalam parameter: ConditionType

  • ImportantFormKeyConfidenceCheck— Gunakan kondisi ini untuk membuat loop manusia ketika keyakinan inferensi berada dalam kisaran yang ditentukan untuk kunci formulir dokumen dan blok kata. Kunci formulir adalah kata apa pun dalam dokumen yang dikaitkan dengan input. Input disebut nilai. Bersama-sama, kunci bentuk dan nilai disebut sebagai pasangan kunci-nilai. Blok kata mengacu pada kata-kata yang dikenali Amazon Textract di dalam blok teks yang terdeteksi. Untuk mempelajari selengkapnya tentang blok dokumen Amazon Textract, lihat Dokumen dan Blokir Objek di Panduan Pengembang Amazon Textract.

  • MissingImportantFormKey— Gunakan kondisi ini untuk membuat loop manusia ketika Amazon Textract tidak mengidentifikasi kunci atau alias terkait dalam dokumen.

  • Sampling— Gunakan kondisi ini untuk menentukan persentase formulir untuk dikirim ke manusia untuk ditinjau, terlepas dari skor kepercayaan inferensi. Gunakan kondisi ini untuk melakukan hal berikut:

    • Audit model ML Anda dengan mengambil sampel secara acak semua formulir yang dianalisis oleh model Anda dan mengirimkan persentase tertentu kepada manusia untuk ditinjau.

    • Dengan menggunakan ImportantFormKeyConfidenceCheck kondisi tersebut, sampel secara acak persentase kesimpulan yang memenuhi kondisi yang ditentukan ImportantFormKeyConfidenceCheck untuk memulai loop manusia dan hanya mengirim persentase yang ditentukan kepada manusia untuk ditinjau.

catatan

Jika Anda mengirim permintaan yang sama ke AnalyzeDocument beberapa kali, hasilnya Sampling tidak berubah untuk inferensi input itu. Misalnya, jika Anda membuat AnalyzeDocument permintaan sekali, dan Sampling tidak memulai loop manusia, permintaan berikutnya AnalyzeDocument dengan konfigurasi yang sama tidak memulai loop manusia.

ImportantFormKeyConfidenceCheckInput dan Hasil

ImportantFormKeyConfidenceCheckConditionTypeMendukung yang berikut iniConditionParameters:

  • ImportantFormKey— String yang mewakili kunci dalam pasangan kunci-nilai yang terdeteksi oleh Amazon Ttract yang perlu ditinjau oleh pekerja manusia. Jika nilai parameter ini adalah nilai catch-all khusus (*), maka semua kunci dianggap cocok dengan kondisi tersebut. Anda dapat menggunakan ini untuk memodelkan kasus di mana setiap pasangan nilai kunci yang memenuhi ambang kepercayaan tertentu memerlukan tinjauan manusia.

  • ImportantFormKeyAliases— Array yang mewakili ejaan alternatif atau ekuivalen logis untuk kunci bentuk penting.

  • KeyValueBlockConfidenceEquals

  • KeyValueBlockConfidenceLessThan

  • KeyValueBlockConfidenceLessThanEquals

  • KeyValueBlockConfidenceGreaterThan

  • KeyValueBlockConfidenceGreaterThanEquals

  • WordBlockConfidenceEquals

  • WordBlockConfidenceLessThan

  • WordBlockConfidenceLessThanEquals

  • WordBlockConfidenceGreaterThan

  • WordBlockConfidenceGreaterThanEquals

Saat Anda menggunakan ImportantFormKeyConfidenceCheckConditionType, Amazon A2I mengirimkan blok nilai kunci dan inferensi blok kata dari blok nilai kunci dan alias terkait yang Anda tentukan dalam dan untuk tinjauan manusia. ImportantFormKey ImportantFormKeyAliases

Saat membuat definisi alur, jika Anda menggunakan templat tugas pekerja default yang disediakan di bagian alur kerja peninjauan manusia di SageMaker konsol Amazon, nilai kunci dan inferensi blok yang dikirim untuk tinjauan manusia oleh kondisi aktivasi ini disertakan dalam UI pekerja. Jika Anda menggunakan template tugas pekerja kustom, Anda harus menyertakan {{ task.input.selectedAiServiceResponse.blocks }} elemen untuk menyertakan data input nilai awal (inferensi) dari Amazon Textract. Untuk contoh template kustom yang menggunakan elemen masukan ini, lihatContoh Template Kustom untuk Amazon Texttract.

MissingImportantFormKeyInput dan Hasil

MissingImportantFormKeyConditionTypeMendukung yang berikut iniConditionParameters:

  • ImportantFormKey— String yang mewakili kunci dalam pasangan kunci-nilai yang terdeteksi oleh Amazon Ttract yang perlu ditinjau oleh pekerja manusia.

  • ImportantFormKeyAliases— Array yang mewakili ejaan alternatif atau ekuivalen logis untuk kunci bentuk penting.

Saat Anda menggunakan MissingImportantFormKeyConditionType, jika kunci masuk ImportantFormKey atau alias di tidak ImportantFormKeyAliases disertakan dalam inferensi Amazon Textract, formulir tersebut dikirim ke manusia untuk ditinjau dan tidak ada pasangan nilai kunci yang diprediksi disertakan. Misalnya, jika Amazon Textract hanya diidentifikasi Address dan Phone dalam bentuk, tetapi tidak ada ImportantFormKey Name (dalam tipe MissingImportantFormKey kondisi) formulir tersebut akan dikirim ke manusia untuk ditinjau tanpa ada kunci formulir yang terdeteksi (AddressdanPhone).

Jika Anda menggunakan templat tugas pekerja default yang disediakan di SageMaker konsol, tugas akan dibuat meminta pekerja untuk mengidentifikasi kunci dalam ImportantFormKey dan nilai terkait. Jika Anda menggunakan template tugas pekerja khusus, Anda perlu menyertakan elemen HTML <task.input.humanLoopContext> khusus untuk mengonfigurasi tugas ini.

Sampling Input dan Hasil

SamplingConditionTypeMendukung RandomSamplingPercentageConditionParameters. Input untuk RandomSamplingPercentage harus bilangan real antara 0,01 dan 100. Angka ini mewakili persentase data yang memenuhi syarat untuk tinjauan manusia dan dikirim ke manusia untuk ditinjau. Jika Anda menggunakan Sampling kondisi tanpa kondisi lain, angka ini mewakili persentase dari semua kesimpulan yang dihasilkan yang dibuat oleh AnalyzeDocument operasi dari satu permintaan yang dikirim ke manusia untuk ditinjau.

Jika Anda menentukan Sampling kondisi tanpa jenis kondisi lain, semua nilai kunci dan kesimpulan blok dikirim ke pekerja untuk ditinjau.

Saat membuat definisi alur, jika Anda menggunakan templat tugas pekerja default yang disediakan di bagian alur kerja tinjauan Manusia di SageMaker konsol, semua nilai kunci dan inferensi blok yang dikirim untuk tinjauan manusia oleh kondisi aktivasi ini disertakan dalam UI pekerja. Jika Anda menggunakan template tugas pekerja kustom, Anda harus menyertakan {{ task.input.selectedAiServiceResponse.blocks }} elemen untuk menyertakan data input nilai awal (inferensi) dari Amazon Textract. Untuk contoh template kustom yang menggunakan elemen masukan ini, lihatContoh Template Kustom untuk Amazon Texttract.

Contoh-contoh

Meskipun hanya satu kondisi yang perlu dievaluasi true untuk memulai loop manusia, Amazon A2I mengevaluasi semua kondisi untuk setiap objek yang dianalisis oleh Amazon Textract. Peninjau manusia diminta untuk meninjau kunci formulir penting untuk semua kondisi yang dievaluasi. true

Contoh 1: Deteksi kunci formulir penting dengan skor kepercayaan dalam rentang tertentu yang memulai loop manusia

Contoh berikut menunjukkan HumanLoopActivationConditions JSON yang memulai loop manusia jika salah satu dari tiga kondisi berikut terpenuhi:

  • Amazon Textract AnalyzeDocument API mengembalikan pasangan kunci-nilai yang kuncinya adalah salah Employee Name satuEmployeeName,, atau, dengan keyakinan blok nilai kunci kurang dari 60 dan kepercayaan masing-masing blok kata yang membentuk kunci dan nilai kurang dari 85. Name

  • Amazon Textract AnalyzeDocument API mengembalikan pasangan kunci-nilai yang kuncinya adalah salah satu dari Pay Date PayDateDateOfPay,pay-date,, atau, dengan keyakinan blok nilai kunci kurang dari 65 dan kepercayaan masing-masing blok kata yang membentuk kunci dan nilai menjadi kurang dari 85.

  • Amazon Textract AnalyzeDocument API mengembalikan pasangan kunci-nilai yang kuncinya adalah salah Gross Pay satuGrossAmount,, atau, dengan keyakinan blok nilai kunci kurang dari 60 dan kepercayaan masing-masing blok kata yang membentuk kunci dan nilai kurang dari 85. GrossPay

{ "Conditions": [ { "ConditionType": "ImportantFormKeyConfidenceCheck", "ConditionParameters": { "ImportantFormKey": "Employee Name", "ImportantFormKeyAliases": [ "Name", "EmployeeName" ], "KeyValueBlockConfidenceLessThan": 60, "WordBlockConfidenceLessThan": 85 } }, { "ConditionType": "ImportantFormKeyConfidenceCheck", "ConditionParameters": { "ImportantFormKey": "Pay Date", "ImportantFormKeyAliases": [ "PayDate", "DateOfPay", "pay-date" ], "KeyValueBlockConfidenceLessThan": 65, "WordBlockConfidenceLessThan": 85 } }, { "ConditionType": "ImportantFormKeyConfidenceCheck", "ConditionParameters": { "ImportantFormKey": "Gross Pay", "ImportantFormKeyAliases": [ "GrossPay", "GrossAmount" ], "KeyValueBlockConfidenceLessThan": 60, "WordBlockConfidenceLessThan": 85 } } ] }

Contoh 2: Gunakan ImportantFormKeyConfidenceCheck

Dalam contoh berikut, jika Amazon Textract mendeteksi pasangan kunci-nilai yang kepercayaannya untuk blok nilai kunci kurang dari 60 dan kurang dari 90 untuk blok kata yang mendasarinya, itu menciptakan loop manusia. Peninjau manusia diminta untuk meninjau semua pasangan nilai kunci formulir yang cocok dengan perbandingan nilai kepercayaan.

{ "Conditions": [ { "ConditionType": "ImportantFormKeyConfidenceCheck", "ConditionParameters": { "ImportantFormKey": "*", "KeyValueBlockConfidenceLessThan": 60, "WordBlockConfidenceLessThan": 90 } } ] }

Contoh 3: Gunakan Sampling

Dalam contoh berikut, 5% kesimpulan yang dihasilkan dari permintaan Amazon AnalyzeDocument Textract dikirim ke pekerja manusia untuk ditinjau. Semua pasangan nilai kunci yang terdeteksi yang dikembalikan oleh Amazon Ttract dikirim ke pekerja untuk ditinjau.

{ "Conditions": [ { "ConditionType": "Sampling", "ConditionParameters": { "RandomSamplingPercentage": 5 } } ] }

Contoh 4: Gunakan MissingImportantFormKey

Dalam contoh berikut, jika Mailing Address atau aliasnyaMailing Address:, hilang dari kunci yang terdeteksi oleh Amazon Textract, tinjauan manusia dimulai. Saat menggunakan templat tugas pekerja default, UI pekerja meminta pekerja untuk mengidentifikasi kunci Mailing Address atau Mailing Address: dan nilai terkaitnya.

{ "ConditionType": "MissingImportantFormKey", "ConditionParameters": { "ImportantFormKey": "Mailing Address", "ImportantFormKeyAliases": ["Mailing Address:"] } }

Contoh 5: Gunakan Sampling dan ImportantFormKeyConfidenceCheck dengan operator And

Dalam contoh ini, 5% pasangan nilai kunci yang terdeteksi oleh Amazon Textract yang kuncinya adalah Pay Date salah satu dari PayDateDateOfPay,,, pay-date atau, dengan kepercayaan blok nilai kunci kurang dari 65 dan kepercayaan dari masing-masing blok kata yang membentuk kunci dan nilai kurang dari 85, dikirim ke pekerja untuk ditinjau.

{ "Conditions": [ { "And": [ { "ConditionType": "Sampling", "ConditionParameters": { "RandomSamplingPercentage": 5 } }, { "ConditionType": "ImportantFormKeyConfidenceCheck", "ConditionParameters": { "ImportantFormKey": "Pay Date", "ImportantFormKeyAliases": [ "PayDate", "DateOfPay", "pay-date" ], "KeyValueBlockConfidenceLessThan": 65, "WordBlockConfidenceLessThan": 85 } } ] } ] }

Contoh 6: Gunakan Sampling dan ImportantFormKeyConfidenceCheck dengan operator And

Gunakan contoh ini untuk mengonfigurasi alur kerja tinjauan manusia Anda agar selalu mengirimkan kesimpulan kepercayaan rendah dari pasangan nilai kunci tertentu untuk tinjauan manusia dan sampel inferensi kepercayaan tinggi dari pasangan nilai kunci pada tingkat tertentu.

Dalam contoh berikut, tinjauan manusia dimulai dengan salah satu cara berikut:

  • Pasangan nilai kunci yang terdeteksi yang kuncinya adalah salah satu dariPay Date,PayDate,DateOfPay, ataupay-date, dengan nilai kunci dan kepercayaan blok kata kurang dari 60, dikirim untuk ditinjau oleh manusia. Hanya kunci Pay Date formulir (dan aliasnya) dan nilai terkait yang dikirim ke pekerja untuk ditinjau.

  • 5% dari pasangan nilai kunci yang terdeteksi yang kuncinya adalah salah satu dariPay Date,PayDate,DateOfPay, ataupay-date, dengan nilai kunci dan kepercayaan blok kata lebih besar dari 90, dikirim untuk ditinjau oleh manusia. Hanya kunci Pay Date formulir (dan aliasnya) dan nilai terkait yang dikirim ke pekerja untuk ditinjau.

{ "Conditions": [ { "Or": [ { "ConditionType": "ImportantFormKeyConfidenceCheck", "ConditionParameters": { "ImportantFormKey": "Pay Date", "ImportantFormKeyAliases": [ "PayDate", "DateOfPay", "pay-date" ], "KeyValueBlockConfidenceLessThan": 60, "WordBlockConfidenceLessThan": 60 } }, { "And": [ { "ConditionType": "Sampling", "ConditionParameters": { "RandomSamplingPercentage": 5 } }, { "ConditionType": "ImportantFormKeyConfidenceCheck", "ConditionParameters": { "ImportantFormKey": "Pay Date", "ImportantFormKeyAliases": [ "PayDate", "DateOfPay", "pay-date" ], "KeyValueBlockConfidenceLessThan": 90 "WordBlockConfidenceGreaterThan": 90 } } ] } ] } ] }

Contoh 7: Gunakan Sampling dan ImportantFormKeyConfidenceCheck dengan operator Or

Dalam contoh berikut, AnalyzeDocument operasi Amazon Textract mengembalikan pasangan kunci-nilai yang kuncinya adalah salah satu dari Pay DatePayDate,DateOfPay,pay-date, atau, dengan keyakinan blok nilai kunci kurang dari 65 dan kepercayaan dari masing-masing blok kata yang membentuk kunci dan nilai kurang dari 85. Selain itu, 5% dari semua bentuk lain memulai loop manusia. Untuk setiap formulir yang dipilih secara acak, semua pasangan nilai kunci yang terdeteksi untuk formulir tersebut dikirim ke manusia untuk ditinjau.

{ "Conditions": [ { "Or": [ { "ConditionType": "Sampling", "ConditionParameters": { "RandomSamplingPercentage": 5 } }, { "ConditionType": "ImportantFormKeyConfidenceCheck", "ConditionParameters": { "ImportantFormKey": "Pay Date", "ImportantFormKeyAliases": [ "PayDate", "DateOfPay", "pay-date" ], "KeyValueBlockConfidenceLessThan": 65, "WordBlockConfidenceLessThan": 85 } } } ] } ] }