Pedoman dan kuota - Amazon Comprehend

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pedoman dan kuota

Kecuali ditentukan lain, kuota Amazon Comprehend adalah per wilayah. Anda dapat meminta peningkatan kuota yang dapat disesuaikan jika diperlukan untuk aplikasi Anda. Untuk informasi tentang kuota dan untuk meminta peningkatan kuota, lihat Service AWS Quotas.

Wilayah yang Didukung

Amazon Comprehend tersedia di Wilayah berikut: AWS

  • AS Timur (Ohio)

  • AS Timur (Virginia Utara)

  • US West (Oregon)

  • Asia Pasifik (Mumbai)

  • Asia Pasifik (Seoul)

  • Asia Pasifik (Singapura)

  • Asia Pasifik (Sydney)

  • Asia Pasifik (Tokyo)

  • Kanada (Pusat)

  • Eropa (Frankfurt)

  • Eropa (Irlandia)

  • Eropa (London)

  • AWS GovCloud (AS-Barat)

Secara default, Amazon Comprehend menyediakan semua operasi API di setiap wilayah yang didukung. Untuk pengecualian, lihatPemrosesan dokumen.

Untuk informasi tentang titik akhir API, lihat Wilayah dan Titik Akhir Amazon Comprehend di Referensi Umum Amazon Web Services.

Untuk meninjau kuota saat ini di suatu wilayah, atau meminta kenaikan kuota untuk kuota yang dapat disesuaikan, buka konsol Service Quotas.

Kuota untuk model bawaan

Amazon Comprehend menyediakan model bawaan bagi Anda untuk menganalisis dokumen teks UTF-8. Amazon Comprehend menyediakan operasi sinkron dan asinkron yang menggunakan model bawaan.

Analisis waktu nyata (sinkron)

Bagian ini menjelaskan kuota yang terkait dengan analisis waktu nyata menggunakan model bawaan.

Operasi dokumen tunggal

Amazon Comprehend API menyediakan operasi yang mengambil satu dokumen sebagai input. Kuota berikut berlaku untuk operasi ini.

Kuota umum untuk operasi dokumen tunggal

Kuota berikut berlaku untuk analisis real-time untuk mendeteksi entitas, frasa kunci, atau bahasa dominan. Untuk deteksi entitas, kuota ini berlaku untuk deteksi dengan model bawaan. Untuk deteksi entitas kustom, lihat kuota diPengakuan entitas kustom .

Deskripsi Kuota/Pedoman
Ukuran dokumen maksimum 100 KB
Kuota khusus operasi untuk operasi dokumen tunggal

Kuota berikut berlaku untuk analisis real-time untuk mendeteksi sentimen, sentimen yang ditargetkan, dan sintaksis.

Deskripsi Kuota/Pedoman
Ukuran dokumen maksimum 5 KB

Beberapa operasi dokumen

Amazon Comprehend API menyediakan operasi batch yang memproses beberapa dokumen dengan satu permintaan API. Kuota berikut berlaku untuk operasi batch.

Deskripsi Kuota/Pedoman
Ukuran dokumen maksimum 5 KB
Maksimum dokumen per permintaan 25

Untuk informasi selengkapnya tentang menggunakan operasi dokumen batch, lihatBeberapa dokumen pemrosesan sinkron.

Permintaan pembatasan untuk permintaan real-time (sinkron)

Amazon Comprehend menerapkan pelambatan dinamis ke permintaan sinkron. Jika bandwidth pemrosesan sistem tersedia, Amazon Comprehend secara bertahap meningkatkan jumlah permintaan Anda yang diproses. Untuk mengontrol penggunaan aplikasi Anda dari operasi API sinkron, kami sarankan Anda mengaktifkan peringatan penagihan atau menerapkan pembatasan laju dalam aplikasi Anda.

Analisis asinkron

Bagian ini menjelaskan kuota yang terkait dengan analisis asinkron menggunakan model bawaan.

Operasi API asinkron masing-masing mendukung maksimal 10 pekerjaan aktif. Untuk melihat kuota untuk setiap operasi API, lihat tabel Service Quotas di titik akhir Amazon Comprehend dan kuota di Referensi Umum Amazon Web Services.

Untuk kuota yang dapat disesuaikan, Anda dapat meminta peningkatan kuota menggunakan konsol Service Quotas.

Kuota umum untuk operasi asinkron

Anda dapat menjalankan pekerjaan analisis asinkron menggunakan konsol atau operasi API apa pun. Start* Untuk informasi tentang kapan menggunakan operasi asinkron, lihat. Pemrosesan batch asinkron Kuota berikut berlaku untuk sebagian besar Start* operasi API untuk model bawaan. Untuk pengecualian, lihatKuota khusus operasi untuk pekerjaan asinkron.

Deskripsi Kuota/Pedoman
Ukuran maksimum setiap dokumen dalam pekerjaan yang mendeteksi entitas, frasa kunci, PII, dan bahasa 1 MB
Ukuran total maksimum semua file dalam permintaan 5 GB
Ukuran total minimum semua file dalam permintaan 500 byte
Jumlah maksimum file, satu dokumen per file 1.000.000
Jumlah baris maksimum, satu dokumen per baris 1.000.000

Kuota khusus operasi untuk pekerjaan asinkron

Bagian ini menjelaskan kuota untuk operasi asinkron tertentu. Jika kuota tidak ditentukan dalam tabel berikut, nilai kuota umum berlaku.

Sentimen

Pekerjaan sentimen asinkron, yang Anda buat dengan StartSentimentDetectionJoboperasi, memiliki kuota berikut.

Deskripsi Kuota/Pedoman
Ukuran maksimum setiap dokumen masukan 5 KB
Sentimen yang ditargetkan

Pekerjaan sentimen bertarget asinkron, yang Anda buat dengan StartTargetedSentimentDetectionJoboperasi, memiliki kuota berikut.

Deskripsi Kuota/Pedoman
Format dokumen yang didukung UTF-8
Ukuran maksimum setiap dokumen dalam suatu pekerjaan 10 KB
Ukuran maksimum semua dokumen dalam suatu pekerjaan 300 MB
Jumlah maksimum file, satu dokumen per file 30.000
Jumlah baris maksimum, satu dokumen per baris (untuk semua file dalam permintaan) 30.000
Peristiwa

Pekerjaan deteksi peristiwa asinkron, yang Anda buat dengan StartEventsDetectionJoboperasi, memiliki kuota berikut.

Deskripsi Kuota
Pengkodean karakter UTF-8
Ukuran total semua file dalam suatu pekerjaan 50 MB
Ukuran maksimum setiap dokumen dalam suatu pekerjaan 10 KB
Jumlah maksimum file, satu dokumen per file 5.000
Jumlah baris maksimum, satu dokumen per baris (untuk semua file yang diminta) 5.000
Pemodelan topik

Pekerjaan pemodelan topik asinkron, yang Anda buat dengan StartTopicsDetectionJoboperasi, memiliki kuota berikut.

Deskripsi Kuota/Pedoman
Pengkodean karakter UTF-8
Jumlah maksimum topik yang akan dikembalikan 100
Ukuran file maksimum untuk satu file, satu dokumen per file 100 MB

Lihat informasi yang lebih lengkap di Pemodelan topik

Permintaan pembatasan untuk permintaan asinkron

Setiap operasi API asinkron mendukung jumlah maksimum permintaan per detik (per wilayah, per akun), dan juga maksimum 10 pekerjaan aktif. Untuk melihat kuota untuk setiap operasi API, lihat tabel Service Quotas di titik akhir Amazon Comprehend dan kuota di Referensi Umum Amazon Web Services.

Untuk kuota yang dapat disesuaikan, Anda dapat meminta peningkatan kuota menggunakan konsol Service Quotas.

Kuota untuk model khusus

Anda dapat menggunakan Amazon Comprehend untuk membuat model kustom Anda sendiri untuk klasifikasi kustom dan pengenalan entitas kustom. Bagian ini memberikan pedoman dan kuota yang terkait dengan pelatihan dan penggunaan model khusus. Untuk informasi selengkapnya tentang model kustom, lihatAmazon Comprehend Kustom.

Kuota umum

Amazon Comprehend menetapkan kuota ukuran umum untuk setiap jenis dokumen input yang dapat Anda analisis dengan model khusus. Untuk kuota analisis waktu nyata, lihatUkuran dokumen maksimum untuk analisis waktu nyata. Untuk kuota analisis asinkron, lihat. Masukan untuk analisis kustom asinkron

Setiap operasi API asinkron mendukung jumlah maksimum permintaan per detik (per wilayah, per akun), dan juga maksimum 10 pekerjaan aktif. Untuk melihat kuota untuk setiap operasi API, lihat tabel Service Quotas di titik akhir Amazon Comprehend dan kuota di Referensi Umum Amazon Web Services.

Untuk kuota yang dapat disesuaikan, Anda dapat meminta peningkatan kuota menggunakan konsol Service Quotas.

Kuota untuk titik akhir

Anda membuat endpoint untuk menjalankan analisis real-time dengan model kustom. Untuk informasi tentang titik akhir, lihatMengelola titik akhir Amazon Comprehend.

Kuota berikut berlaku untuk titik akhir. Untuk informasi tentang cara meminta peningkatan kuota, lihat AWS Service Quotas.

Deskripsi Kuota/Pedoman
Jumlah maksimum titik akhir aktif per Wilayah untuk setiap akun 20
Jumlah maksimum unit inferensi per Wilayah untuk setiap akun 200
Jumlah maksimum unit inferensi per titik akhir per wilayah 50
Throughput maksimum per unit inferensi (karakter) 100/detik
Throughput maksimum per unit inferensi (dokumen) 2/detik

Klasifikasi dokumen

Bagian ini menjelaskan pedoman dan kuota untuk operasi klasifikasi dokumen berikut:

Kuota umum untuk klasifikasi dokumen

Tabel berikut menjelaskan kuota umum yang terkait dengan pelatihan pengklasifikasi kustom.

Deskripsi Kuota/Pedoman
Panjang maksimum nama kelas 5.000 karakter
Jumlah kelas (mode multi-kelas) 2—1.000
Jumlah kelas (mode multi-label) 2—100
Format anotasi
Jumlah minimum anotasi per kelas (mode multi-kelas) 10
Jumlah minimum anotasi per kelas (mode multi-label) 10
Jumlah minimum anotasi (mode multi-label) 50
Format file CSV
Jumlah minimum dokumen pelatihan per kelas (mode multi-kelas) 50
Jumlah minimum dokumen pelatihan per kelas (mode multi-label) 10
Jumlah minimum dokumen pelatihan (mode multi-label) 50

Klasifikasi untuk dokumen teks biasa

Anda membuat dan melatih model teks biasa menggunakan dokumen input teks biasa. Amazon Comprehend menyediakan operasi real-time dan asinkron untuk mengklasifikasikan dokumen teks biasa menggunakan model teks biasa.

Pelatihan

Tabel berikut menjelaskan kuota yang terkait dengan pelatihan pengklasifikasi kustom dengan dokumen teks biasa.

Deskripsi Kuota/Pedoman
Ukuran total semua file dalam pekerjaan pelatihan 5 GB
Jumlah maksimum file manifes tambahan untuk melatih pengklasifikasi kustom 5
Jumlah maksimum nama atribut untuk setiap file manifes yang ditambah 5
Panjang maksimum nama atribut 63 karakter
Analisis waktu nyata (sinkron)

Tabel berikut menjelaskan kuota yang terkait dengan klasifikasi real-time dokumen teks biasa.

Deskripsi Kuota/Pedoman
Jumlah maksimum dokumen per permintaan sinkron 1
Ukuran dokumen teks maksimum (UTF-8 dikodekan) 10 KB
Analisis asinkron

Tabel berikut menjelaskan kuota yang terkait dengan klasifikasi asinkron dokumen teks biasa.

Deskripsi Kuota/Pedoman
Ukuran total semua file dalam pekerjaan asinkron 5 GB
Ukuran file maksimum untuk satu file, satu dokumen per file 10 MB
Jumlah maksimum file, satu dokumen per file 1.000.000
Jumlah baris maksimum, satu dokumen per baris (untuk semua file yang diminta) 1.000.000

Klasifikasi untuk dokumen semi-terstruktur

Bagian ini menjelaskan pedoman dan kuota untuk klasifikasi dokumen semi-terstruktur. Untuk mengklasifikasikan dokumen semi-terstruktur, gunakan model dokumen asli yang Anda latih dengan dokumen input asli.

Melatih model dokumen asli dengan dokumen semi-terstruktur

Tabel berikut menjelaskan kuota yang terkait dengan pelatihan pengklasifikasi kustom dengan dokumen semi-terstruktur, seperti dokumen PDF, dokumen Word, dan file gambar.

Deskripsi Kuota/Pedoman
Jumlah halaman maksimum di semua dokumen 10.000
Ukuran file anotasi maksimum (semua ukuran file CSV digabungkan) 5 MB
Ukuran korpus dokumen (dokumen pelatihan dan pengujian) 10 GB
Ukuran file untuk pelatihan dan pengujian file
Ukuran file gambar (JPG, PNG, TIFF). 1 byte—10 MB.

File TIFF: maksimum satu halaman.

Ukuran halaman untuk dokumen PDF 1 byte—10 MB
Ukuran halaman untuk dokumen Word 1 byte—10 MB
Amazon Textract API keluaran ukuran JSON 1 byte—1 MB
Analisis waktu nyata (sinkron)

Bagian ini menjelaskan kuota yang terkait dengan klasifikasi real-time dari dokumen semi-terstruktur.

Tabel berikut menunjukkan ukuran file maksimum untuk dokumen masukan. Untuk semua jenis dokumen input, maksimum file input adalah satu halaman, dengan tidak lebih dari 10.000 karakter.

Tipe file Ukuran maksimum (API) Ukuran maksimum (konsol)
Dokumen teks UTF-8 10 KB 10 KB
Dokumen PDF 10 MB 5 MB
Dokumen Word 10 MB 5 MB
File gambar 10 MB 5 MB
Ukuran keluaran API Amazon Texttract 1 MB T/A
Analisis asinkron

Tabel berikut menjelaskan kuota yang terkait dengan klasifikasi asinkron dokumen semi-terstruktur.

Deskripsi Kuota/Pedoman
Jumlah maksimum halaman di semua dokumen masukan untuk suatu pekerjaan 25.000
Ukuran korpus dokumen 25 GB
Ukuran file gambar (JPG, PNG, atau TIFF) 1 byte—10 MB.

File TIFF: maksimum satu halaman.

Ukuran halaman untuk dokumen PDF 1 byte—10 MB
Ukuran halaman untuk dokumen Word 1 byte—10 MB
Ukuran JSON keluaran API Textract 1 byte—1 MB.

Pengakuan entitas kustom

Bagian ini menjelaskan pedoman dan kuota untuk operasi berikut untuk pengenalan entitas kustom:

Pengenalan entitas khusus untuk dokumen teks biasa

Amazon Comprehend menyediakan operasi asinkron dan sinkronisasi untuk menganalisis dokumen teks biasa dengan pengenal entitas khusus.

Pelatihan

Bagian ini menjelaskan kuota yang terkait dengan pelatihan pengenal entitas khusus untuk menganalisis dokumen teks biasa. Untuk melatih model, Anda dapat memberikan daftar entitas atau satu set dokumen teks beranotasi.

Tabel berikut menjelaskan kuota yang terkait dengan pelatihan model dengan daftar entitas.

Deskripsi Kuota/Pedoman
Jumlah entitas per model 1—25
Ukuran dokumen (UTF-8) 1—5.000 byte
Jumlah item dalam daftar entitas 1—1 juta
Panjang entri individu (post-strip) dalam daftar entri 1—5.000
Ukuran korpus daftar entitas (semua dokumen dalam teks biasa digabungkan) 5 KB —200 MB

Tabel berikut menjelaskan kuota yang terkait dengan pelatihan model dengan dokumen teks beranotasi.

Deskripsi Kuota/Pedoman
Jumlah entitas per model/pengenal entitas kustom 1—25
Ukuran dokumen (UTF-8) 1—5.000 byte
Jumlah dokumen (lihat anotasi teks biasa) 3—200.000
Ukuran korpus dokumen (semua dokumen dalam plaintext digabungkan) 5 KB - 200 MB
Jumlah minimum anotasi per entitas 25
Analisis waktu nyata (sinkron)

Tabel berikut menjelaskan kuota yang terkait dengan analisis real-time dari dokumen teks biasa.

Deskripsi Kuota/Pedoman
Jumlah maksimum dokumen per permintaan sinkron 1
Ukuran dokumen teks maksimum (UTF-8 dikodekan) 5 KB
Analisis asinkron

Tabel berikut menjelaskan kuota yang terkait dengan pengakuan entitas asinkron dari dokumen teks biasa.

Deskripsi Kuota/Pedoman
Ukuran dokumen (UTF-8) 1 byte—1 MB
Jumlah maksimum file, satu dokumen per file 1.000.000
Jumlah baris maksimum, satu dokumen per baris (untuk semua file yang diminta) 1.000.000
Ukuran korpus dokumen (semua dokumen dalam plaintext digabungkan) 1 byte—5 GB

Pengakuan entitas khusus untuk dokumen semi-terstruktur

Amazon Comprehend menyediakan operasi asinkron dan sinkronisasi untuk menganalisis dokumen semi-terstruktur dengan pengenal entitas kustom. Anda harus melatih model menggunakan dokumen PDF beranotasi.

Pelatihan

Tabel berikut menjelaskan kuota yang terkait dengan pelatihan pengenal entitas kustom (CreateEntityRecognizer) untuk menganalisis dokumen semi-terstruktur.

Deskripsi Kuota/Pedoman
Jumlah entitas per model/pengenal entitas kustom 1—25
Ukuran file anotasi maksimum (UTF-8 JSON) 5 MB
Jumlah dokumen 250—10.000
Ukuran korpus dokumen (semua dokumen dalam plaintext digabungkan) 5 KB—1 GB
Jumlah minimum anotasi per entitas 100
Jumlah maksimum file manifes tambahan untuk melatih pengenal entitas kustom 5
Jumlah maksimum nama atribut untuk setiap file manifes yang ditambah 5
Panjang maksimum nama atribut 63 karakter
Analisis waktu nyata (sinkron)

Bagian ini menjelaskan kuota yang terkait dengan analisis real-time dari dokumen semi-terstruktur.

Tabel berikut menunjukkan ukuran file maksimum untuk dokumen masukan. Untuk semua jenis dokumen input, maksimum file input adalah satu halaman, dengan tidak lebih dari 10.000 karakter.

Tipe file Ukuran maksimum (API) Ukuran maksimum (konsol)
Dokumen teks UTF-8 10 KB 10 KB
Dokumen PDF 10 MB 5 MB
Dokumen Word 10 MB 5 MB
File gambar 10 MB 5 MB
File keluaran Textract 1 MB T/A
Analisis asinkron

Bagian ini menjelaskan kuota untuk analisis asinkron dokumen semi-terstruktur.

Deskripsi Kuota/Pedoman
Ukuran gambar (JPG atau PNG) 1 byte—10 MB
Ukuran gambar (TIFF) 1 byte—10 MB. Maksimal satu halaman.
Ukuran dokumen (PDF) 1 byte—50 MB
Ukuran dokumen (Docx) 1 byte—5 MB
Ukuran dokumen (UTF-8) 1 byte—1 MB
Jumlah maksimum file, satu dokumen per file (satu dokumen per baris tidak diperbolehkan untuk file gambar atau dokumen PDF/Word) 500
Jumlah halaman maksimum untuk file PDF atau Docx 100
Ukuran korpus dokumen setelah ekstraksi teks (plaintext, semua file digabungkan) 1 byte—5 GB

Untuk informasi selengkapnya tentang batas gambar, lihat Batas Keras di Amazon Texttract

Kuota untuk flywheels

Gunakan flywheels untuk mengelola pelatihan dan pelacakan versi model kustom untuk klasifikasi kustom dan pengenalan entitas kustom. Untuk informasi lebih lanjut tentang Flywheels, lihat. Roda Gila

Kuota umum untuk flywheels

Kuota berikut berlaku untuk roda gaya dan iterasi flywheel.

Deskripsi Kuota/Pedoman
Jumlah maksimum flywheel 50
Jumlah maksimum flywheel dalam keadaan CREATING 10
Jumlah maksimum kumpulan data pelatihan per flywheel 50
Jumlah maksimum dataset uji per flywheel 50
Jumlah maksimum kumpulan data dengan status INGESTING 10
Jumlah maksimum iterasi flywheel yang sedang berlangsung per akun 10

Kuota set data untuk model klasifikasi khusus

Saat Anda menelan kumpulan data untuk flywheel yang terkait dengan model klasifikasi kustom, kuota berikut berlaku.

Deskripsi Kuota/Pedoman
Jumlah minimum dokumen pelatihan per kelas (mode multi-label) 50
Jumlah maksimum dokumen pelatihan 1.000.000
Ukuran dataset minimum 500 byte
Ukuran dataset maksimum 5 GB
Ukuran file maksimum untuk satu file, satu dokumen per file 10 MB

Kuota set data untuk model pengenalan entitas khusus

Saat Anda menelan kumpulan data untuk flywheel yang terkait dengan model pengenalan entitas kustom, kuota berikut berlaku.

Deskripsi Kuota/Pedoman
Ukuran dokumen maksimum 5 KB
Jumlah minimum dokumen pelatihan 3
Jumlah maksimum dokumen pelatihan 200.000
Jumlah minimum anotasi per entitas 25
Ukuran dataset maksimum 200 MB