CreateVocabulary - Transcribe

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

CreateVocabulary

Menciptakan kosakata kustom baru.

Saat membuat kosakata khusus baru, Anda dapat mengunggah file teks yang berisi entri, frasa, dan istilah baru Anda ke bucket Amazon S3 dan menyertakan URI dalam permintaan Anda. Atau Anda dapat menyertakan daftar istilah langsung dalam permintaan Anda menggunakanPhrases bendera.

Setiap bahasa memiliki kumpulan karakter yang berisi semua karakter yang diizinkan untuk bahasa tertentu. Jika Anda menggunakan karakter yang tidak didukung, permintaan kosakata kustom Anda gagal. Lihat Set Karakter untuk Kosakata Kustom untuk mendapatkan set karakter untuk bahasa Anda.

Untuk informasi selengkapnya, lihat Kosakata khusus.

Sintaksis Permintaan

{ "LanguageCode": "string", "Phrases": [ "string" ], "Tags": [ { "Key": "string", "Value": "string" } ], "VocabularyFileUri": "string", "VocabularyName": "string" }

Parameter Permintaan

Untuk informasi tentang parameter yang umum untuk semua tindakan, lihat Parameter Umum.

Permintaan menerima data berikut dalam format JSON.

LanguageCode

Kode bahasa yang mewakili bahasa entri dalam kosakata kustom Anda. Setiap kosakata khusus harus berisi istilah hanya dalam satu bahasa.

Kosakata khusus hanya dapat digunakan untuk mentranskripsikan file dalam bahasa yang sama dengan kosakata khusus. Misalnya, jika Anda membuat kosakata khusus menggunakan bahasa Inggris AS (en-US), Anda hanya dapat menerapkan kosakata khusus ini ke file yang berisi audio bahasa Inggris.

Untuk daftar bahasa yang didukung dan kode bahasa terkait, lihat tabel Bahasa yang didukung.

Jenis: String

Nilai Valid: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

Wajib: Ya

Phrases

Gunakan parameter ini jika Anda ingin membuat kosakata khusus dengan menyertakan semua istilah yang diinginkan, sebagai nilai yang dipisahkan koma, dalam permintaan Anda. Opsi lain untuk membuat kosakata khusus Anda adalah menyimpan entri Anda dalam file teks dan mengunggahnya ke bucket Amazon S3, lalu tentukan lokasi file Anda menggunakanVocabularyFileUri parameter.

Perhatikan bahwa jika Anda menyertakanPhrases dalam permintaan Anda, Anda tidak dapat menggunakanVocabularyFileUri; Anda harus memilih satu atau yang lain.

Setiap bahasa memiliki kumpulan karakter yang berisi semua karakter yang diizinkan untuk bahasa tertentu. Jika Anda menggunakan karakter yang tidak didukung, permintaan filter kosakata kustom Anda gagal. Lihat Set Karakter untuk Kosakata Kustom untuk mendapatkan set karakter untuk bahasa Anda.

Tipe: Array string

Batasan Panjang: Panjang minimum 0. Panjang maksimum 256.

Pola: .+

Wajib: Tidak

Tags

Menambahkan satu atau lebih tag kustom, masing-masing dalam bentuk pasangan key:value, ke kosakata kustom baru pada saat Anda membuat kosakata kustom baru ini.

Untuk mempelajari lebih lanjut tentang penggunaan tag dengan Amazon Transcribe, lihat sumber daya penandaan.

Tipe: Array objek Tag

Anggota Array: Jumlah minimum 1 item. Jumlah maksimum 200 item.

Wajib: Tidak

VocabularyFileUri

Lokasi Amazon S3 dari file teks yang berisi kosakata kustom Anda. URI harus ditempatkan diWilayah AWS sama dengan sumber daya yang Anda panggil.

Inilah contoh jalur URI:s3://DOC-EXAMPLE-BUCKET/my-vocab-file.txt

Perhatikan bahwa jika Anda menyertakanVocabularyFileUri dalam permintaan Anda, Anda tidak dapat menggunakanPhrases bendera; Anda harus memilih satu atau yang lain.

Jenis: String

Batasan Panjang: Panjang minimum 1. Panjang maksimum 2000.

Pola: (s3://|http(s*)://).+

Wajib: Tidak

VocabularyName

Nama unik, dipilih oleh Anda, untuk kosakata kustom baru Anda.

Nama ini peka huruf besar, tidak dapat berisi spasi, dan harus unik dalam sebuahAkun AWS. Jika Anda mencoba membuat kosakata kustom baru dengan nama yang sama dengan kosakata kustom yang ada, Anda mendapatkanConflictException kesalahan.

Jenis: String

Panjang Batasan: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

Diperlukan: Ya

Sintaksis Respons

{ "FailureReason": "string", "LanguageCode": "string", "LastModifiedTime": number, "VocabularyName": "string", "VocabularyState": "string" }

Elemen Respons

Jika tindakan berhasil, layanan mengirimkan kembali respons HTTP 200.

Layanan mengembalikan data berikut dalam format JSON.

FailureReason

JikaVocabularyState yaFAILED,FailureReason berisi informasi tentang mengapa permintaan kosakata kustom gagal. Lihat juga: Kesalahan Umum.

Jenis: String

LanguageCode

Kode bahasa yang Anda pilih untuk kosakata kustom Anda.

Jenis: String

Nilai Valid: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

LastModifiedTime

Tanggal dan waktu Anda membuat kosakata khusus Anda.

Stempel waktu dalam formatYYYY-MM-DD'T'HH:MM:SS.SSSSSS-UTC. Misalnya,2022-05-04T12:32:58.761000-07:00 mewakili 12:32 PM UTC-7 pada 4 Mei 2022.

Tipe: Timestamp

VocabularyName

Nama yang Anda pilih untuk kosakata kustom Anda.

Jenis: String

Panjang Batasan: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

VocabularyState

Keadaan pemrosesan kosakata khusus Anda. Jika statusnyaREADY, Anda dapat menggunakan kosakata khusus dalamStartTranscriptionJob permintaan.

Jenis: String

Nilai Valid: PENDING | READY | FAILED

Kesalahan

Untuk informasi tentang kesalahan yang umum untuk semua tindakan, lihat Kesalahan Umum.

BadRequestException

Permintaan Anda tidak lulus satu atau beberapa tes validasi. Hal ini dapat terjadi ketika entitas yang Anda coba hapus tidak ada atau jika itu dalam keadaan non-terminal (sepertiIN PROGRESS). Lihat kolom pesan pengecualian untuk informasi selengkapnya.

Kode Status HTTP: 400

ConflictException

Sumber daya sudah ada dengan nama ini. Nama sumber daya harus unik di dalamAkun AWS.

Kode Status HTTP: 400

InternalFailureException

Ada kesalahan internal. Periksa pesan kesalahan, perbaiki masalah, dan coba lagi permintaan Anda.

Kode Status HTTP: 500

LimitExceededException

Anda telah mengirim terlalu banyak permintaan atau file input Anda terlalu panjang. Tunggu sebelum mencoba ulang permintaan Anda, atau gunakan file yang lebih kecil dan coba lagi permintaan Anda.

Kode Status HTTP: 400

Lihat Juga

Untuk informasi selengkapnya tentang penggunaan API ini di salah satuAWS SDK khusus bahasa, lihat berikut ini: