本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
CreateVocabulary
建立新的自訂詞彙。
建立新的自訂詞彙時,您可以將包含新項目、片語和詞語的文字檔案上傳到 Amazon S3 儲存貯體,並在請求中包含 URI。或者,您也可以使用Phrases
旗標直接在要求中加入字詞清單。
每種語言都有一個字元集,其中包含該特定語言允許的所有字元。如果您使用不支援的字元,您的自訂字彙請求就會失敗。請參閱自訂字彙的字元集,以取得您所用語言的字元集。
如需詳細資訊,請參閱自訂詞彙。
請求語法
{
"LanguageCode": "string
",
"Phrases": [ "string
" ],
"Tags": [
{
"Key": "string
",
"Value": "string
"
}
],
"VocabularyFileUri": "string
",
"VocabularyName": "string
"
}
請求參數
如需有關所有動作共用之參數的資訊,請參閱一般參數。
請求接受採用 JSON 格式的下列資料。
- LanguageCode
-
代表自訂字彙中項目語言的語言代碼。每個自訂字彙只能包含一種語言的術語。
自訂字彙只能用來轉錄與自訂字彙相同語言的檔案。例如,如果您使用美式英文 (
en-US
) 建立自訂字彙,則只能將此自訂字彙套用至包含英文音訊的檔案。如需支援的語言及其相關語言代碼的清單,請參閱支援的語言表格。
類型:String
有效值:
af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE
必要:是
- Phrases
-
如果您想要在請求中包含所有想要的詞彙 (以逗號分隔值) 來建立自訂字彙,請使用此參數。建立自訂詞彙的另一個選項是將項目儲存在文字檔中,並將其上傳到 Amazon S3 儲存貯體,然後使用
VocabularyFileUri
參數指定檔案的位置。請注意,如果您
Phrases
在請求中包含,則無法使用VocabularyFileUri
;您必須選擇其中一個。每種語言都有一個字元集,其中包含該特定語言允許的所有字元。如果您使用不支援的字元,您的自訂字彙篩選要求會失敗。請參閱自訂字彙的字元集,以取得您所用語言的字元集。
類型:字串陣列
長度限制:長度下限為 0。長度上限為 256。
模式:
.+
必要:否
- Tags
-
在您建立這個新的自訂字彙時,將一或多個自訂標記 (以 key: value 組的形式) 新增至新的自訂字彙中。
若要進一步了解有關使用標籤與 Amazon Transcribe 的詳細資訊,請參閱標籤資源。
類型:Tag 物件陣列
陣列成員:項目數下限為 1。項目數上限為 200。
必要:否
- VocabularyFileUri
-
包含您自訂詞彙的文字檔案的 Amazon S3 位置。URI 必須位於與您呼叫AWS 區域的資源相同的內。
範例如下的 URI 路徑範例如下:
s3://DOC-EXAMPLE-BUCKET/my-vocab-file.txt
請注意,如果您
VocabularyFileUri
在請求中包含,則無法使用該Phrases
標誌;您必須選擇其中一個。類型:String
長度限制:長度下限為 1。長度上限為 2000。
模式:
(s3://|http(s*)://).+
必要:否
- VocabularyName
-
一個由您選擇的唯一名稱,用於您的新自定義詞彙。
此名稱區分大小寫,不能包含空格,且在AWS 帳戶. 如果您嘗試建立與現有自訂字彙相同名稱的新自訂字彙,則會出現
ConflictException
錯誤訊息。類型:String
長度限制:長度下限為 1。長度上限為 200。
模式:
^[0-9a-zA-Z._-]+
必要:是
回應語法
{
"FailureReason": "string",
"LanguageCode": "string",
"LastModifiedTime": number,
"VocabularyName": "string",
"VocabularyState": "string"
}
回應元素
如果動作成功,則服務傳回 HTTP 200 回應。
服務會傳回下列 JSON 格式的資料。
- FailureReason
-
如果
VocabularyState
是FAILED
,則FailureReason
包含自訂字彙請求失敗原因的相關資訊。另請參閱:常見錯誤。類型:String
- LanguageCode
-
您為自訂字彙選取的語言代碼。
類型:String
有效值:
af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE
- LastModifiedTime
-
您建立自訂字彙的日期和時間。
時間戳記的格式為
YYYY-MM-DD'T'HH:MM:SS.SSSSSS-UTC
。例如,2022-05-04T12:32:58.761000-07:00
代表二零二二年五月四日下午十二時三十二分。UTC-7類型:Timestamp
- VocabularyName
-
您為自訂字彙選擇的名稱。
類型:String
長度限制:長度下限為 1。長度上限為 200。
模式:
^[0-9a-zA-Z._-]+
- VocabularyState
-
自訂字彙的處理狀態。如果狀態為
READY
,您可以在StartTranscriptionJob
請求中使用自訂字彙。類型:String
有效值:
PENDING | READY | FAILED
錯誤
如需所有動作常見的錯誤相關資訊,請參閱常見錯誤。
- BadRequestException
-
您的要求未通過一或多個驗證測試。當您嘗試刪除的實體不存在或處於非終端狀態(例如
IN PROGRESS
)時,可能會發生這種情況。如需詳細資訊,請參閱例外訊息欄位。HTTP 狀態碼:400
- ConflictException
-
具有此名稱的資源已存在。資源名稱在的內必須是獨一無二的AWS 帳戶。
HTTP 狀態碼:400
- InternalFailureException
-
發生內部錯誤。檢查錯誤訊息,修正問題,然後再試一次您的請求。
HTTP 狀態碼:500
- LimitExceededException
-
您可能傳送太多要求,或輸入檔案太長。請先等候再重試您的要求,或使用較小的檔案再試一次。
HTTP 狀態碼:400
另請參閱
如需在語言特定的 AWS 開發套件之一中使用此 API 的詳細資訊,請參閱下列說明: