本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
CreateLanguageModel
建立新自訂語言模型
建立新自訂語言語言模型時,您必須指定:
-
如果您想要寬頻 (音訊取樣率超過 16,000 Hz) 或窄頻 (16,000 Hz 以下的音訊取樣率) 基本型號
-
您的訓練和調校檔案的位置 (必須是 Amazon S3 URI)
-
您的模型語言
-
您的模型的唯一名稱
如需詳細資訊,請參閱自訂語言模型
請求語法
{
"BaseModelName": "string
",
"InputDataConfig": {
"DataAccessRoleArn": "string
",
"S3Uri": "string
",
"TuningDataS3Uri": "string
"
},
"LanguageCode": "string
",
"ModelName": "string
",
"Tags": [
{
"Key": "string
",
"Value": "string
"
}
]
}
請求參數
如需有關所有動作共用之參數的資訊,請參閱一般參數。
請求接受採用 JSON 格式的下列資料。
- BaseModelName
-
用於建立自訂語言模型的 Amazon 轉錄標準語言模型或基礎模型。Amazon Transcribe 為基本型號提供兩種選擇:寬頻和窄帶。
如果您要轉錄的音訊取樣率為 16,000 Hz 或更高,請選擇
WideBand
。若要轉錄取樣率小於 16,000 Hz 的音訊,請選擇NarrowBand
。類型:String
有效值:
NarrowBand | WideBand
必要:是
- InputDataConfig
-
包含您要用來建立新自訂語言模型的訓練資料的 Amazon S3 位置,以及存取此位置的許可。
使用時
InputDataConfig
,您必須包含以下子參數:S3Uri
,這是訓練資料的 Amazon S3 位置,以及DataAccessRoleArn
具有存取指定 Amazon S3 位置權限的角色的 Amazon 資源名稱 (ARN)。您可以選擇包括TuningDataS3Uri
調整資料的 Amazon S3 位置。如果您為訓練和調整資料指定不同的 Amazon S3 位置,則您使用的 ARN 必須具有存取這兩個位置的權限。類型:InputDataConfig 物件
必要:是
- LanguageCode
-
代表模型語言的語言代碼。每個自訂語言模型必須僅包含一種語言的術語,而且您為自訂語言模型選取的語言必須與訓練和調整資料的語言相符。
如需支援的語言及其相關語言代碼的清單,請參閱支援的語言表格。請注意,美國英語(
en-US
)是 Amazon Transcribe 醫療支持的唯一語言。自訂語言模型只能用於轉錄與模型相同語言的檔案。例如,如果您使用 US English (
en-US
) 建立自訂語言模型,則只能將此模型套用至包含英文音訊的檔案。類型:String
有效值:
en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP
必要:是
- ModelName
-
由您為自訂語言模型選擇的唯一名稱。
此名稱區分大小寫,不能包含空格,且在AWS 帳戶. 如果您嘗試使用與現有自訂語言模型相同的名稱建立新的自訂語言模型,則會出現
ConflictException
錯誤訊息。類型:String
長度限制:長度下限為 1。長度上限為 200。
模式:
^[0-9a-zA-Z._-]+
必要:是
- Tags
-
在您建立此新模型時,將一個或多個自訂標籤 (每個標籤都以 key: value 組的形式) 新增至新的自訂語言模型。
若要進一步了解有關使用標籤搭配 Amazon Transcribe 標籤轉錄標籤資源
類型:Tag 物件陣列
陣列成員:項目數下限為 1。項目數上限為 200。
必要:否
回應語法
{
"BaseModelName": "string",
"InputDataConfig": {
"DataAccessRoleArn": "string",
"S3Uri": "string",
"TuningDataS3Uri": "string"
},
"LanguageCode": "string",
"ModelName": "string",
"ModelStatus": "string"
}
回應元素
如果動作成功,則服務傳回 HTTP 200 回應。
服務會傳回下列 JSON 格式的資料。
- BaseModelName
-
您在建立自訂語言模型時指定的 Amazon Transcribe 標準語言模型或基礎模型。
類型:String
有效值:
NarrowBand | WideBand
- InputDataConfig
-
列出您的資料存取角色 ARN (Amazon 資源名稱) 以及您為訓練 (
S3Uri
) 和調整 (TuningDataS3Uri
) 資料提供的 Amazon S3 位置。類型:InputDataConfig 物件
- LanguageCode
-
您為自訂語言模型選取的語言代碼。
類型:String
有效值:
en-US | hi-IN | es-US | en-GB | en-AU | de-DE | ja-JP
- ModelName
-
您自訂語言模型的名稱。
類型:String
長度限制:長度下限為 1。長度上限為 200。
模式:
^[0-9a-zA-Z._-]+
- ModelStatus
-
您自訂語言模型的狀態。當狀態顯示為時
COMPLETED
,您的模型即已準備好可供使用。類型:String
有效值:
IN_PROGRESS | FAILED | COMPLETED
錯誤
如需所有動作常見的錯誤相關資訊,請參閱常見錯誤。
- BadRequestException
-
您的要求未通過一或多個驗證測試。當您嘗試刪除的實體不存在或處於非終端狀態(例如
IN PROGRESS
)時,可能會發生這種情況。如需詳細資訊,請參閱例外訊息欄位HTTP 狀態碼:400
- ConflictException
-
具有此名稱的資源已存在。AWS 帳戶
HTTP 狀態碼:400
- InternalFailureException
-
發生內部錯誤 檢查錯誤訊息,修正問題,然後再試一次您的要求。
HTTP 狀態碼:500
- LimitExceededException
-
您可能傳送太多要求,或輸入檔案太長。請先等候再重試您的要求,或使用較小的檔案再試一次。
HTTP 狀態碼:400
另請參閱
如需在語言特定的 AWS 開發套件之一中使用此 API 的詳細資訊,請參閱下列說明: