本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
CreateMedicalVocabulary
创建新的自定义医学词汇。
在创建新的自定义医学词汇表之前,您必须先将包含新条目、短语和术语的文本文件上传到 Amazon S3 存储桶。请注意,这与您可以使用Phrases
标志在请求中包含术语列表不同CreateVocabulary;CreateMedicalVocabulary
不支持该Phrases
标志。
每种语言都有一个字符集,其中包含该特定语言的所有允许字符。如果您使用不支持的字符,则您的自定义词汇请求将失败。请参阅 “自定义词汇表的字符集” 以获取适用于您的语言的字符集。
有关更多信息,请参阅自定义词汇。
请求语法
{
"LanguageCode": "string
",
"Tags": [
{
"Key": "string
",
"Value": "string
"
}
],
"VocabularyFileUri": "string
",
"VocabularyName": "string
"
}
请求参数
有关所有操作的Common (常用参数) 的更多信息,请参阅Common Permon (常用参数)。
请求接受采用 JSON 格式的以下数据。
- LanguageCode
-
代表自定义词汇表中条目语言的语言的语言代码。美国英语 (
en-US
) 是亚马逊 Transcribe Medical 支持的唯一语言。类型:字符串
有效值:
af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE
必需:是
- Tags
-
在创建新的自定义词汇表时,向新的自定义医学词汇表中添加一个或多个自定义标签,每个标签都采用 key: value 对的形式。
要了解有关在 Amazon Tron (常用语言) 中使用标签的更多信息,请参阅为资源添加标签。
类型:Tag 对象数组
数组成员:最少 1 项。最多 200 项。
必需:否
- VocabularyFileUri
-
包含您的自定义医学词汇表的文本文件的 Amazon S3 位置 (URI)。URI 必须与你调用的资源AWS 区域相同。
以下为示例 URI:
s3://DOC-EXAMPLE-BUCKET/my-vocab-file.txt
类型:字符串
长度限制:最小长度为 1。长度上限为 2000。
模式:
(s3://|http(s*)://).+
必需:是
- VocabularyName
-
由您为新的自定义医学词汇选择一个独特的名称。
此名称区分大小写,不能包含空格,并且在内必须是唯一的AWS 账户。如果您尝试创建与现有自定义医学词汇同名的新自定义医学词汇,则会出现
ConflictException
错误。类型:字符串
长度限制:最小长度为 1。最大长度为 200。
模式:
^[0-9a-zA-Z._-]+
必需:是
响应语法
{
"FailureReason": "string",
"LanguageCode": "string",
"LastModifiedTime": number,
"VocabularyName": "string",
"VocabularyState": "string"
}
响应元素
如果此操作成功,则该服务将会发送回 HTTP 200 响应。
服务以 JSON 格式返回的以下数据。
- FailureReason
-
如果
VocabularyState
是FAILED
,则FailureReason
包含有关医学转录任务请求失败的原因的信息。另请参阅:常见错误。类型:字符串
- LanguageCode
-
您为自定义医学词汇选择的语言代码。美国英语 (
en-US
) 是亚马逊 Transcribe Medical 支持的唯一语言。类型:字符串
有效值:
af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE
- LastModifiedTime
-
您创建自定义医学词汇的日期和时间。
时间戳的格式为
YYYY-MM-DD'T'HH:MM:SS.SSSSSS-UTC
。例如,2022-05-04T12:32:58.761000-07:00
表示 2022 年 5 月 4 日 UTC-7 下午 12:32。类型:Timestamp
- VocabularyName
-
您为自定义医学词汇选择的名称。
类型:字符串
长度限制:最小长度为 1。最大长度为 200。
模式:
^[0-9a-zA-Z._-]+
- VocabularyState
-
您的自定义医学词汇的处理状态。如果状态为
READY
,则可以在StartMedicalTranscriptionJob
请求中使用自定义词汇。类型:字符串
有效值:
PENDING | READY | FAILED
错误
有关所有操作常见错误的信息,请参阅常见错误。
- BadRequestException
-
您的请求未通过一项或多项验证测试。当您要删除的实体不存在或处于非终端状态(例如
IN PROGRESS
)时,可能会发生这种情况。有关更多信息,请参阅异常消息字段。HTTP 状态代码:400
- ConflictException
-
使用此名称的资源已经存在。资源名称在内必须是唯一的AWS 账户。
HTTP 状态代码:400
- InternalFailureException
-
出现内部错误。检查错误信息,更正问题,然后重试您的请求。
HTTP 状态代码:500
- LimitExceededException
-
你要么发送了太多的请求,要么你的输入文件太长。请稍候,然后重试您的请求,或者使用较小的文件重试您的请求。
HTTP 状态代码:400
另请参阅
有关在特定语言的 AWS 软件开发工具包中使用此 API 的更多信息,请参阅以下内容: