CallAnalyticsJobSettings - 转录

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

CallAnalyticsJobSettings

为您的StartCallAnalyticsJob请求提供其他可选设置,包括内容编辑、自动语言识别;允许您应用自定义语言模型、自定义词汇过滤器和自定义词汇。

目录

ContentRedaction

可以编辑或标记笔录中的信息(PII)。如果使用ContentRedaction,则还必须包括子参数:PiiEntityTypesRedactionOutput、和RedactionType

类型:ContentRedaction 对象

必需:否

LanguageIdSettings

如果在请求中使用自动语言识别,并且您想要应用自定义语言模型、自定义词汇表或自定义词汇过滤器,请LanguageIdSettings包含相关的子参数(VocabularyNameLanguageModelName、和VocabularyFilterName)。

LanguageIdSettings支持两到五种语言代码。您包含的每种语言代码都可以具有相关的自定义语言模型、自定义词汇表和自定义词汇过滤器。您指定的语言代码必须与关联的自定义语言模型、自定义词汇表和自定义词汇过滤器的语言相匹配。

建议您在使用LanguageOptions时包括在内,LanguageIdSettings以确保识别出正确的语言方言。例如,如果您指定的自定义词汇表为,en-US但 Amazon Transcribe 确定您的媒体使用的语言为en-AU,则您的自定义词汇表不会应用于您的转录。如果您将LanguageOptions和包含en-US为唯一的英语方言,则您的自定义词汇将应用您的转录。

如果您想在请求中包含自定义语言模型、自定义词汇表或自定义词汇过滤器,但想使用自动语言识别,请改用带有LanguageModelNameVocabularyName、或VocabularyFilterName CallAnalyticsJobSettings 参数的参数。

有关 Call Analytics 支持的语言列表,请参阅支持的语言和特定语言的功能

类型:字符串到LanguageIdSettings对象映射

映射条目:最多 5 项。

有效密钥: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

必需:否

LanguageModelName

处理呼叫分析任务时要使用的自定义语言模型的名称。请注意,自定义语言模型名称区分大小写。

指定的自定义语言模型的语言必须与您在转录请求中指定的语言代码相匹配。如果语言不匹配,则不应用自定义语言模型。不存在与语言不匹配相关的错误或警告。

类型:字符串

长度限制:最小长度为 1。最大长度为 200。

模式:^[0-9a-zA-Z._-]+

必需:否

LanguageOptions

您可以指定两种或更多种语言代码,以代表您认为媒体中可能存在的语言。不建议包含超过五个。如果您不确定存在哪些语言,请不要包含此参数。

包括语言选项可以提高语言识别的准确性。

有关呼叫分析支持的语言列表,请参阅支持的语言表。

要使用现代标准阿拉伯语 (ar-SA) 转录语音,您的媒体文件必须以 16,000 Hz 或更高的采样率进行编码。

类型:字符串数组

数组成员:最少 1 项。

有效值: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

必需:否

VocabularyFilterMethod

指定您希望如何将自定义词汇过滤器应用于成绩单。

要将单词替换为***,请选择mask

要删除单词,请选择remove

要标记单词而不对其进行更改,请选择tag

类型:字符串

有效值: remove | mask | tag

必需:否

VocabularyFilterName

您要在 Call Analytics 转录请求中包含的自定义词汇过滤器的名称。自定义的词来过滤名称区分大小写。

请注意,如果您在请求VocabularyFilterName中包含,则还必须包括VocabularyFilterMethod

类型:字符串

长度限制:最小长度为 1。最大长度为 200。

模式:^[0-9a-zA-Z._-]+

必需:否

VocabularyName

您想要包含在 Call Analytics 转录请求中的自定义词汇表的名称。自定义词名称区分大小写。

类型:字符串

长度限制:最小长度为 1。最大长度为 200。

模式:^[0-9a-zA-Z._-]+

必需:否

另请参阅

有关在特定语言的 AWS 软件开发工具包中使用此 API 的更多信息,请参阅以下内容: