AWS 文档 AWS SDK示例 GitHub 存储库中还有更多SDK示例
本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 Amazon Transcribe 示例 AWS CLI
以下代码示例向您展示了如何使用 AWS Command Line Interface 与 Amazon Transcribe 配合使用来执行操作和实现常见场景。
操作是大型程序的代码摘录,必须在上下文中运行。您可以通过操作了解如何调用单个服务函数,还可以通过函数相关场景的上下文查看操作。
每个示例都包含一个指向完整源代码的链接,您可以在其中找到有关如何在上下文中设置和运行代码的说明。
主题
操作
以下代码示例演示如何使用 create-language-model
。
- AWS CLI
-
示例 1:使用训练和调整数据创建自定义语言模型。
以下
create-language-model
示例创建了一个自定义语言模型。您可以使用自定义语言模型来提高法律、酒店、金融和保险等领域的转录性能。对于语言代码,请输入有效的语言代码。对于 base-model-name,请指定最适合您要使用自定义语言模型转录的音频采样率的基本模型。在 model-name 中,指定要调用自定义语言模型的名称。aws transcribe create-language-model \ --
language-code
language-code \ --base-model-name
base-model-name \ --model-namecli-clm-example
\ --input-data-config S3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-for-training-data",TuningDataS3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-for-tuning-data",DataAccessRoleArn="arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model"输出:
{ "LanguageCode": "language-code", "BaseModelName": "base-model-name", "ModelName": "cli-clm-example", "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-create-a-custom-language-model" }, "ModelStatus": "IN_PROGRESS" }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的使用自定义语言模型提高特定领域的转录准确性。
示例 2:仅使用训练数据创建自定义语言模型。
以下
create-language-model
示例转录音频文件。您可以使用自定义语言模型来提高法律、酒店、金融和保险等领域的转录性能。对于语言代码,请输入有效的语言代码。对于 base-model-name,请指定最适合您要使用自定义语言模型转录的音频采样率的基本模型。在 model-name 中,指定要调用自定义语言模型的名称。aws transcribe create-language-model \ --language-code
en-US
\ --base-model-name
base-model-name \ --model-namecli-clm-example
\ --input-data-config S3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-For-Training-Data",DataAccessRoleArn="arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model"输出:
{ "LanguageCode": "en-US", "BaseModelName": "base-model-name", "ModelName": "cli-clm-example", "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-For-Training-Data/", "DataAccessRoleArn": "arn:aws:iam::your-AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model" }, "ModelStatus": "IN_PROGRESS" }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的使用自定义语言模型提高特定领域的转录准确性。
-
有关API详细信息,请参阅AWS CLI 命令参考CreateLanguageModel
中的。
-
以下代码示例演示如何使用 create-medical-vocabulary
。
- AWS CLI
-
创建医学自定义词汇表
以下
create-medical-vocabulary
示例创建一个自定义词汇表。要创建自定义词汇表,您必须创建一个文本文件,其中包含要更准确地进行转录的所有术语。对于 vocabulary-file-uri,请指定该文本文件的亚马逊简单存储服务 (Amazon URI S3)。对于 language-code,指定与自定义词汇表的语言对应的语言代码。对于 vocabulary-name,指定所需的自定义词汇表名称。aws transcribe create-medical-vocabulary \ --vocabulary-name
cli-medical-vocab-example
\ --language-code
language-code \ --vocabulary-file-urihttps://DOC-EXAMPLE-BUCKET.AWS-Region.amazonaws.com/the-text-file-for-the-medical-custom-vocabulary.txt
输出:
{ "VocabularyName": "cli-medical-vocab-example", "LanguageCode": "language-code", "VocabularyState": "PENDING" }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的医疗自定义词汇表。
-
有关API详细信息,请参阅AWS CLI 命令参考CreateMedicalVocabulary
中的。
-
以下代码示例演示如何使用 create-vocabulary-filter
。
- AWS CLI
-
创建词汇过滤器
以下
create-vocabulary-filter
示例创建了一个词汇过滤器,该过滤器使用一个文本文件,其中包含您不想在转录中出现的单词列表。对于语言代码,请指定与词汇过滤器的语言相对应的语言代码。对于 vocabulary-filter-file-uri,请指定文本文件的亚马逊简单存储服务 (Amazon URI S3)。对于 vocabulary-filter-name,请指定词汇过滤器的名称。aws transcribe create-vocabulary-filter \ --
language-code
language-code \ --vocabulary-filter-file-uris3://DOC-EXAMPLE-BUCKET/vocabulary-filter.txt
\ --vocabulary-filter-namecli-vocabulary-filter-example
输出:
{ "VocabularyFilterName": "cli-vocabulary-filter-example", "LanguageCode": "language-code" }
有关更多信息,请参阅《Amazon Transcribe 开发者指南》中的筛选不需要的单词。
-
有关API详细信息,请参阅AWS CLI 命令参考CreateVocabularyFilter
中的。
-
以下代码示例演示如何使用 create-vocabulary
。
- AWS CLI
-
创建自定义词汇表
以下
create-vocabulary
示例创建一个自定义词汇表。要创建自定义词汇表,您必须创建一个文本文件,其中包含要更准确地进行转录的所有术语。对于 vocabulary-file-uri,请指定该文本文件的亚马逊简单存储服务 (Amazon URI S3)。对于 language-code,指定与自定义词汇表的语言对应的语言代码。对于 vocabulary-name,指定所需的自定义词汇表名称。aws transcribe create-vocabulary \ --
language-code
language-code \ --vocabulary-namecli-vocab-example
\ --vocabulary-file-uris3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/the-text-file-for-the-custom-vocabulary.txt
输出:
{ "VocabularyName": "cli-vocab-example", "LanguageCode": "language-code", "VocabularyState": "PENDING" }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的自定义词汇表。
-
有关API详细信息,请参阅AWS CLI 命令参考CreateVocabulary
中的。
-
以下代码示例演示如何使用 delete-language-model
。
- AWS CLI
-
删除自定义语言模型
以下
delete-language-model
示例删除了自定义语言模型。aws transcribe delete-language-model \ --
model-name
model-name此命令不生成任何输出。
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的使用自定义语言模型提高特定领域的转录准确性。
-
有关API详细信息,请参阅AWS CLI 命令参考DeleteLanguageModel
中的。
-
以下代码示例演示如何使用 delete-medical-transcription-job
。
- AWS CLI
-
删除医疗转录作业
以下
delete-medical-transcription-job
示例删除一个医疗转录作业。aws transcribe delete-medical-transcription-job \ --
medical-transcription-job-name
medical-transcription-job-name此命令不生成任何输出。
有关更多信息,请参阅《Amazon T DeleteMedicalTranscriptionJobranscribe 开发者指南》。
-
有关API详细信息,请参阅AWS CLI 命令参考DeleteMedicalTranscriptionJob
中的。
-
以下代码示例演示如何使用 delete-medical-vocabulary
。
- AWS CLI
-
删除医疗自定义词汇
以下
delete-medical-vocabulary
示例删除了医学自定义词汇表。在 “词汇名称” 中,指定医学自定义词汇的名称。aws transcribe delete-vocabulary \ --vocabulary-name
medical-custom-vocabulary-name
此命令不生成任何输出。
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的医疗自定义词汇表。
-
有关API详细信息,请参阅AWS CLI 命令参考DeleteMedicalVocabulary
中的。
-
以下代码示例演示如何使用 delete-transcription-job
。
- AWS CLI
-
删除一个转录作业
以下
delete-transcription-job
示例删除一个转录作业。aws transcribe delete-transcription-job \ --transcription-job-name
your-transcription-job
此命令不生成任何输出。
有关更多信息,请参阅《Amazon T DeleteTranscriptionJobranscribe 开发者指南》。
-
有关API详细信息,请参阅AWS CLI 命令参考DeleteTranscriptionJob
中的。
-
以下代码示例演示如何使用 delete-vocabulary-filter
。
- AWS CLI
-
删除词汇过滤器
以下
delete-vocabulary-filter
示例删除词汇过滤器。aws transcribe delete-vocabulary-filter \ --
vocabulary-filter-name
vocabulary-filter-name此命令不生成任何输出。
有关更多信息,请参阅《Amazon Transcribe 开发者指南》中的筛选不需要的单词。
-
有关API详细信息,请参阅AWS CLI 命令参考DeleteVocabularyFilter
中的。
-
以下代码示例演示如何使用 delete-vocabulary
。
- AWS CLI
-
删除自定义词汇表
以下
delete-vocabulary
示例删除一个自定义词汇表。aws transcribe delete-vocabulary \ --
vocabulary-name
vocabulary-name此命令不生成任何输出。
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的自定义词汇表。
-
有关API详细信息,请参阅AWS CLI 命令参考DeleteVocabulary
中的。
-
以下代码示例演示如何使用 describe-language-model
。
- AWS CLI
-
获取有关特定自定义语言模型的信息
以下
describe-language-model
示例获取有关特定自定义语言模型的信息。例如,在下方, BaseModelName 您可以看到您的模型是否使用 NarrowBand 或 WideBand 模型进行训练。带有 NarrowBand 基本模型的自定义语言模型可以转录采样率小于 16 kHz 的音频。使用 WideBand 基础模型的语言模型可以转录采样率大于 16 kHz 的音频。S3Uri 参数表示您用于访问训练数据以创建自定义语言模型的 Amazon S3 前缀。aws transcribe describe-language-model \ --model-name
cli-clm-example
输出:
{ "LanguageModel": { "ModelName": "cli-clm-example", "CreateTime": "2020-09-25T17:57:38.504000+00:00", "LastModifiedTime": "2020-09-25T17:57:48.585000+00:00", "LanguageCode": "language-code", "BaseModelName": "base-model-name", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model" } } }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的使用自定义语言模型提高特定领域的转录准确性。
-
有关API详细信息,请参阅AWS CLI 命令参考DescribeLanguageModel
中的。
-
以下代码示例演示如何使用 get-medical-transcription-job
。
- AWS CLI
-
获取有关特定医疗转录工作的信息
以下
get-medical-transcription-job
示例获取有关特定医疗转录作业的信息。要访问转录结果,请使用 TranscriptFileUri 参数。如果您为转录作业启用了其他功能,则可以在 “设置” 对象中看到这些功能。Specialty 参数显示提供者的医疗专业知识。Type 参数表示转录作业中的语音是医疗对话还是医疗听写。aws transcribe get-medical-transcription-job \ --medical-transcription-job-name
vocabulary-dictation-medical-transcription-job
输出:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "TranscriptionJobStatus": "COMPLETED", "LanguageCode": "en-US", "MediaSampleRateHertz": 48000, "MediaFormat": "mp4", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-audio-file.file-extension" }, "Transcript": { "TranscriptFileUri": "https://s3.Region.amazonaws.com/Amazon-S3-Prefix/vocabulary-dictation-medical-transcription-job.json" }, "StartTime": "2020-09-21T21:17:27.045000+00:00", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "CompletionTime": "2020-09-21T21:17:59.561000+00:00", "Settings": { "ChannelIdentification": false, "ShowAlternatives": false, "VocabularyName": "cli-medical-vocab-example" }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }
有关更多信息,请参阅《Amazon Transcribe 开发者指南》中的批量转录。
-
有关API详细信息,请参阅AWS CLI 命令参考GetMedicalTranscriptionJob
中的。
-
以下代码示例演示如何使用 get-medical-vocabulary
。
- AWS CLI
-
获取有关医学自定义词汇的信息
以下
get-medical-vocabulary
示例获取有关医学自定义词汇的信息。您可以使用 VocabularyState 参数来查看词汇表的处理状态。如果是READY,你可以在 StartMedicalTranscriptionJob 操作中使用它。 :aws transcribe get-medical-vocabulary \ --vocabulary-name
medical-vocab-example
输出:
{ "VocabularyName": "medical-vocab-example", "LanguageCode": "en-US", "VocabularyState": "READY", "LastModifiedTime": "2020-09-19T23:59:04.349000+00:00", "DownloadUri": "https://link-to-download-the-text-file-used-to-create-your-medical-custom-vocabulary" }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的医疗自定义词汇表。
-
有关API详细信息,请参阅AWS CLI 命令参考GetMedicalVocabulary
中的。
-
以下代码示例演示如何使用 get-transcription-job
。
- AWS CLI
-
获取有关特定转录作业的信息
以下
get-transcription-job
示例获取有关特定转录作业的信息。要访问转录结果,请使用 TranscriptFileUri 参数。使用 MediaFileUri 参数查看您使用此作业转录了哪个音频文件。您可以使用 Settings 对象查看在转录作业中启用的可选功能。aws transcribe get-transcription-job \ --transcription-job-name
your-transcription-job
输出:
{ "TranscriptionJob": { "TranscriptionJobName": "your-transcription-job", "TranscriptionJobStatus": "COMPLETED", "LanguageCode": "language-code", "MediaSampleRateHertz": 48000, "MediaFormat": "mp4", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "Transcript": { "TranscriptFileUri": "https://Amazon-S3-file-location-of-transcription-output" }, "StartTime": "2020-09-18T22:27:23.970000+00:00", "CreationTime": "2020-09-18T22:27:23.948000+00:00", "CompletionTime": "2020-09-18T22:28:21.197000+00:00", "Settings": { "ChannelIdentification": false, "ShowAlternatives": false }, "IdentifyLanguage": true, "IdentifiedLanguageScore": 0.8672199249267578 } }
有关更多信息,请参阅《Amazon Transcribe 开发者指南》中的入门(AWS 命令行界面)。
-
有关API详细信息,请参阅AWS CLI 命令参考GetTranscriptionJob
中的。
-
以下代码示例演示如何使用 get-vocabulary-filter
。
- AWS CLI
-
获取有关词汇过滤器的信息
以下
get-vocabulary-filter
示例获取有关词汇过滤器的信息。您可以使用 DownloadUri 参数获取用于创建词汇过滤器的单词列表。aws transcribe get-vocabulary-filter \ --vocabulary-filter-name
testFilter
输出:
{ "VocabularyFilterName": "testFilter", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-07T22:39:32.147000+00:00", "DownloadUri": "https://Amazon-S3-location-to-download-your-vocabulary-filter" }
有关更多信息,请参阅《Amazon Transcribe 开发者指南》中的筛选不需要的单词。
-
有关API详细信息,请参阅AWS CLI 命令参考GetVocabularyFilter
中的。
-
以下代码示例演示如何使用 get-vocabulary
。
- AWS CLI
-
获取有关自定义词汇表的信息
以下
get-vocabulary
示例获取有关以前创建的自定义词汇表的信息。aws transcribe get-vocabulary \ --vocabulary-name
cli-vocab-1
输出:
{ "VocabularyName": "cli-vocab-1", "LanguageCode": "language-code", "VocabularyState": "READY", "LastModifiedTime": "2020-09-19T23:22:32.836000+00:00", "DownloadUri": "https://link-to-download-the-text-file-used-to-create-your-custom-vocabulary" }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的自定义词汇表。
-
有关API详细信息,请参阅AWS CLI 命令参考GetVocabulary
中的。
-
以下代码示例演示如何使用 list-language-models
。
- AWS CLI
-
列出您的自定义语言模型
以下
list-language-models
示例列出了与您的 AWS 账户和地区关联的自定义语言模型。您可以使用S3Uri
和TuningDataS3Uri
参数来查找用作训练数据或调整数据的 Amazon S3 前缀。会 BaseModelName 告诉你是否使用了 NarrowBand或 WideBand 模型来创建自定义语言模型。您可以使用 NarrowBand 基本模型使用自定义语言模型转录采样率低于 16 kHz 的音频。您可以使用 WideBand 基本模型使用自定义语言模型转录 16 kHz 或更高的音频。该ModelStatus
参数显示您是否可以在转录作业中使用自定义语言模型。如果该值为COMPLETED,则可以在转录作业中使用它。aws transcribe list-language-models
输出:
{ "Models": [ { "ModelName": "cli-clm-2", "CreateTime": "2020-09-25T17:57:38.504000+00:00", "LastModifiedTime": "2020-09-25T17:57:48.585000+00:00", "LanguageCode": "language-code", "BaseModelName": "WideBand", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-tuning-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } }, { "ModelName": "cli-clm-1", "CreateTime": "2020-09-25T17:16:01.835000+00:00", "LastModifiedTime": "2020-09-25T17:16:15.555000+00:00", "LanguageCode": "language-code", "BaseModelName": "WideBand", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } }, { "ModelName": "clm-console-1", "CreateTime": "2020-09-24T19:26:28.076000+00:00", "LastModifiedTime": "2020-09-25T04:25:22.271000+00:00", "LanguageCode": "language-code", "BaseModelName": "NarrowBand", "ModelStatus": "COMPLETED", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } } ] }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的使用自定义语言模型提高特定领域的转录准确性。
-
有关API详细信息,请参阅AWS CLI 命令参考ListLanguageModels
中的。
-
以下代码示例演示如何使用 list-medical-transcription-jobs
。
- AWS CLI
-
列出医疗转录作业
以下
list-medical-transcription-jobs
示例列出了与您的 AWS 账户和地区相关的医疗转录作业。要获取有关特定转录作业的更多信息,请在转录输出中复制 MedicalTranscriptionJobName 参数的值,然后为命令的MedicalTranscriptionJobName
选项指定该值。get-medical-transcription-job
要查看更多转录作业,请复制 NextToken 参数的值,再次运行该list-medical-transcription-jobs
命令,然后在--next-token
选项中指定该值。aws transcribe list-medical-transcription-jobs
输出:
{ "NextToken": "3/PblzkiGhzjER3KHuQt2fmbPLF7cDYafjFMEoGn44ON/gsuUSTIkGyanvRE6WMXFd/ZTEc2EZj+P9eii/z1O2FDYli6RLI0WoRX4RwMisVrh9G0Kie0Y8ikBCdtqlZB10Wa9McC+ebOl+LaDtZPC4u6ttoHLRlEfzqstHXSgapXg3tEBtm9piIaPB6MOM5BB6t86+qtmocTR/qrteHZBBudhTfbCwhsxaqujHiiUvFdm3BQbKKWIW06yV9b+4f38oD2lVIan+vfUs3gBYAl5VTDmXXzQPBQOHPjtwmFI+IWX15nSUjWuN3TUylHgPWzDaYT8qBtu0Z+3UG4V6b+K2CC0XszXg5rBq9hYgNzy4XoFh/6s5DoSnzq49Q9xHgHdT2yBADFmvFK7myZBsj75+2vQZOSVpWUPy3WT/32zFAcoELHR4unuWhXPwjbKU+mFYfUjtTZ8n/jq7aQEjQ42A+X/7K6JgOcdVPtEg8PlDr5kgYYG3q3OmYXX37U3FZuJmnTI63VtIXsNnOU5eGoYObtpk00Nq9UkzgSJxqj84ZD5n+S0EGy9ZUYBJRRcGeYUM3Q4DbSJfUwSAqcFdLIWZdp8qIREMQIBWy7BLwSdyqsQo2vRrd53hm5aWM7SVf6pPq6X/IXR5+1eUOOD8/coaTT4ES2DerbV6RkV4o0VT1d0SdVX/MmtkNG8nYj8PqU07w7988quh1ZP6D80veJS1q73tUUR9MjnGernW2tAnvnLNhdefBcD+sZVfYq3iBMFY7wTy1P1G6NqW9GrYDYoX3tTPWlD7phpbVSyKrh/PdYrps5UxnsGoA1b7L/FfAXDfUoGrGUB4N3JsPYXX9D++g+6gV1qBBs/WfF934aKqfD6UTggm/zV3GAOWiBpfvAZRvEb924i6yGHyMC7y54O1ZAwSBupmI+FFd13CaPO4kN1vJlth6aM5vUPXg4BpyUhtbRhwD/KxCvf9K0tLJGyL1A==", "MedicalTranscriptionJobSummaries": [ { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "StartTime": "2020-09-21T21:17:27.045000+00:00", "CompletionTime": "2020-09-21T21:17:59.561000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }, { "MedicalTranscriptionJobName": "alternatives-dictation-medical-transcription-job", "CreationTime": "2020-09-21T21:01:14.569000+00:00", "StartTime": "2020-09-21T21:01:14.592000+00:00", "CompletionTime": "2020-09-21T21:01:43.606000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }, { "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "CreationTime": "2020-09-21T19:09:18.171000+00:00", "StartTime": "2020-09-21T19:09:18.199000+00:00", "CompletionTime": "2020-09-21T19:10:22.516000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" }, { "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "CreationTime": "2020-09-21T18:43:37.157000+00:00", "StartTime": "2020-09-21T18:43:37.265000+00:00", "CompletionTime": "2020-09-21T18:44:21.192000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" }, { "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "CreationTime": "2020-09-20T23:46:44.053000+00:00", "StartTime": "2020-09-20T23:46:44.081000+00:00", "CompletionTime": "2020-09-20T23:47:35.851000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } ] }
有关更多信息,请参阅《亚马逊转录开发者指南》中的 https://docs.aws.amazon.com/transcribe/ latest/dg/batch-med-transcription.html>。
-
有关API详细信息,请参阅AWS CLI 命令参考ListMedicalTranscriptionJobs
中的。
-
以下代码示例演示如何使用 list-medical-vocabularies
。
- AWS CLI
-
列出您的医学自定义词汇表
以下
list-medical-vocabularies
示例列出了与您的 AWS 账户和地区相关的医学自定义词汇表。要获取有关特定转录作业的更多信息,请在转录输出中复制MedicalTranscriptionJobName
参数的值,然后为命令的MedicalTranscriptionJobName
选项指定该值。get-medical-transcription-job
要查看更多转录作业,请复制NextToken
参数的值,再次运行该list-medical-transcription-jobs
命令,然后在--next-token
选项中指定该值。aws transcribe list-medical-vocabularies
输出:
{ "Vocabularies": [ { "VocabularyName": "cli-medical-vocab-2", "LanguageCode": "en-US", "LastModifiedTime": "2020-09-21T21:44:59.521000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "cli-medical-vocab-1", "LanguageCode": "en-US", "LastModifiedTime": "2020-09-19T23:59:04.349000+00:00", "VocabularyState": "READY" } ] }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的医疗自定义词汇表。
-
有关API详细信息,请参阅AWS CLI 命令参考ListMedicalVocabularies
中的。
-
以下代码示例演示如何使用 list-transcription-jobs
。
- AWS CLI
-
列出转录作业
以下
list-transcription-jobs
示例列出了与您的 AWS 账户和地区相关的转录作业。aws transcribe list-transcription-jobs
输出:
{ "NextToken": "NextToken", "TranscriptionJobSummaries": [ { "TranscriptionJobName": "speak-id-job-1", "CreationTime": "2020-08-17T21:06:15.391000+00:00", "StartTime": "2020-08-17T21:06:15.416000+00:00", "CompletionTime": "2020-08-17T21:07:05.098000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "job-1", "CreationTime": "2020-08-17T20:50:24.207000+00:00", "StartTime": "2020-08-17T20:50:24.230000+00:00", "CompletionTime": "2020-08-17T20:52:18.737000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "sdk-test-job-4", "CreationTime": "2020-08-17T20:32:27.917000+00:00", "StartTime": "2020-08-17T20:32:27.956000+00:00", "CompletionTime": "2020-08-17T20:33:15.126000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "Diarization-speak-id", "CreationTime": "2020-08-10T22:10:09.066000+00:00", "StartTime": "2020-08-10T22:10:09.116000+00:00", "CompletionTime": "2020-08-10T22:26:48.172000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "your-transcription-job-name", "CreationTime": "2020-07-29T17:45:09.791000+00:00", "StartTime": "2020-07-29T17:45:09.826000+00:00", "CompletionTime": "2020-07-29T17:46:20.831000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" } ] }
有关更多信息,请参阅《Amazon Transcribe 开发者指南》中的入门(AWS 命令行界面)。
-
有关API详细信息,请参阅AWS CLI 命令参考ListTranscriptionJobs
中的。
-
以下代码示例演示如何使用 list-vocabularies
。
- AWS CLI
-
列出自定义词汇表
以下
list-vocabularies
示例列出了与您的 AWS 账户和地区关联的自定义词汇表。aws transcribe list-vocabularies
输出:
{ "NextToken": "NextToken", "Vocabularies": [ { "VocabularyName": "ards-test-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-27T22:00:27.330000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "sample-test", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T23:04:11.044000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-test-3-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T22:12:22.277000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-test-2", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T21:53:50.455000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-1-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T21:39:33.356000+00:00", "VocabularyState": "READY" } ] }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的自定义词汇表。
-
有关API详细信息,请参阅AWS CLI 命令参考ListVocabularies
中的。
-
以下代码示例演示如何使用 list-vocabulary-filters
。
- AWS CLI
-
列出你的词汇过滤器
以下
list-vocabulary-filters
示例列出了与您的 AWS 账户和地区关联的词汇过滤器。aws transcribe list-vocabulary-filters
输出:
{ "NextToken": "NextToken": [ { "VocabularyFilterName": "testFilter", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-07T22:39:32.147000+00:00" }, { "VocabularyFilterName": "testFilter2", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-21T23:29:35.174000+00:00" }, { "VocabularyFilterName": "filter2", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-08T20:18:26.426000+00:00" }, { "VocabularyFilterName": "filter-review", "LanguageCode": "language-code", "LastModifiedTime": "2020-06-03T18:52:30.448000+00:00" }, { "VocabularyFilterName": "crlf-filt", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-22T19:42:42.737000+00:00" } ] }
有关更多信息,请参阅《Amazon Transcribe 开发者指南》中的筛选不需要的单词。
-
有关API详细信息,请参阅AWS CLI 命令参考ListVocabularyFilters
中的。
-
以下代码示例演示如何使用 start-medical-transcription-job
。
- AWS CLI
-
示例 1:转录存储为音频文件的医疗口述
以下
start-medical-transcription-job
示例转录一个音频文件。您可以在OutputBucketName
参数中指定转录输出位置。aws transcribe start-medical-transcription-job \ --cli-input-json
file://myfile.json
myfile.json
的内容:{ "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" } }
输出:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T00:35:22.256000+00:00", "CreationTime": "2020-09-20T00:35:22.218000+00:00", "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的批量转录概述。
示例 2:转录存储为音频文件的临床医生与患者之间的对话
以下
start-medical-transcription-job
示例转录包含有临床医生与患者之间对话的音频文件。您可以在 OutputBucketName 参数中指定转录输出的位置。aws transcribe start-medical-transcription-job \ --cli-input-json
file://mysecondfile.json
mysecondfile.json
的内容:{ "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" } }
输出:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "simple-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T23:19:49.965000+00:00", "CreationTime": "2020-09-20T23:19:49.941000+00:00", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的批量转录概述。
示例 3:转录临床医生与患者之间对话的多声道音频文件
以下
start-medical-transcription-job
示例转录音频文件中每个声道的音频,并将每个声道的单独转录合并为一个转录输出。您可以在OutputBucketName
参数中指定转录输出位置。aws transcribe start-medical-transcription-job \ --cli-input-json
file://mythirdfile.json
mythirdfile.json
的内容:{ "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ChannelIdentification": true } }
输出:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T23:46:44.081000+00:00", "CreationTime": "2020-09-20T23:46:44.053000+00:00", "Settings": { "ChannelIdentification": true }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的声道识别。
示例 4:转录临床医生与患者之间对话的音频文件并在转录输出中识别发言者
以下
start-medical-transcription-job
示例转录一个音频文件,并在转录输出中标记每个发言者的语音。您可以在OutputBucketName
参数中指定转录输出位置。aws transcribe start-medical-transcription-job \ --cli-input-json
file://myfourthfile.json
myfourthfile.json
的内容:{ "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }
输出:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T18:43:37.265000+00:00", "CreationTime": "2020-09-21T18:43:37.157000+00:00", "Settings": { "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的识别发言者。
示例 5:转录存储为音频文件的医疗对话,最多两个备选转录
以下
start-medical-transcription-job
示例通过单个音频文件创建最多两个备选转录。每个转录具有关联的置信度。默认情况下,Amazon Transcribe 返回置信度最高的转录。您可以指定 Amazon Transcribe 返回置信度较低的其他转录。您可以在OutputBucketName
参数中指定转录输出位置。aws transcribe start-medical-transcription-job \ --cli-input-json
file://myfifthfile.json
myfifthfile.json
的内容:{ "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowAlternatives": true, "MaxAlternatives": 2 } }
输出:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T19:09:18.199000+00:00", "CreationTime": "2020-09-21T19:09:18.171000+00:00", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 2 }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的备选转录。
示例 6:转录医疗口述音频文件,最多具有两个备选转录
以下
start-medical-transcription-job
示例转录一个音频文件,并使用词汇表过滤器屏蔽任何不需要的单词。您可以在 OutputBucketName 参数中指定转录输出的位置。aws transcribe start-medical-transcription-job \ --cli-input-json
file://mysixthfile.json
mysixthfile.json
的内容:{ "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowAlternatives": true, "MaxAlternatives": 2 } }
输出:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "alternatives-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T21:01:14.592000+00:00", "CreationTime": "2020-09-21T21:01:14.569000+00:00", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 2 }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的备选转录。
示例 7:使用自定义词汇表更准确地转录医疗口述音频文件
以下
start-medical-transcription-job
示例转录一个音频文件,并使用您以前创建的医学自定义词汇表提高转录准确性。您可以在OutputBucketName
参数中指定转录输出位置。aws transcribe start-transcription-job \ --cli-input-json
file://myseventhfile.json
mysixthfile.json
的内容:{ "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "VocabularyName": "cli-medical-vocab-1" } }
输出:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T21:17:27.045000+00:00", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "Settings": { "VocabularyName": "cli-medical-vocab-1" }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的医疗自定义词汇表。
-
有关API详细信息,请参阅AWS CLI 命令参考StartMedicalTranscriptionJob
中的。
-
以下代码示例演示如何使用 start-transcription-job
。
- AWS CLI
-
示例 1:转录音频文件
以下
start-transcription-job
示例转录音频文件。aws transcribe start-transcription-job \ --cli-input-json
file://myfile.json
myfile.json
的内容:{ "TranscriptionJobName": "cli-simple-transcription-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" } }
有关更多信息,请参阅《Amazon Transcribe 开发者指南》中的入门(AWS 命令行界面)。
示例 2:转录多声道音频文件
以下
start-transcription-job
示例转录多声道音频文件。aws transcribe start-transcription-job \ --cli-input-json
file://mysecondfile.json
mysecondfile.json
的内容:{ "TranscriptionJobName": "cli-channelid-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "ChannelIdentification":true } }
输出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-channelid-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-17T16:07:56.817000+00:00", "CreationTime": "2020-09-17T16:07:56.784000+00:00", "Settings": { "ChannelIdentification": true } } }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的转录多声道音频。
示例 3:转录音频文件并识别不同的发言者
以下
start-transcription-job
示例转录音频文件,并在转录输出中识别发言者。aws transcribe start-transcription-job \ --cli-input-json
file://mythirdfile.json
mythirdfile.json
的内容:{ "TranscriptionJobName": "cli-speakerid-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }
输出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-speakerid-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-17T16:22:59.696000+00:00", "CreationTime": "2020-09-17T16:22:59.676000+00:00", "Settings": { "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } } }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的识别发言者。
示例 4:转录音频文件并在转录输出中屏蔽任何不需要的单词
以下
start-transcription-job
示例转录音频文件,并使用您以前创建的词汇表过滤器屏蔽任何不需要的单词。aws transcribe start-transcription-job \ --cli-input-json
file://myfourthfile.json
myfourthfile.json
的内容:{ "TranscriptionJobName": "cli-filter-mask-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "mask" } }
输出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-filter-mask-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "mask" } } }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的过滤转录。
示例 5:转录音频文件并在转录输出中删除任何不需要的单词
以下
start-transcription-job
示例转录音频文件,并使用您以前创建的词汇表过滤器屏蔽任何不需要的单词。aws transcribe start-transcription-job \ --cli-input-json
file://myfifthfile.json
myfifthfile.json
的内容:{ "TranscriptionJobName": "cli-filter-remove-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "remove" } }
输出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-filter-remove-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "remove" } } }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的过滤转录。
示例 6:使用自定义词汇表更准确地转录音频文件
以下
start-transcription-job
示例转录音频文件,并使用您以前创建的词汇表过滤器屏蔽任何不需要的单词。aws transcribe start-transcription-job \ --cli-input-json
file://mysixthfile.json
mysixthfile.json
的内容:{ "TranscriptionJobName": "cli-vocab-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyName": "your-vocabulary" } }
输出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-vocab-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyName": "your-vocabulary" } } }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的过滤转录。
示例 7:识别音频文件语言并转录该文件
以下
start-transcription-job
示例转录音频文件,并使用您以前创建的词汇表过滤器屏蔽任何不需要的单词。aws transcribe start-transcription-job \ --cli-input-json
file://myseventhfile.json
myseventhfile.json
的内容:{ "TranscriptionJobName": "cli-identify-language-transcription-job", "IdentifyLanguage": true, "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" } }
输出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-identify-language-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T22:27:23.970000+00:00", "CreationTime": "2020-09-18T22:27:23.948000+00:00", "IdentifyLanguage": true } }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的识别语言。
示例 8:转录音频文件并编辑个人身份信息
以下
start-transcription-job
示例转录音频文件,并在转录输出中编辑任何个人身份信息。aws transcribe start-transcription-job \ --cli-input-json
file://myeighthfile.json
myeigthfile.json
的内容:{ "TranscriptionJobName": "cli-redaction-job", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "ContentRedaction": { "RedactionOutput":"redacted", "RedactionType":"PII" } }
输出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-redaction-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-25T23:49:13.195000+00:00", "CreationTime": "2020-09-25T23:49:13.176000+00:00", "ContentRedaction": { "RedactionType": "PII", "RedactionOutput": "redacted" } } }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的自动内容编辑。
示例 9:生成一份包含已编辑的个人身份信息 (PII) 和未经编辑的笔录
以下
start-transcription-job
示例生成两个音频文件转录,一个转录中的个人身份信息经过编辑,另一个转录没有进行任何编辑。aws transcribe start-transcription-job \ --cli-input-json
file://myninthfile.json
myninthfile.json
的内容:{ "TranscriptionJobName": "cli-redaction-job-with-unredacted-transcript", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "ContentRedaction": { "RedactionOutput":"redacted_and_unredacted", "RedactionType":"PII" } }
输出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-redaction-job-with-unredacted-transcript", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-25T23:59:47.677000+00:00", "CreationTime": "2020-09-25T23:59:47.653000+00:00", "ContentRedaction": { "RedactionType": "PII", "RedactionOutput": "redacted_and_unredacted" } } }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的自动内容编辑。
示例 10:使用您以前创建的自定义语言模型转录音频文件
以下
start-transcription-job
示例使用您以前创建的自定义语言模型转录音频文件。aws transcribe start-transcription-job \ --cli-input-json
file://mytenthfile.json
mytenthfile.json
的内容:{ "TranscriptionJobName": "cli-clm-2-job-1", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "ModelSettings": { "LanguageModelName":"cli-clm-2" } }
输出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-clm-2-job-1", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "StartTime": "2020-09-28T17:56:01.835000+00:00", "CreationTime": "2020-09-28T17:56:01.801000+00:00", "ModelSettings": { "LanguageModelName": "cli-clm-2" } } }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的使用自定义语言模型提高特定领域的转录准确性。
-
有关API详细信息,请参阅AWS CLI 命令参考StartTranscriptionJob
中的。
-
以下代码示例演示如何使用 update-medical-vocabulary
。
- AWS CLI
-
使用新术语更新医学自定义词汇。
以下
update-medical-vocabulary
示例用新的术语替换了医学自定义词汇表中使用的术语。先决条件:要替换医学自定义词汇表中的术语,您需要一个包含新术语的文件。aws transcribe update-medical-vocabulary \ --vocabulary-file-uri
s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/medical-custom-vocabulary.txt
\ --vocabulary-namemedical-custom-vocabulary
\ --language
-code language输出:
{ "VocabularyName": "medical-custom-vocabulary", "LanguageCode": "en-US", "VocabularyState": "PENDING" }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的医疗自定义词汇表。
-
有关API详细信息,请参阅AWS CLI 命令参考UpdateMedicalVocabulary
中的。
-
以下代码示例演示如何使用 update-vocabulary-filter
。
- AWS CLI
-
替换词汇表筛选器中的单词
以下
update-vocabulary-filter
示例将词汇过滤器中的单词替换为新单词。先决条件:要使用新单词更新词汇过滤器,必须将这些单词另存为文本文件。aws transcribe update-vocabulary-filter \ --vocabulary-filter-file-uri
s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/your-text-file-to-update-your-vocabulary-filter.txt
\ --vocabulary-filter-name
vocabulary-filter-name输出:
{ "VocabularyFilterName": "vocabulary-filter-name", "LanguageCode": "language-code", "LastModifiedTime": "2020-09-23T18:40:35.139000+00:00" }
有关更多信息,请参阅《Amazon Transcribe 开发者指南》中的筛选不需要的单词。
-
有关API详细信息,请参阅AWS CLI 命令参考UpdateVocabularyFilter
中的。
-
以下代码示例演示如何使用 update-vocabulary
。
- AWS CLI
-
使用新术语更新自定义词汇表。
以下
update-vocabulary
示例使用您提供的新术语来覆盖用于创建自定义词汇表的术语。先决条件:要替换自定义词汇表中的术语,您需要使用一个包含新术语的文件。aws transcribe update-vocabulary \ --vocabulary-file-uri
s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/custom-vocabulary.txt
\ --vocabulary-namecustom-vocabulary
\ --language-code
language-code输出:
{ "VocabularyName": "custom-vocabulary", "LanguageCode": "language", "VocabularyState": "PENDING" }
有关更多信息,请参阅《Amazon Transcribe 开发人员指南》中的自定义词汇表。
-
有关API详细信息,请参阅AWS CLI 命令参考UpdateVocabulary
中的。
-