文件 AWS SDK AWS 範例 SDK 儲存庫中有更多可用的
本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 的 Amazon Transcribe 範例 AWS CLI
下列程式碼範例示範如何搭配 Amazon Transcribe AWS Command Line Interface 使用 來執行動作和實作常見案例。
Actions 是大型程式的程式碼摘錄,必須在內容中執行。雖然 動作會示範如何呼叫個別服務函數,但您可以在其相關案例中查看內容中的動作。
每個範例都包含完整原始程式碼的連結,您可以在其中找到如何在內容中設定和執行程式碼的指示。
主題
動作
下列程式碼範例示範如何使用 create-language-model
。
- AWS CLI
-
範例 1:使用訓練和調校資料建立自訂語言模型。
下列
create-language-model
範例會建立自訂語言模型。您可以使用自訂語言模型來改善法律、接待、財務和保險等網域的轉錄效能。針對語言代碼,輸入有效的語言代碼。For base-model-name,請指定最適用於您要使用自訂語言模型轉錄之音訊範例速率的基本模型。針對模型名稱,指定您要呼叫自訂語言模型的名稱。aws transcribe create-language-model \ --
language-code
language-code \ --base-model-name
base-model-name \ --model-namecli-clm-example
\ --input-data-config S3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-for-training-data",TuningDataS3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-for-tuning-data",DataAccessRoleArn="arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model"輸出:
{ "LanguageCode": "language-code", "BaseModelName": "base-model-name", "ModelName": "cli-clm-example", "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-create-a-custom-language-model" }, "ModelStatus": "IN_PROGRESS" }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的使用自訂語言模型改善特定領域的轉錄準確性。
範例 2:僅使用訓練資料建立自訂語言模型。
以下
create-language-model
範例會轉錄您的音訊檔案。您可以使用自訂語言模型來改善法律、接待、財務和保險等網域的轉錄效能。針對語言代碼,輸入有效的語言代碼。For base-model-name,請指定最適用於您要使用自訂語言模型轉錄之音訊範例速率的基本模型。針對模型名稱,指定您要呼叫自訂語言模型的名稱。aws transcribe create-language-model \ --language-code
en-US
\ --base-model-name
base-model-name \ --model-namecli-clm-example
\ --input-data-config S3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-For-Training-Data",DataAccessRoleArn="arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model"輸出:
{ "LanguageCode": "en-US", "BaseModelName": "base-model-name", "ModelName": "cli-clm-example", "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-For-Training-Data/", "DataAccessRoleArn": "arn:aws:iam::your-AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model" }, "ModelStatus": "IN_PROGRESS" }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的使用自訂語言模型改善特定領域的轉錄準確性。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 CreateLanguageModel
。
-
下列程式碼範例示範如何使用 create-medical-vocabulary
。
- AWS CLI
-
建立醫療自訂詞彙
以下
create-medical-vocabulary
範例會建立自訂詞彙。若要建立自訂詞彙,您必須先建立一個文字檔案,其中包含要更準確轉錄的所有字詞。For vocabulary-file-uri,指定該文字檔案的 Amazon Simple Storage Service (Amazon S3) URI。針對 language-code,指定對應您的自訂詞彙語言的語言代碼。針對 vocabulary-name,指定您自訂詞彙的稱呼。aws transcribe create-medical-vocabulary \ --vocabulary-name
cli-medical-vocab-example
\ --language-code
language-code \ --vocabulary-file-urihttps://DOC-EXAMPLE-BUCKET.AWS-Region.amazonaws.com/the-text-file-for-the-medical-custom-vocabulary.txt
輸出:
{ "VocabularyName": "cli-medical-vocab-example", "LanguageCode": "language-code", "VocabularyState": "PENDING" }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的醫學自訂詞彙。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 CreateMedicalVocabulary
。
-
下列程式碼範例示範如何使用 create-vocabulary-filter
。
- AWS CLI
-
若要建立詞彙篩選條件
下列
create-vocabulary-filter
範例會建立詞彙篩選條件,該篩選條件使用文字檔案,其中包含您不想要出現在轉錄中的字詞清單。針對語言代碼,指定與詞彙篩選條件語言對應的語言代碼。For vocabulary-filter-file-uri,指定文字檔案的 Amazon Simple Storage Service (Amazon S3) URI。For vocabulary-filter-name,指定詞彙篩選條件的名稱。aws transcribe create-vocabulary-filter \ --
language-code
language-code \ --vocabulary-filter-file-uris3://DOC-EXAMPLE-BUCKET/vocabulary-filter.txt
\ --vocabulary-filter-namecli-vocabulary-filter-example
輸出:
{ "VocabularyFilterName": "cli-vocabulary-filter-example", "LanguageCode": "language-code" }
如需詳細資訊,請參閱 Amazon Transcribe 開發人員指南中的篩選不需要的字詞。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 CreateVocabularyFilter
。
-
下列程式碼範例示範如何使用 create-vocabulary
。
- AWS CLI
-
建立自訂詞彙
以下
create-vocabulary
範例會建立自訂詞彙。若要建立自訂詞彙,您必須先建立一個文字檔案,其中包含要更準確轉錄的所有字詞。For vocabulary-file-uri,指定該文字檔案的 Amazon Simple Storage Service (Amazon S3) URI。針對 language-code,指定對應您的自訂詞彙語言的語言代碼。針對 vocabulary-name,指定您自訂詞彙的稱呼。aws transcribe create-vocabulary \ --
language-code
language-code \ --vocabulary-namecli-vocab-example
\ --vocabulary-file-uris3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/the-text-file-for-the-custom-vocabulary.txt
輸出:
{ "VocabularyName": "cli-vocab-example", "LanguageCode": "language-code", "VocabularyState": "PENDING" }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的自訂詞彙。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 CreateVocabulary
。
-
下列程式碼範例示範如何使用 delete-language-model
。
- AWS CLI
-
刪除自訂語言模型
下列
delete-language-model
範例會刪除自訂語言模型。aws transcribe delete-language-model \ --
model-name
model-name此命令不會產生輸出。
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的使用自訂語言模型改善特定領域的轉錄準確性。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 DeleteLanguageModel
。
-
下列程式碼範例示範如何使用 delete-medical-transcription-job
。
- AWS CLI
-
刪除醫學轉錄作業
以下
delete-medical-transcription-job
範例會刪除醫學轉錄作業。aws transcribe delete-medical-transcription-job \ --
medical-transcription-job-name
medical-transcription-job-name此命令不會產生輸出。
如需詳細資訊,請參閱 Amazon Transcribe 開發人員指南中的 DeleteMedicalTranscriptionJob。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 DeleteMedicalTranscriptionJob
。
-
下列程式碼範例示範如何使用 delete-medical-vocabulary
。
- AWS CLI
-
刪除醫療自訂詞彙
下列
delete-medical-vocabulary
範例會刪除醫療自訂詞彙。對於詞彙名稱,請指定醫療自訂詞彙的名稱。aws transcribe delete-vocabulary \ --vocabulary-name
medical-custom-vocabulary-name
此命令不會產生輸出。
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的醫學自訂詞彙。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 DeleteMedicalVocabulary
。
-
下列程式碼範例示範如何使用 delete-transcription-job
。
- AWS CLI
-
刪除其中一項轉錄作業
以下
delete-transcription-job
範例會刪除其中一項轉錄作業。aws transcribe delete-transcription-job \ --transcription-job-name
your-transcription-job
此命令不會產生輸出。
如需詳細資訊,請參閱 Amazon Transcribe 開發人員指南中的 DeleteTranscriptionJob。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 DeleteTranscriptionJob
。
-
下列程式碼範例示範如何使用 delete-vocabulary-filter
。
- AWS CLI
-
若要刪除詞彙篩選條件
下列
delete-vocabulary-filter
範例會刪除詞彙篩選條件。aws transcribe delete-vocabulary-filter \ --
vocabulary-filter-name
vocabulary-filter-name此命令不會產生輸出。
如需詳細資訊,請參閱 Amazon Transcribe 開發人員指南中的篩選不需要的字詞。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 DeleteVocabularyFilter
。
-
下列程式碼範例示範如何使用 delete-vocabulary
。
- AWS CLI
-
刪除自訂詞彙
以下
delete-vocabulary
範例會刪除自訂詞彙。aws transcribe delete-vocabulary \ --
vocabulary-name
vocabulary-name此命令不會產生輸出。
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的自訂詞彙。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 DeleteVocabulary
。
-
下列程式碼範例示範如何使用 describe-language-model
。
- AWS CLI
-
取得特定自訂語言模型的相關資訊
下列
describe-language-model
範例取得特定自訂語言模型的相關資訊。例如,在 BaseModelName 下,您可以查看模型是否使用 a NarrowBand 或 WideBand 模型進行訓練。使用 a NarrowBand 基礎模型的自訂語言模型可以轉錄範例速率小於 16 kHz 的音訊。使用 a WideBand 基礎模型的語言模型可以轉錄範例速率大於 16 kHz 的音訊。S3Uri 參數指出您用來存取訓練資料的 Amazon S3 字首,以建立自訂語言模型。aws transcribe describe-language-model \ --model-name
cli-clm-example
輸出:
{ "LanguageModel": { "ModelName": "cli-clm-example", "CreateTime": "2020-09-25T17:57:38.504000+00:00", "LastModifiedTime": "2020-09-25T17:57:48.585000+00:00", "LanguageCode": "language-code", "BaseModelName": "base-model-name", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model" } } }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的使用自訂語言模型改善特定領域的轉錄準確性。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 DescribeLanguageModel
。
-
下列程式碼範例示範如何使用 get-medical-transcription-job
。
- AWS CLI
-
取得特定醫療轉錄工作的相關資訊
下列
get-medical-transcription-job
範例會取得特定醫療轉錄工作的相關資訊。若要存取轉錄結果,請使用 TranscriptFileUri 參數。如果您已為轉錄任務啟用其他功能,您可以在設定物件中查看這些功能。專科參數顯示提供者的醫療專科。類型參數指出轉錄任務中的語音是醫療對話還是醫療口述。aws transcribe get-medical-transcription-job \ --medical-transcription-job-name
vocabulary-dictation-medical-transcription-job
輸出:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "TranscriptionJobStatus": "COMPLETED", "LanguageCode": "en-US", "MediaSampleRateHertz": 48000, "MediaFormat": "mp4", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-audio-file.file-extension" }, "Transcript": { "TranscriptFileUri": "https://s3.Region.amazonaws.com/Amazon-S3-Prefix/vocabulary-dictation-medical-transcription-job.json" }, "StartTime": "2020-09-21T21:17:27.045000+00:00", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "CompletionTime": "2020-09-21T21:17:59.561000+00:00", "Settings": { "ChannelIdentification": false, "ShowAlternatives": false, "VocabularyName": "cli-medical-vocab-example" }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }
如需詳細資訊,請參閱 Amazon Transcribe 開發人員指南中的批次轉錄。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 GetMedicalTranscriptionJob
。
-
下列程式碼範例示範如何使用 get-medical-vocabulary
。
- AWS CLI
-
取得醫療自訂詞彙的相關資訊
下列
get-medical-vocabulary
範例取得醫療自訂詞彙的相關資訊。您可以使用 VocabularyState 參數來查看詞彙的處理狀態。如果是 READY,您可以在 StartMedicalTranscriptionJob 操作中使用它。:aws transcribe get-medical-vocabulary \ --vocabulary-name
medical-vocab-example
輸出:
{ "VocabularyName": "medical-vocab-example", "LanguageCode": "en-US", "VocabularyState": "READY", "LastModifiedTime": "2020-09-19T23:59:04.349000+00:00", "DownloadUri": "https://link-to-download-the-text-file-used-to-create-your-medical-custom-vocabulary" }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的醫學自訂詞彙。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 GetMedicalVocabulary
。
-
下列程式碼範例示範如何使用 get-transcription-job
。
- AWS CLI
-
取得特定轉錄作業的相關資訊
以下
get-transcription-job
範例會取得特定轉錄作業的相關資訊。若要存取轉錄結果,請使用 TranscriptFileUri 參數。使用 MediaFileUri 參數來查看您使用此任務轉錄的音訊檔案。您可以使用 Settings 物件來查看您在轉錄作業中已啟用的選用功能。aws transcribe get-transcription-job \ --transcription-job-name
your-transcription-job
輸出:
{ "TranscriptionJob": { "TranscriptionJobName": "your-transcription-job", "TranscriptionJobStatus": "COMPLETED", "LanguageCode": "language-code", "MediaSampleRateHertz": 48000, "MediaFormat": "mp4", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "Transcript": { "TranscriptFileUri": "https://Amazon-S3-file-location-of-transcription-output" }, "StartTime": "2020-09-18T22:27:23.970000+00:00", "CreationTime": "2020-09-18T22:27:23.948000+00:00", "CompletionTime": "2020-09-18T22:28:21.197000+00:00", "Settings": { "ChannelIdentification": false, "ShowAlternatives": false }, "IdentifyLanguage": true, "IdentifiedLanguageScore": 0.8672199249267578 } }
如需詳細資訊,請參閱 Amazon Transcribe 開發人員指南中的入門 (AWS 命令列介面)。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 GetTranscriptionJob
。
-
下列程式碼範例示範如何使用 get-vocabulary-filter
。
- AWS CLI
-
取得詞彙篩選條件的相關資訊
下列
get-vocabulary-filter
範例會取得詞彙篩選條件的相關資訊。您可以使用 DownloadUri 參數來取得您用來建立詞彙篩選條件的詞彙清單。aws transcribe get-vocabulary-filter \ --vocabulary-filter-name
testFilter
輸出:
{ "VocabularyFilterName": "testFilter", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-07T22:39:32.147000+00:00", "DownloadUri": "https://Amazon-S3-location-to-download-your-vocabulary-filter" }
如需詳細資訊,請參閱 Amazon Transcribe 開發人員指南中的篩選不需要的字詞。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 GetVocabularyFilter
。
-
下列程式碼範例示範如何使用 get-vocabulary
。
- AWS CLI
-
取得自訂詞彙的相關資訊
以下
get-vocabulary
範例會取得先前建立的自訂詞彙的相關資訊。aws transcribe get-vocabulary \ --vocabulary-name
cli-vocab-1
輸出:
{ "VocabularyName": "cli-vocab-1", "LanguageCode": "language-code", "VocabularyState": "READY", "LastModifiedTime": "2020-09-19T23:22:32.836000+00:00", "DownloadUri": "https://link-to-download-the-text-file-used-to-create-your-custom-vocabulary" }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的自訂詞彙。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 GetVocabulary
。
-
下列程式碼範例示範如何使用 list-language-models
。
- AWS CLI
-
列出您的自訂語言模型
下列
list-language-models
範例列出與 AWS 您的帳戶和區域相關聯的自訂語言模型。您可以使用S3Uri
和TuningDataS3Uri
參數來尋找已用作訓練資料的 Amazon S3 字首或調校資料。The BaseModelName 會告訴您是否已使用 a NarrowBand、or WideBand 模型來建立自訂語言模型。您可以使用 a kHz 基礎模型,以自訂語言模型轉錄範例速率小於 16 NarrowBand 的音訊。您可以使用自訂語言模型使用 a kHz 基礎模型轉錄音訊 16 WideBand 或更高版本。ModelStatus
參數會顯示您是否可以在轉錄任務中使用自訂語言模型。如果值為 COMPLETED,您可以在轉錄任務中使用它。aws transcribe list-language-models
輸出:
{ "Models": [ { "ModelName": "cli-clm-2", "CreateTime": "2020-09-25T17:57:38.504000+00:00", "LastModifiedTime": "2020-09-25T17:57:48.585000+00:00", "LanguageCode": "language-code", "BaseModelName": "WideBand", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-tuning-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } }, { "ModelName": "cli-clm-1", "CreateTime": "2020-09-25T17:16:01.835000+00:00", "LastModifiedTime": "2020-09-25T17:16:15.555000+00:00", "LanguageCode": "language-code", "BaseModelName": "WideBand", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } }, { "ModelName": "clm-console-1", "CreateTime": "2020-09-24T19:26:28.076000+00:00", "LastModifiedTime": "2020-09-25T04:25:22.271000+00:00", "LanguageCode": "language-code", "BaseModelName": "NarrowBand", "ModelStatus": "COMPLETED", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } } ] }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的使用自訂語言模型改善特定領域的轉錄準確性。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 ListLanguageModels
。
-
下列程式碼範例示範如何使用 list-medical-transcription-jobs
。
- AWS CLI
-
列出醫學轉錄作業
下列
list-medical-transcription-jobs
範例列出與 AWS 您的帳戶和區域相關聯的醫療轉錄任務。若要取得特定轉錄任務的詳細資訊,請在轉錄輸出中複製 a MedicalTranscriptionJobName 參數的值,並為get-medical-transcription-job
命令MedicalTranscriptionJobName
的選項指定該值。若要查看更多轉錄任務,請複製 NextToken 參數的值、再次執行list-medical-transcription-jobs
命令,並在--next-token
選項中指定該值。aws transcribe list-medical-transcription-jobs
輸出:
{ "NextToken": "3/PblzkiGhzjER3KHuQt2fmbPLF7cDYafjFMEoGn44ON/gsuUSTIkGyanvRE6WMXFd/ZTEc2EZj+P9eii/z1O2FDYli6RLI0WoRX4RwMisVrh9G0Kie0Y8ikBCdtqlZB10Wa9McC+ebOl+LaDtZPC4u6ttoHLRlEfzqstHXSgapXg3tEBtm9piIaPB6MOM5BB6t86+qtmocTR/qrteHZBBudhTfbCwhsxaqujHiiUvFdm3BQbKKWIW06yV9b+4f38oD2lVIan+vfUs3gBYAl5VTDmXXzQPBQOHPjtwmFI+IWX15nSUjWuN3TUylHgPWzDaYT8qBtu0Z+3UG4V6b+K2CC0XszXg5rBq9hYgNzy4XoFh/6s5DoSnzq49Q9xHgHdT2yBADFmvFK7myZBsj75+2vQZOSVpWUPy3WT/32zFAcoELHR4unuWhXPwjbKU+mFYfUjtTZ8n/jq7aQEjQ42A+X/7K6JgOcdVPtEg8PlDr5kgYYG3q3OmYXX37U3FZuJmnTI63VtIXsNnOU5eGoYObtpk00Nq9UkzgSJxqj84ZD5n+S0EGy9ZUYBJRRcGeYUM3Q4DbSJfUwSAqcFdLIWZdp8qIREMQIBWy7BLwSdyqsQo2vRrd53hm5aWM7SVf6pPq6X/IXR5+1eUOOD8/coaTT4ES2DerbV6RkV4o0VT1d0SdVX/MmtkNG8nYj8PqU07w7988quh1ZP6D80veJS1q73tUUR9MjnGernW2tAnvnLNhdefBcD+sZVfYq3iBMFY7wTy1P1G6NqW9GrYDYoX3tTPWlD7phpbVSyKrh/PdYrps5UxnsGoA1b7L/FfAXDfUoGrGUB4N3JsPYXX9D++g+6gV1qBBs/WfF934aKqfD6UTggm/zV3GAOWiBpfvAZRvEb924i6yGHyMC7y54O1ZAwSBupmI+FFd13CaPO4kN1vJlth6aM5vUPXg4BpyUhtbRhwD/KxCvf9K0tLJGyL1A==", "MedicalTranscriptionJobSummaries": [ { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "StartTime": "2020-09-21T21:17:27.045000+00:00", "CompletionTime": "2020-09-21T21:17:59.561000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }, { "MedicalTranscriptionJobName": "alternatives-dictation-medical-transcription-job", "CreationTime": "2020-09-21T21:01:14.569000+00:00", "StartTime": "2020-09-21T21:01:14.592000+00:00", "CompletionTime": "2020-09-21T21:01:43.606000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }, { "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "CreationTime": "2020-09-21T19:09:18.171000+00:00", "StartTime": "2020-09-21T19:09:18.199000+00:00", "CompletionTime": "2020-09-21T19:10:22.516000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" }, { "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "CreationTime": "2020-09-21T18:43:37.157000+00:00", "StartTime": "2020-09-21T18:43:37.265000+00:00", "CompletionTime": "2020-09-21T18:44:21.192000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" }, { "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "CreationTime": "2020-09-20T23:46:44.053000+00:00", "StartTime": "2020-09-20T23:46:44.081000+00:00", "CompletionTime": "2020-09-20T23:47:35.851000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } ] }
如需詳細資訊,請參閱 Amazon Transcribe 開發人員指南中的 https://docs.aws.amazon.com/transcribe/latest/dg/batchWord-med-transcription.html>。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 ListMedicalTranscriptionJobs
。
-
下列程式碼範例示範如何使用 list-medical-vocabularies
。
- AWS CLI
-
列出您的醫療自訂詞彙
下列
list-medical-vocabularies
範例列出與 AWS 您的帳戶和區域相關聯的醫療自訂詞彙。若要取得特定轉錄任務的詳細資訊,請在轉錄輸出中複製MedicalTranscriptionJobName
參數的值,並為get-medical-transcription-job
命令MedicalTranscriptionJobName
的選項指定該值。若要查看更多轉錄任務,請複製NextToken
參數的值、再次執行list-medical-transcription-jobs
命令,並在--next-token
選項中指定該值。aws transcribe list-medical-vocabularies
輸出:
{ "Vocabularies": [ { "VocabularyName": "cli-medical-vocab-2", "LanguageCode": "en-US", "LastModifiedTime": "2020-09-21T21:44:59.521000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "cli-medical-vocab-1", "LanguageCode": "en-US", "LastModifiedTime": "2020-09-19T23:59:04.349000+00:00", "VocabularyState": "READY" } ] }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的醫學自訂詞彙。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 ListMedicalVocabularies
。
-
下列程式碼範例示範如何使用 list-transcription-jobs
。
- AWS CLI
-
列出您的轉錄作業
下列
list-transcription-jobs
範例列出與 AWS 您的帳戶和區域相關聯的轉錄任務。aws transcribe list-transcription-jobs
輸出:
{ "NextToken": "NextToken", "TranscriptionJobSummaries": [ { "TranscriptionJobName": "speak-id-job-1", "CreationTime": "2020-08-17T21:06:15.391000+00:00", "StartTime": "2020-08-17T21:06:15.416000+00:00", "CompletionTime": "2020-08-17T21:07:05.098000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "job-1", "CreationTime": "2020-08-17T20:50:24.207000+00:00", "StartTime": "2020-08-17T20:50:24.230000+00:00", "CompletionTime": "2020-08-17T20:52:18.737000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "sdk-test-job-4", "CreationTime": "2020-08-17T20:32:27.917000+00:00", "StartTime": "2020-08-17T20:32:27.956000+00:00", "CompletionTime": "2020-08-17T20:33:15.126000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "Diarization-speak-id", "CreationTime": "2020-08-10T22:10:09.066000+00:00", "StartTime": "2020-08-10T22:10:09.116000+00:00", "CompletionTime": "2020-08-10T22:26:48.172000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "your-transcription-job-name", "CreationTime": "2020-07-29T17:45:09.791000+00:00", "StartTime": "2020-07-29T17:45:09.826000+00:00", "CompletionTime": "2020-07-29T17:46:20.831000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" } ] }
如需詳細資訊,請參閱 Amazon Transcribe 開發人員指南中的入門 (AWS 命令列介面)。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 ListTranscriptionJobs
。
-
下列程式碼範例示範如何使用 list-vocabularies
。
- AWS CLI
-
列出您的自訂詞彙
下列
list-vocabularies
範例列出與 AWS 您的帳戶和區域相關聯的自訂詞彙。aws transcribe list-vocabularies
輸出:
{ "NextToken": "NextToken", "Vocabularies": [ { "VocabularyName": "ards-test-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-27T22:00:27.330000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "sample-test", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T23:04:11.044000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-test-3-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T22:12:22.277000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-test-2", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T21:53:50.455000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-1-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T21:39:33.356000+00:00", "VocabularyState": "READY" } ] }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的自訂詞彙。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 ListVocabularies
。
-
下列程式碼範例示範如何使用 list-vocabulary-filters
。
- AWS CLI
-
列出詞彙篩選條件
下列
list-vocabulary-filters
範例列出與 AWS 您的帳戶和區域相關聯的詞彙篩選條件。aws transcribe list-vocabulary-filters
輸出:
{ "NextToken": "NextToken": [ { "VocabularyFilterName": "testFilter", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-07T22:39:32.147000+00:00" }, { "VocabularyFilterName": "testFilter2", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-21T23:29:35.174000+00:00" }, { "VocabularyFilterName": "filter2", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-08T20:18:26.426000+00:00" }, { "VocabularyFilterName": "filter-review", "LanguageCode": "language-code", "LastModifiedTime": "2020-06-03T18:52:30.448000+00:00" }, { "VocabularyFilterName": "crlf-filt", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-22T19:42:42.737000+00:00" } ] }
如需詳細資訊,請參閱 Amazon Transcribe 開發人員指南中的篩選不需要的字詞。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 ListVocabularyFilters
。
-
下列程式碼範例示範如何使用 start-medical-transcription-job
。
- AWS CLI
-
範例 1:轉錄儲存為音訊檔案的醫學聽寫
以下
start-medical-transcription-job
範例會轉錄音訊檔案。您可在OutputBucketName
參數中指定轉錄輸出的位置。aws transcribe start-medical-transcription-job \ --cli-input-json
file://myfile.json
myfile.json
的內容:{ "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" } }
輸出:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T00:35:22.256000+00:00", "CreationTime": "2020-09-20T00:35:22.218000+00:00", "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的批次轉錄概觀。
範例 2:轉錄儲存為音訊檔案的臨床醫師與病患對話
以下
start-medical-transcription-job
範例會轉錄包含臨床醫師與病患對話的音訊檔案。您可以在 OutputBucketName 參數中指定轉錄輸出的位置。aws transcribe start-medical-transcription-job \ --cli-input-json
file://mysecondfile.json
mysecondfile.json
的內容:{ "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" } }
輸出:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "simple-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T23:19:49.965000+00:00", "CreationTime": "2020-09-20T23:19:49.941000+00:00", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的批次轉錄概觀。
範例 3:轉錄臨床醫師與病患對話的多聲道音訊檔案
以下
start-medical-transcription-job
範例會轉錄音訊檔案中每個聲道的音訊,並將每個聲道的個別轉錄合併成單一轉錄輸出。您可在OutputBucketName
參數中指定轉錄輸出的位置。aws transcribe start-medical-transcription-job \ --cli-input-json
file://mythirdfile.json
mythirdfile.json
的內容:{ "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ChannelIdentification": true } }
輸出:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T23:46:44.081000+00:00", "CreationTime": "2020-09-20T23:46:44.053000+00:00", "Settings": { "ChannelIdentification": true }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的聲道識別。
範例 4:轉錄臨床醫生與病患對話的音訊檔案,並識別轉錄輸出中的發言者
以下
start-medical-transcription-job
範例會轉錄音訊檔案,並標記轉錄輸出中每一位發言者的語音。您可在OutputBucketName
參數中指定轉錄輸出的位置。aws transcribe start-medical-transcription-job \ --cli-input-json
file://myfourthfile.json
myfourthfile.json
的內容:{ "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }
輸出:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T18:43:37.265000+00:00", "CreationTime": "2020-09-21T18:43:37.157000+00:00", "Settings": { "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的識別發言者。
範例 5:轉錄儲存為音訊檔案且最多有兩個轉錄替代選項的醫學對話
以下
start-medical-transcription-job
範例會從單一音訊檔案建立最多兩個替代轉錄。每個轉錄都有相關聯的可信度等級。根據預設,Amazon Transcribe 會傳回最高可信度等級的轉錄。您可以指定 Amazon Transcribe 傳回可信度較低的其他轉錄。您可在OutputBucketName
參數中指定轉錄輸出的位置。aws transcribe start-medical-transcription-job \ --cli-input-json
file://myfifthfile.json
myfifthfile.json
的內容:{ "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowAlternatives": true, "MaxAlternatives": 2 } }
輸出:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T19:09:18.199000+00:00", "CreationTime": "2020-09-21T19:09:18.171000+00:00", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 2 }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的替代轉錄。
範例 6:轉錄最多有兩個替代轉錄的醫學聽寫的音訊檔案
以下
start-medical-transcription-job
範例會轉錄音訊檔案,並使用詞彙篩選器來為任何不希望出現的字詞加上遮罩。您可以在 OutputBucketName 參數中指定轉錄輸出的位置。aws transcribe start-medical-transcription-job \ --cli-input-json
file://mysixthfile.json
mysixthfile.json
的內容:{ "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowAlternatives": true, "MaxAlternatives": 2 } }
輸出:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "alternatives-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T21:01:14.592000+00:00", "CreationTime": "2020-09-21T21:01:14.569000+00:00", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 2 }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的替代轉錄。
範例 7:使用自訂詞彙以更準確的方式轉錄醫學聽寫的音訊檔案
以下
start-medical-transcription-job
範例會轉錄音訊檔案,並使用您先前建立的醫學自訂詞彙來提高轉錄準確度。您可在OutputBucketName
參數中指定轉錄輸出的位置。aws transcribe start-transcription-job \ --cli-input-json
file://myseventhfile.json
mysixthfile.json
的內容:{ "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "VocabularyName": "cli-medical-vocab-1" } }
輸出:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T21:17:27.045000+00:00", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "Settings": { "VocabularyName": "cli-medical-vocab-1" }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的醫學自訂詞彙。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 StartMedicalTranscriptionJob
。
-
下列程式碼範例示範如何使用 start-transcription-job
。
- AWS CLI
-
範例 1:轉錄音訊檔案
以下
start-transcription-job
範例會轉錄您的音訊檔案。aws transcribe start-transcription-job \ --cli-input-json
file://myfile.json
myfile.json
的內容:{ "TranscriptionJobName": "cli-simple-transcription-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" } }
如需詳細資訊,請參閱 Amazon Transcribe 開發人員指南中的入門 (AWS 命令列介面)。
範例 2:轉錄多聲道音訊檔案
以下
start-transcription-job
範例會轉錄您的多聲道音訊檔案。aws transcribe start-transcription-job \ --cli-input-json
file://mysecondfile.json
mysecondfile.json
的內容:{ "TranscriptionJobName": "cli-channelid-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "ChannelIdentification":true } }
輸出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-channelid-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-17T16:07:56.817000+00:00", "CreationTime": "2020-09-17T16:07:56.784000+00:00", "Settings": { "ChannelIdentification": true } } }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的轉錄多聲道音訊。
範例 3:轉錄音訊檔案並識別不同的發言者
以下
start-transcription-job
範例會轉錄音訊檔案,並識別轉錄輸出中的發言者。aws transcribe start-transcription-job \ --cli-input-json
file://mythirdfile.json
mythirdfile.json
的內容:{ "TranscriptionJobName": "cli-speakerid-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }
輸出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-speakerid-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-17T16:22:59.696000+00:00", "CreationTime": "2020-09-17T16:22:59.676000+00:00", "Settings": { "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } } }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的識別發言者。
範例 4:轉錄音訊檔案,並在轉錄輸出中為任何不希望出現的字詞加上遮罩
以下
start-transcription-job
範例會轉錄音訊檔案,並使用您先前建立的詞彙篩選器來為任何不希望出現的字詞加上遮罩。aws transcribe start-transcription-job \ --cli-input-json
file://myfourthfile.json
myfourthfile.json
的內容:{ "TranscriptionJobName": "cli-filter-mask-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "mask" } }
輸出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-filter-mask-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "mask" } } }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的篩選轉錄。
範例 5:轉錄音訊檔案,並移除轉錄輸出中任何不希望出現的字詞
以下
start-transcription-job
範例會轉錄音訊檔案,並使用您先前建立的詞彙篩選器來為任何不希望出現的字詞加上遮罩。aws transcribe start-transcription-job \ --cli-input-json
file://myfifthfile.json
myfifthfile.json
的內容:{ "TranscriptionJobName": "cli-filter-remove-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "remove" } }
輸出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-filter-remove-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "remove" } } }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的篩選轉錄。
範例 6:使用自訂詞彙以更準確的方式轉錄音訊檔案
以下
start-transcription-job
範例會轉錄音訊檔案,並使用您先前建立的詞彙篩選器來為任何不希望出現的字詞加上遮罩。aws transcribe start-transcription-job \ --cli-input-json
file://mysixthfile.json
mysixthfile.json
的內容:{ "TranscriptionJobName": "cli-vocab-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyName": "your-vocabulary" } }
輸出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-vocab-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyName": "your-vocabulary" } } }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的篩選轉錄。
範例 7:識別音訊檔案的語言並進行轉錄
以下
start-transcription-job
範例會轉錄音訊檔案,並使用您先前建立的詞彙篩選器來為任何不希望出現的字詞加上遮罩。aws transcribe start-transcription-job \ --cli-input-json
file://myseventhfile.json
myseventhfile.json
的內容:{ "TranscriptionJobName": "cli-identify-language-transcription-job", "IdentifyLanguage": true, "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" } }
輸出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-identify-language-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T22:27:23.970000+00:00", "CreationTime": "2020-09-18T22:27:23.948000+00:00", "IdentifyLanguage": true } }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的識別語言。
範例 8:轉錄包含已修訂的個人身分識別資訊的音訊檔案
以下
start-transcription-job
範例會轉錄音訊檔案,並修訂轉錄輸出中的任何個人身分識別資訊。aws transcribe start-transcription-job \ --cli-input-json
file://myeighthfile.json
myeigthfile.json
的內容:{ "TranscriptionJobName": "cli-redaction-job", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "ContentRedaction": { "RedactionOutput":"redacted", "RedactionType":"PII" } }
輸出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-redaction-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-25T23:49:13.195000+00:00", "CreationTime": "2020-09-25T23:49:13.176000+00:00", "ContentRedaction": { "RedactionType": "PII", "RedactionOutput": "redacted" } } }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的自動內容修訂。
範例 9:產生文字記錄,並修改個人識別資訊 (PII) 和未修改的文字記錄
以下
start-transcription-job
範例會產生音訊檔案的兩個轉錄,一個包含已修訂的個人身分識別資訊,另一個則不包含任何修訂。aws transcribe start-transcription-job \ --cli-input-json
file://myninthfile.json
myninthfile.json
的內容:{ "TranscriptionJobName": "cli-redaction-job-with-unredacted-transcript", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "ContentRedaction": { "RedactionOutput":"redacted_and_unredacted", "RedactionType":"PII" } }
輸出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-redaction-job-with-unredacted-transcript", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-25T23:59:47.677000+00:00", "CreationTime": "2020-09-25T23:59:47.653000+00:00", "ContentRedaction": { "RedactionType": "PII", "RedactionOutput": "redacted_and_unredacted" } } }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的自動內容修訂。
範例 10:使用您先前建立的自訂語言模型來轉錄音訊檔案。
以下
start-transcription-job
範例會使用您先前建立的自訂語言模型來轉錄音訊檔案。aws transcribe start-transcription-job \ --cli-input-json
file://mytenthfile.json
mytenthfile.json
的內容:{ "TranscriptionJobName": "cli-clm-2-job-1", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "ModelSettings": { "LanguageModelName":"cli-clm-2" } }
輸出:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-clm-2-job-1", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "StartTime": "2020-09-28T17:56:01.835000+00:00", "CreationTime": "2020-09-28T17:56:01.801000+00:00", "ModelSettings": { "LanguageModelName": "cli-clm-2" } } }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的使用自訂語言模型改善特定領域的轉錄準確性。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 StartTranscriptionJob
。
-
下列程式碼範例示範如何使用 update-medical-vocabulary
。
- AWS CLI
-
使用新詞彙更新醫療自訂詞彙。
下列
update-medical-vocabulary
範例會將醫療自訂詞彙中使用的詞彙取代為新的詞彙。先決條件:若要取代醫療自訂詞彙中的詞彙,您需要具有新詞彙的檔案。aws transcribe update-medical-vocabulary \ --vocabulary-file-uri
s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/medical-custom-vocabulary.txt
\ --vocabulary-namemedical-custom-vocabulary
\ --language
-code language輸出:
{ "VocabularyName": "medical-custom-vocabulary", "LanguageCode": "en-US", "VocabularyState": "PENDING" }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的醫學自訂詞彙。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 UpdateMedicalVocabulary
。
-
下列程式碼範例示範如何使用 update-vocabulary-filter
。
- AWS CLI
-
若要取代詞彙篩選條件中的單字
下列
update-vocabulary-filter
範例會將詞彙篩選條件中的單字取代為新的單字。先決條件:若要使用新單字更新詞彙篩選條件,您必須將這些單字儲存為文字檔案。aws transcribe update-vocabulary-filter \ --vocabulary-filter-file-uri
s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/your-text-file-to-update-your-vocabulary-filter.txt
\ --vocabulary-filter-name
vocabulary-filter-name輸出:
{ "VocabularyFilterName": "vocabulary-filter-name", "LanguageCode": "language-code", "LastModifiedTime": "2020-09-23T18:40:35.139000+00:00" }
如需詳細資訊,請參閱 Amazon Transcribe 開發人員指南中的篩選不需要的字詞。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 UpdateVocabularyFilter
。
-
下列程式碼範例示範如何使用 update-vocabulary
。
- AWS CLI
-
使用新用語更新自訂詞彙。
以下
update-vocabulary
範例會以您提供的新用語覆寫用來建立自訂詞彙的用語。先決條件:若要取代自訂詞彙中的用語,您需有包含新用語的檔案。aws transcribe update-vocabulary \ --vocabulary-file-uri
s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/custom-vocabulary.txt
\ --vocabulary-namecustom-vocabulary
\ --language-code
language-code輸出:
{ "VocabularyName": "custom-vocabulary", "LanguageCode": "language", "VocabularyState": "PENDING" }
如需詳細資訊,請參閱《Amazon Transcribe 開發人員指南》中的自訂詞彙。
-
如需 API 詳細資訊,請參閱 AWS CLI 命令參考中的 UpdateVocabulary
。
-