Doc AWS SDK ExamplesWord リポジトリには、さらに多くの GitHub の例があります。 AWS SDK
翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
を使用した Amazon Transcribe の例 AWS CLI
次のコード例は、Amazon Transcribe AWS Command Line Interface で を使用してアクションを実行し、一般的なシナリオを実装する方法を示しています。
アクションはより大きなプログラムからのコードの抜粋であり、コンテキスト内で実行する必要があります。アクションは個々のサービス機能を呼び出す方法を示していますが、コンテキスト内のアクションは、関連するシナリオで確認できます。
各例には、完全なソースコードへのリンクが含まれています。ここでは、コンテキストでコードを設定および実行する方法の手順を確認できます。
トピック
アクション
次の例は、create-language-model
を使用する方法を説明しています。
- AWS CLI
-
例 1: トレーニングデータとチューニングデータの両方を使用してカスタム言語モデルを作成するには。
次の
create-language-model
例では、カスタム言語モデルを作成します。カスタム言語モデルを使用して、法律、ホスピタリティ、財務、保険などのドメインの文字起こしパフォーマンスを向上させることができます。言語コードには、有効な言語コードを入力します。For base-model-name では、カスタム言語モデルで文字起こしするオーディオのサンプルレートに最適なベースモデルを指定します。model-name には、カスタム言語モデルを呼び出す名前を指定します。aws transcribe create-language-model \ --
language-code
language-code \ --base-model-name
base-model-name \ --model-namecli-clm-example
\ --input-data-config S3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-for-training-data",TuningDataS3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-for-tuning-data",DataAccessRoleArn="arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model"出力:
{ "LanguageCode": "language-code", "BaseModelName": "base-model-name", "ModelName": "cli-clm-example", "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-create-a-custom-language-model" }, "ModelStatus": "IN_PROGRESS" }
詳細については、「Amazon Transcribe 開発者ガイド」の「カスタム言語モデルを使用したドメイン固有のトランスクリプション精度の向上」を参照してください。
例 2: トレーニングデータのみを使用してカスタム言語モデルを作成するには。
次の
create-language-model
の例は、音声ファイルの文字起こしを行います。カスタム言語モデルを使用して、法律、ホスピタリティ、財務、保険などのドメインの文字起こしパフォーマンスを向上させることができます。言語コードには、有効な言語コードを入力します。For base-model-name では、カスタム言語モデルで文字起こしするオーディオのサンプルレートに最適なベースモデルを指定します。model-name には、カスタム言語モデルを呼び出す名前を指定します。aws transcribe create-language-model \ --language-code
en-US
\ --base-model-name
base-model-name \ --model-namecli-clm-example
\ --input-data-config S3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-For-Training-Data",DataAccessRoleArn="arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model"出力:
{ "LanguageCode": "en-US", "BaseModelName": "base-model-name", "ModelName": "cli-clm-example", "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-For-Training-Data/", "DataAccessRoleArn": "arn:aws:iam::your-AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model" }, "ModelStatus": "IN_PROGRESS" }
詳細については、「Amazon Transcribe 開発者ガイド」の「カスタム言語モデルを使用したドメイン固有のトランスクリプション精度の向上」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のCreateLanguageModel
」を参照してください。
-
次の例は、create-medical-vocabulary
を使用する方法を説明しています。
- AWS CLI
-
医療カスタム語彙を作成するには
次の
create-medical-vocabulary
例は、カスタム語彙を作成します。カスタム語彙を作成するには、より正確に書き起こすべき用語のすべてを含むテキストファイルを作成しておく必要があります。For vocabulary-file-uri では、そのテキストファイルの Amazon Simple Storage Service (Amazon S3) URI を指定します。language-code として、カスタム語彙の言語に対応する言語コードを指定します。vocabulary-name として、カスタムボキャブラリーに付ける名前を指定します。aws transcribe create-medical-vocabulary \ --vocabulary-name
cli-medical-vocab-example
\ --language-code
language-code \ --vocabulary-file-urihttps://DOC-EXAMPLE-BUCKET.AWS-Region.amazonaws.com/the-text-file-for-the-medical-custom-vocabulary.txt
出力:
{ "VocabularyName": "cli-medical-vocab-example", "LanguageCode": "language-code", "VocabularyState": "PENDING" }
詳細については、「Amazon Transcribe 開発者ガイド」の「医療カスタムボキャブラリー」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のCreateMedicalVocabulary
」を参照してください。
-
次のコード例は、create-vocabulary-filter
を使用する方法を示しています。
- AWS CLI
-
語彙フィルターを作成するには
次の
create-vocabulary-filter
例では、文字起こしで表示したくない単語のリストを含むテキストファイルを使用する語彙フィルターを作成します。言語コードには、語彙フィルターの言語に対応する言語コードを指定します。For vocabulary-filter-file-uri では、テキストファイルの Amazon Simple Storage Service (Amazon S3) URI を指定します。For vocabulary-filter-name では、語彙フィルターの名前を指定します。aws transcribe create-vocabulary-filter \ --
language-code
language-code \ --vocabulary-filter-file-uris3://DOC-EXAMPLE-BUCKET/vocabulary-filter.txt
\ --vocabulary-filter-namecli-vocabulary-filter-example
出力:
{ "VocabularyFilterName": "cli-vocabulary-filter-example", "LanguageCode": "language-code" }
詳細については、Amazon Transcribe デベロッパーガイドの「不要な単語のフィルタリング」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のCreateVocabularyFilter
」を参照してください。
-
次の例は、create-vocabulary
を使用する方法を説明しています。
- AWS CLI
-
カスタム語彙を作成するには
次の
create-vocabulary
例は、カスタム語彙を作成します。カスタム語彙を作成するには、より正確に書き起こすべき用語のすべてを含むテキストファイルを作成しておく必要があります。For vocabulary-file-uri では、そのテキストファイルの Amazon Simple Storage Service (Amazon S3) URI を指定します。language-code として、カスタム語彙の言語に対応する言語コードを指定します。vocabulary-name として、カスタムボキャブラリーに付ける名前を指定します。aws transcribe create-vocabulary \ --
language-code
language-code \ --vocabulary-namecli-vocab-example
\ --vocabulary-file-uris3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/the-text-file-for-the-custom-vocabulary.txt
出力:
{ "VocabularyName": "cli-vocab-example", "LanguageCode": "language-code", "VocabularyState": "PENDING" }
詳細については、「Amazon Transcribe デベロッパーガイド」の「カスタムボキャブラリー」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のCreateVocabulary
」を参照してください。
-
次の例は、delete-language-model
を使用する方法を説明しています。
- AWS CLI
-
カスタム言語モデルを削除するには
次の
delete-language-model
例では、カスタム言語モデルを削除します。aws transcribe delete-language-model \ --
model-name
model-nameこのコマンドでは何も出力されません。
詳細については、「Amazon Transcribe 開発者ガイド」の「カスタム言語モデルを使用したドメイン固有のトランスクリプション精度の向上」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のDeleteLanguageModel
」を参照してください。
-
次の例は、delete-medical-transcription-job
を使用する方法を説明しています。
- AWS CLI
-
医療文字起こしジョブを削除するには
次の
delete-medical-transcription-job
の例は、医療文字起こしジョブを削除します。aws transcribe delete-medical-transcription-job \ --
medical-transcription-job-name
medical-transcription-job-nameこのコマンドでは何も出力されません。
詳細については、Amazon Transcribe デベロッパーガイドのDeleteMedicalTranscriptionJob」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のDeleteMedicalTranscriptionJob
」を参照してください。
-
次のコード例は、delete-medical-vocabulary
を使用する方法を示しています。
- AWS CLI
-
医療カスタム語彙を削除するには
次の
delete-medical-vocabulary
例では、医療カスタム語彙を削除します。vocabulary-name には、医療カスタム語彙の名前を指定します。aws transcribe delete-vocabulary \ --vocabulary-name
medical-custom-vocabulary-name
このコマンドでは何も出力されません。
詳細については、「Amazon Transcribe 開発者ガイド」の「医療カスタムボキャブラリー」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のDeleteMedicalVocabulary
」を参照してください。
-
次のコード例は、delete-transcription-job
を使用する方法を示しています。
- AWS CLI
-
文字起こしジョブの 1 つを削除するには
次の
delete-transcription-job
例では、トランスクリプションジョブの 1 つを削除します。aws transcribe delete-transcription-job \ --transcription-job-name
your-transcription-job
このコマンドでは何も出力されません。
詳細については、Amazon Transcribe デベロッパーガイドのDeleteTranscriptionJob」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のDeleteTranscriptionJob
」を参照してください。
-
次のコード例は、delete-vocabulary-filter
を使用する方法を示しています。
- AWS CLI
-
語彙フィルターを削除するには
次の
delete-vocabulary-filter
例では、語彙フィルターを削除します。aws transcribe delete-vocabulary-filter \ --
vocabulary-filter-name
vocabulary-filter-nameこのコマンドでは何も出力されません。
詳細については、Amazon Transcribe デベロッパーガイドの「不要な単語のフィルタリング」を参照してください。
-
API の詳細については、 AWS CLI コマンドリファレンスのDeleteVocabularyFilter
」を参照してください。
-
次のコード例は、delete-vocabulary
を使用する方法を示しています。
- AWS CLI
-
カスタム語彙を削除するには
次の
delete-vocabulary
の例は、カスタム語彙を削除します。aws transcribe delete-vocabulary \ --
vocabulary-name
vocabulary-nameこのコマンドでは何も出力されません。
詳細については、「Amazon Transcribe デベロッパーガイド」の「カスタムボキャブラリー」を参照してください。
-
API の詳細については、 AWS CLI コマンドリファレンスのDeleteVocabulary
」を参照してください。
-
次のコード例は、describe-language-model
を使用する方法を示しています。
- AWS CLI
-
特定のカスタム言語モデルに関する情報を取得するには
次の
describe-language-model
例では、特定のカスタム言語モデルに関する情報を取得します。例えば、 BaseModelName では、モデルが NarrowBand モデルまたは WideBand モデルを使用してトレーニングされているかどうかを確認できます。a NarrowBand ベースモデルを使用するカスタム言語モデルは、サンプルレートが 16 kHz 未満の音声を文字起こしできます。a WideBand ベースモデルを使用する言語モデルは、16 kHz を超えるサンプルレートで音声を文字起こしできます。S3Uri パラメータは、トレーニングデータにアクセスしてカスタム言語モデルを作成するために使用した Amazon S3 プレフィックスを示します。aws transcribe describe-language-model \ --model-name
cli-clm-example
出力:
{ "LanguageModel": { "ModelName": "cli-clm-example", "CreateTime": "2020-09-25T17:57:38.504000+00:00", "LastModifiedTime": "2020-09-25T17:57:48.585000+00:00", "LanguageCode": "language-code", "BaseModelName": "base-model-name", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model" } } }
詳細については、「Amazon Transcribe 開発者ガイド」の「カスタム言語モデルを使用したドメイン固有のトランスクリプション精度の向上」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のDescribeLanguageModel
」を参照してください。
-
次のコード例は、get-medical-transcription-job
を使用する方法を示しています。
- AWS CLI
-
特定の医療文字起こしジョブに関する情報を取得するには
次の
get-medical-transcription-job
例では、特定の医療文字起こしジョブに関する情報を取得します。文字起こし結果にアクセスするには、 TranscriptFileUri パラメータを使用します。文字起こしジョブの追加機能を有効にしている場合は、設定オブジェクトで確認できます。専門分野パラメータは、プロバイダーの医療専門分野を示します。Type パラメータは、文字起こしジョブの音声が医療会話か医療ディクテーションかを示します。aws transcribe get-medical-transcription-job \ --medical-transcription-job-name
vocabulary-dictation-medical-transcription-job
出力:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "TranscriptionJobStatus": "COMPLETED", "LanguageCode": "en-US", "MediaSampleRateHertz": 48000, "MediaFormat": "mp4", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-audio-file.file-extension" }, "Transcript": { "TranscriptFileUri": "https://s3.Region.amazonaws.com/Amazon-S3-Prefix/vocabulary-dictation-medical-transcription-job.json" }, "StartTime": "2020-09-21T21:17:27.045000+00:00", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "CompletionTime": "2020-09-21T21:17:59.561000+00:00", "Settings": { "ChannelIdentification": false, "ShowAlternatives": false, "VocabularyName": "cli-medical-vocab-example" }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }
詳細については、Amazon Transcribe デベロッパーガイドの「バッチ文字起こし」を参照してください。 Amazon Transcribe
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のGetMedicalTranscriptionJob
」を参照してください。
-
次のコード例は、get-medical-vocabulary
を使用する方法を示しています。
- AWS CLI
-
医療カスタム語彙に関する情報を取得するには
次の
get-medical-vocabulary
例では、医療カスタム語彙に関する情報を取得します。 VocabularyState パラメータを使用して、語彙の処理状態を確認できます。READY の場合は、 StartMedicalTranscriptionJob オペレーションで使用できます。aws transcribe get-medical-vocabulary \ --vocabulary-name
medical-vocab-example
出力:
{ "VocabularyName": "medical-vocab-example", "LanguageCode": "en-US", "VocabularyState": "READY", "LastModifiedTime": "2020-09-19T23:59:04.349000+00:00", "DownloadUri": "https://link-to-download-the-text-file-used-to-create-your-medical-custom-vocabulary" }
詳細については、「Amazon Transcribe 開発者ガイド」の「医療カスタムボキャブラリー」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のGetMedicalVocabulary
」を参照してください。
-
次の例は、get-transcription-job
を使用する方法を説明しています。
- AWS CLI
-
特定の文字起こしジョブに関する情報を取得するには
次の
get-transcription-job
例では、特定の文字起こしジョブに関する情報を取得します。文字起こし結果にアクセスするには、 TranscriptFileUri パラメータを使用します。 MediaFileUri パラメータを使用して、このジョブで文字起こししたオーディオファイルを確認します。Settings オブジェクトを使用して、文字起こしジョブで有効にしたオプション機能を確認できます。aws transcribe get-transcription-job \ --transcription-job-name
your-transcription-job
出力:
{ "TranscriptionJob": { "TranscriptionJobName": "your-transcription-job", "TranscriptionJobStatus": "COMPLETED", "LanguageCode": "language-code", "MediaSampleRateHertz": 48000, "MediaFormat": "mp4", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "Transcript": { "TranscriptFileUri": "https://Amazon-S3-file-location-of-transcription-output" }, "StartTime": "2020-09-18T22:27:23.970000+00:00", "CreationTime": "2020-09-18T22:27:23.948000+00:00", "CompletionTime": "2020-09-18T22:28:21.197000+00:00", "Settings": { "ChannelIdentification": false, "ShowAlternatives": false }, "IdentifyLanguage": true, "IdentifiedLanguageScore": 0.8672199249267578 } }
詳細については、Amazon Transcribe デベロッパーガイドの「入門 (AWS コマンドラインインターフェイス)」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のGetTranscriptionJob
」を参照してください。
-
次のコード例は、get-vocabulary-filter
を使用する方法を示しています。
- AWS CLI
-
語彙フィルターに関する情報を取得するには
次の
get-vocabulary-filter
例では、語彙フィルターに関する情報を取得します。 DownloadUri パラメータを使用して、語彙フィルターの作成に使用した単語のリストを取得できます。aws transcribe get-vocabulary-filter \ --vocabulary-filter-name
testFilter
出力:
{ "VocabularyFilterName": "testFilter", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-07T22:39:32.147000+00:00", "DownloadUri": "https://Amazon-S3-location-to-download-your-vocabulary-filter" }
詳細については、Amazon Transcribe デベロッパーガイドの「不要な単語をフィルタリングする」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のGetVocabularyFilter
」を参照してください。
-
次の例は、get-vocabulary
を使用する方法を説明しています。
- AWS CLI
-
カスタム語彙に関する情報を取得するには
次の
get-vocabulary
例では、以前に作成したカスタム語彙に関する情報を取得します。aws transcribe get-vocabulary \ --vocabulary-name
cli-vocab-1
出力:
{ "VocabularyName": "cli-vocab-1", "LanguageCode": "language-code", "VocabularyState": "READY", "LastModifiedTime": "2020-09-19T23:22:32.836000+00:00", "DownloadUri": "https://link-to-download-the-text-file-used-to-create-your-custom-vocabulary" }
詳細については、「Amazon Transcribe デベロッパーガイド」の「カスタムボキャブラリー」を参照してください。
-
API の詳細については、 AWS CLI コマンドリファレンスのGetVocabulary
」を参照してください。
-
次の例は、list-language-models
を使用する方法を説明しています。
- AWS CLI
-
カスタム言語モデルを一覧表示するには
次の
list-language-models
例では、 AWS アカウントとリージョンに関連付けられたカスタム言語モデルを一覧表示します。S3Uri
およびTuningDataS3Uri
パラメータを使用して、トレーニングデータまたはチューニングデータとして使用した Amazon S3 プレフィックスを検索できます。The BaseModelName は、カスタム言語モデルを作成するために a NarrowBand モデルを使用したか、 WideBand モデルを使用したかを示します。a kHz ベースモデルを使用して、カスタム言語モデルでサンプルレートが 16 NarrowBand 未満の音声を文字起こしできます。a kHz ベースモデルを使用して、カスタム言語モデルでオーディオ 16 WideBand 以上を文字起こしできます。ModelStatus
パラメータは、文字起こしジョブでカスタム言語モデルを使用できるかどうかを示します。値が COMPLETED の場合は、文字起こしジョブで使用できます。aws transcribe list-language-models
出力:
{ "Models": [ { "ModelName": "cli-clm-2", "CreateTime": "2020-09-25T17:57:38.504000+00:00", "LastModifiedTime": "2020-09-25T17:57:48.585000+00:00", "LanguageCode": "language-code", "BaseModelName": "WideBand", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-tuning-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } }, { "ModelName": "cli-clm-1", "CreateTime": "2020-09-25T17:16:01.835000+00:00", "LastModifiedTime": "2020-09-25T17:16:15.555000+00:00", "LanguageCode": "language-code", "BaseModelName": "WideBand", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } }, { "ModelName": "clm-console-1", "CreateTime": "2020-09-24T19:26:28.076000+00:00", "LastModifiedTime": "2020-09-25T04:25:22.271000+00:00", "LanguageCode": "language-code", "BaseModelName": "NarrowBand", "ModelStatus": "COMPLETED", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } } ] }
詳細については、「Amazon Transcribe 開発者ガイド」の「カスタム言語モデルを使用したドメイン固有のトランスクリプション精度の向上」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のListLanguageModels
」を参照してください。
-
次のコード例は、list-medical-transcription-jobs
を使用する方法を示しています。
- AWS CLI
-
医療文字起こしジョブを一覧表示するには
次の
list-medical-transcription-jobs
例では、 AWS アカウントとリージョンに関連付けられた医療文字起こしジョブを一覧表示します。特定の文字起こしジョブの詳細については、文字起こし出力の a MedicalTranscriptionJobName パラメータの値をコピーし、get-medical-transcription-job
コマンドMedicalTranscriptionJobName
のオプションにその値を指定します。文字起こしジョブをさらに表示するには、 NextToken パラメータの値をコピーし、list-medical-transcription-jobs
コマンドを再度実行して、--next-token
オプションでその値を指定します。aws transcribe list-medical-transcription-jobs
出力:
{ "NextToken": "3/PblzkiGhzjER3KHuQt2fmbPLF7cDYafjFMEoGn44ON/gsuUSTIkGyanvRE6WMXFd/ZTEc2EZj+P9eii/z1O2FDYli6RLI0WoRX4RwMisVrh9G0Kie0Y8ikBCdtqlZB10Wa9McC+ebOl+LaDtZPC4u6ttoHLRlEfzqstHXSgapXg3tEBtm9piIaPB6MOM5BB6t86+qtmocTR/qrteHZBBudhTfbCwhsxaqujHiiUvFdm3BQbKKWIW06yV9b+4f38oD2lVIan+vfUs3gBYAl5VTDmXXzQPBQOHPjtwmFI+IWX15nSUjWuN3TUylHgPWzDaYT8qBtu0Z+3UG4V6b+K2CC0XszXg5rBq9hYgNzy4XoFh/6s5DoSnzq49Q9xHgHdT2yBADFmvFK7myZBsj75+2vQZOSVpWUPy3WT/32zFAcoELHR4unuWhXPwjbKU+mFYfUjtTZ8n/jq7aQEjQ42A+X/7K6JgOcdVPtEg8PlDr5kgYYG3q3OmYXX37U3FZuJmnTI63VtIXsNnOU5eGoYObtpk00Nq9UkzgSJxqj84ZD5n+S0EGy9ZUYBJRRcGeYUM3Q4DbSJfUwSAqcFdLIWZdp8qIREMQIBWy7BLwSdyqsQo2vRrd53hm5aWM7SVf6pPq6X/IXR5+1eUOOD8/coaTT4ES2DerbV6RkV4o0VT1d0SdVX/MmtkNG8nYj8PqU07w7988quh1ZP6D80veJS1q73tUUR9MjnGernW2tAnvnLNhdefBcD+sZVfYq3iBMFY7wTy1P1G6NqW9GrYDYoX3tTPWlD7phpbVSyKrh/PdYrps5UxnsGoA1b7L/FfAXDfUoGrGUB4N3JsPYXX9D++g+6gV1qBBs/WfF934aKqfD6UTggm/zV3GAOWiBpfvAZRvEb924i6yGHyMC7y54O1ZAwSBupmI+FFd13CaPO4kN1vJlth6aM5vUPXg4BpyUhtbRhwD/KxCvf9K0tLJGyL1A==", "MedicalTranscriptionJobSummaries": [ { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "StartTime": "2020-09-21T21:17:27.045000+00:00", "CompletionTime": "2020-09-21T21:17:59.561000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }, { "MedicalTranscriptionJobName": "alternatives-dictation-medical-transcription-job", "CreationTime": "2020-09-21T21:01:14.569000+00:00", "StartTime": "2020-09-21T21:01:14.592000+00:00", "CompletionTime": "2020-09-21T21:01:43.606000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }, { "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "CreationTime": "2020-09-21T19:09:18.171000+00:00", "StartTime": "2020-09-21T19:09:18.199000+00:00", "CompletionTime": "2020-09-21T19:10:22.516000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" }, { "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "CreationTime": "2020-09-21T18:43:37.157000+00:00", "StartTime": "2020-09-21T18:43:37.265000+00:00", "CompletionTime": "2020-09-21T18:44:21.192000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" }, { "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "CreationTime": "2020-09-20T23:46:44.053000+00:00", "StartTime": "2020-09-20T23:46:44.081000+00:00", "CompletionTime": "2020-09-20T23:47:35.851000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } ] }
詳細については、Amazon Transcribe デベロッパーガイドのlatest/dg/batch https://docs.aws.amazon.com/transcribe/-med-transcription.html>」を参照してください。
-
API の詳細については、 AWS CLI コマンドリファレンスの ListMedicalTranscriptionJobs
を参照してください。
-
次の例は、list-medical-vocabularies
を使用する方法を説明しています。
- AWS CLI
-
医療カスタム語彙を一覧表示するには
次の
list-medical-vocabularies
例は、 AWS アカウントとリージョンに関連付けられた医療カスタム語彙を一覧表示します。特定の文字起こしジョブの詳細については、文字起こし出力のMedicalTranscriptionJobName
パラメータの値をコピーし、get-medical-transcription-job
コマンドMedicalTranscriptionJobName
のオプションにその値を指定します。文字起こしジョブをさらに表示するには、NextToken
パラメータの値をコピーし、list-medical-transcription-jobs
コマンドを再度実行して、--next-token
オプションでその値を指定します。aws transcribe list-medical-vocabularies
出力:
{ "Vocabularies": [ { "VocabularyName": "cli-medical-vocab-2", "LanguageCode": "en-US", "LastModifiedTime": "2020-09-21T21:44:59.521000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "cli-medical-vocab-1", "LanguageCode": "en-US", "LastModifiedTime": "2020-09-19T23:59:04.349000+00:00", "VocabularyState": "READY" } ] }
詳細については、「Amazon Transcribe 開発者ガイド」の「医療カスタムボキャブラリー」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のListMedicalVocabularies
」を参照してください。
-
次のコード例は、list-transcription-jobs
を使用する方法を示しています。
- AWS CLI
-
文字起こしジョブを一覧表示するには
次の
list-transcription-jobs
例では、 AWS アカウントとリージョンに関連付けられた文字起こしジョブを一覧表示します。aws transcribe list-transcription-jobs
出力:
{ "NextToken": "NextToken", "TranscriptionJobSummaries": [ { "TranscriptionJobName": "speak-id-job-1", "CreationTime": "2020-08-17T21:06:15.391000+00:00", "StartTime": "2020-08-17T21:06:15.416000+00:00", "CompletionTime": "2020-08-17T21:07:05.098000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "job-1", "CreationTime": "2020-08-17T20:50:24.207000+00:00", "StartTime": "2020-08-17T20:50:24.230000+00:00", "CompletionTime": "2020-08-17T20:52:18.737000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "sdk-test-job-4", "CreationTime": "2020-08-17T20:32:27.917000+00:00", "StartTime": "2020-08-17T20:32:27.956000+00:00", "CompletionTime": "2020-08-17T20:33:15.126000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "Diarization-speak-id", "CreationTime": "2020-08-10T22:10:09.066000+00:00", "StartTime": "2020-08-10T22:10:09.116000+00:00", "CompletionTime": "2020-08-10T22:26:48.172000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "your-transcription-job-name", "CreationTime": "2020-07-29T17:45:09.791000+00:00", "StartTime": "2020-07-29T17:45:09.826000+00:00", "CompletionTime": "2020-07-29T17:46:20.831000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" } ] }
詳細については、Amazon Transcribe デベロッパーガイドの「入門 (AWS コマンドラインインターフェイス)」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のListTranscriptionJobs
」を参照してください。
-
次の例は、list-vocabularies
を使用する方法を説明しています。
- AWS CLI
-
カスタム語彙を一覧表示するには
次の
list-vocabularies
例では、 AWS アカウントとリージョンに関連付けられたカスタム語彙を一覧表示します。aws transcribe list-vocabularies
出力:
{ "NextToken": "NextToken", "Vocabularies": [ { "VocabularyName": "ards-test-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-27T22:00:27.330000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "sample-test", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T23:04:11.044000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-test-3-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T22:12:22.277000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-test-2", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T21:53:50.455000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-1-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T21:39:33.356000+00:00", "VocabularyState": "READY" } ] }
詳細については、「Amazon Transcribe デベロッパーガイド」の「カスタムボキャブラリー」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のListVocabularies
」を参照してください。
-
次のコード例は、list-vocabulary-filters
を使用する方法を示しています。
- AWS CLI
-
語彙フィルターを一覧表示するには
次の
list-vocabulary-filters
例では、 AWS アカウントとリージョンに関連付けられた語彙フィルターを一覧表示します。aws transcribe list-vocabulary-filters
出力:
{ "NextToken": "NextToken": [ { "VocabularyFilterName": "testFilter", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-07T22:39:32.147000+00:00" }, { "VocabularyFilterName": "testFilter2", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-21T23:29:35.174000+00:00" }, { "VocabularyFilterName": "filter2", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-08T20:18:26.426000+00:00" }, { "VocabularyFilterName": "filter-review", "LanguageCode": "language-code", "LastModifiedTime": "2020-06-03T18:52:30.448000+00:00" }, { "VocabularyFilterName": "crlf-filt", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-22T19:42:42.737000+00:00" } ] }
詳細については、Amazon Transcribe デベロッパーガイドの「不要な単語のフィルタリング」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のListVocabularyFilters
」を参照してください。
-
次のコード例は、start-medical-transcription-job
を使用する方法を示しています。
- AWS CLI
-
例 1: オーディオファイルとして保存されている医療ディクテーションを文字起こしするには
次の
start-medical-transcription-job
の例は、オーディオファイルの文字起こしを行います。トランスクリプション出力の場所をOutputBucketName
パラメータで指定します。aws transcribe start-medical-transcription-job \ --cli-input-json
file://myfile.json
myfile.json
の内容:{ "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" } }
出力:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T00:35:22.256000+00:00", "CreationTime": "2020-09-20T00:35:22.218000+00:00", "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }
詳細については、「Amazon Transcribe 開発者ガイド」の「バッチトランスクリプションの概要」を参照してください。
例 2: オーディオファイルとして保存されている臨床医と患者の対話を文字起こしするには
次の
start-medical-transcription-job
例では、臨床医と患者の対話を含むオーディオファイルの文字起こしを行います。 OutputBucketName パラメータで文字起こし出力の場所を指定します。aws transcribe start-medical-transcription-job \ --cli-input-json
file://mysecondfile.json
mysecondfile.json
の内容:{ "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" } }
出力:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "simple-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T23:19:49.965000+00:00", "CreationTime": "2020-09-20T23:19:49.941000+00:00", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }
詳細については、「Amazon Transcribe 開発者ガイド」の「バッチトランスクリプションの概要」を参照してください。
例 3: 臨床医と患者の対話のマルチチャネルオーディオファイルを書き起こすには
次の
start-medical-transcription-job
例では、オーディオオファイルの各チャネルの音声の文字起こしを行い、チャネル別の文字起こし結果を組み合わせて、単一の文字起こし出力にまとめます。文字起こしの出力の場所をOutputBucketName
パラメータで指定します。aws transcribe start-medical-transcription-job \ --cli-input-json
file://mythirdfile.json
mythirdfile.json
の内容:{ "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ChannelIdentification": true } }
出力:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T23:46:44.081000+00:00", "CreationTime": "2020-09-20T23:46:44.053000+00:00", "Settings": { "ChannelIdentification": true }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }
詳細については、「Amazon Transcribe 開発者ガイド」の「チャネル識別」を参照してください。
例 4: 臨床医と患者の対話のオーディオファイルを文字起こしして、文字起こし出力の話者を特定するには
次の
start-medical-transcription-job
の例は、オーディオファイルを書き起こしして、文字起こし出力の各話者の発話にラベルを付けます。文字起こしの出力の場所をOutputBucketName
パラメータで指定します。aws transcribe start-medical-transcription-job \ --cli-input-json
file://myfourthfile.json
myfourthfile.json
の内容:{ "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }
出力:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T18:43:37.265000+00:00", "CreationTime": "2020-09-21T18:43:37.157000+00:00", "Settings": { "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }
詳細については、「Amazon Transcribe デベロッパーガイド」の「話者の識別」を参照してください。
例 5: オーディオファイルとして保存されている医療会話を、最大 2 つの代替文字起こし結果に文字起こしするには
次の
start-medical-transcription-job
の例は、単一のオーディオファイルから最大 2 つの代替文字起こし結果を作成します。文字起こし結果ごとに信頼度レベルが関連付けられます。デフォルトでは、Amazon Transcribe は、信頼度レベルが最も高い文字起こし結果を返します。Amazon Transcribe で他の信頼度レベルがより低いトランスクリプションを返すようにも指定できます。文字起こしの出力の場所をOutputBucketName
パラメータで指定します。aws transcribe start-medical-transcription-job \ --cli-input-json
file://myfifthfile.json
myfifthfile.json
の内容:{ "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowAlternatives": true, "MaxAlternatives": 2 } }
出力:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T19:09:18.199000+00:00", "CreationTime": "2020-09-21T19:09:18.171000+00:00", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 2 }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }
詳細については、「Amazon Transcribe デベロッパーガイド」の「代替文字起こし」を参照してください。
例 6: 医療ディクテーションのオーディオファイルを、最大 2 つの代替文字起こし結果に文字起こしするには
次の
start-medical-transcription-job
の例は、オーディオファイルを文字起こしして、語彙フィルターを使用して不要な単語をマスクします。 OutputBucketName パラメータで文字起こし出力の場所を指定します。aws transcribe start-medical-transcription-job \ --cli-input-json
file://mysixthfile.json
mysixthfile.json
の内容:{ "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowAlternatives": true, "MaxAlternatives": 2 } }
出力:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "alternatives-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T21:01:14.592000+00:00", "CreationTime": "2020-09-21T21:01:14.569000+00:00", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 2 }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }
詳細については、「Amazon Transcribe デベロッパーガイド」の「代替文字起こし」を参照してください。
例 7: カスタムボ語彙を使用して、医療ディクテーションのオーディオファイルをより正確に書き起こすには
次の
start-medical-transcription-job
の例は、オーディオファイルを文字起こしして、以前に作成した医療カスタム語彙を使用して文字起こし結果の精度を高めます。文字起こしの出力の場所をOutputBucketName
パラメータで指定します。aws transcribe start-transcription-job \ --cli-input-json
file://myseventhfile.json
mysixthfile.json
の内容:{ "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "VocabularyName": "cli-medical-vocab-1" } }
出力:
{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T21:17:27.045000+00:00", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "Settings": { "VocabularyName": "cli-medical-vocab-1" }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }
詳細については、「Amazon Transcribe 開発者ガイド」の「医療カスタムボキャブラリー」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のStartMedicalTranscriptionJob
」を参照してください。
-
次のコード例は、start-transcription-job
を使用する方法を示しています。
- AWS CLI
-
例 1: オーディオファイルを文字起こしするには
次の
start-transcription-job
の例は、音声ファイルの文字起こしを行います。aws transcribe start-transcription-job \ --cli-input-json
file://myfile.json
myfile.json
の内容:{ "TranscriptionJobName": "cli-simple-transcription-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" } }
詳細については、Amazon Transcribe デベロッパーガイドの「入門 (AWS コマンドラインインターフェイス)」を参照してください。
例 2: マルチチャネルのオーディオファイルを文字起こしするには
次の
start-transcription-job
の例は、マルチチャネルのオーディオファイルの文字起こしを行います。aws transcribe start-transcription-job \ --cli-input-json
file://mysecondfile.json
mysecondfile.json
の内容:{ "TranscriptionJobName": "cli-channelid-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "ChannelIdentification":true } }
出力:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-channelid-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-17T16:07:56.817000+00:00", "CreationTime": "2020-09-17T16:07:56.784000+00:00", "Settings": { "ChannelIdentification": true } } }
詳細については、「Amazon Transcribe 開発者ガイド」の「マルチチャネル音声の書き起こし」を参照してください。
例 3: オーディオファイルを文字起こしして、複数の異なる話者を識別するには
次の
start-transcription-job
例では、オーディオファイルを書き起こし、文字起こし出力の話者を識別します。aws transcribe start-transcription-job \ --cli-input-json
file://mythirdfile.json
mythirdfile.json
の内容:{ "TranscriptionJobName": "cli-speakerid-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }
出力:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-speakerid-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-17T16:22:59.696000+00:00", "CreationTime": "2020-09-17T16:22:59.676000+00:00", "Settings": { "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } } }
詳細については、「Amazon Transcribe デベロッパーガイド」の「話者の識別」を参照してください。
例 4: オーディオファイルを文字起こしして、文字起こし出力内の不要な単語をすべてマスクするには
次の
start-transcription-job
例では、オーディオファイルを書き起こし、以前に作成した語彙フィルターを使用して不要な単語をマスクします。aws transcribe start-transcription-job \ --cli-input-json
file://myfourthfile.json
myfourthfile.json
の内容:{ "TranscriptionJobName": "cli-filter-mask-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "mask" } }
出力:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-filter-mask-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "mask" } } }
詳細については、「Amazon Transcribe デベロッパーガイド」の「トランスクリプションのフィルタリング」を参照してください。
例 5: オーディオファイルを文字起こしし、文字起こし出力から不要な単語を削除するには
次の
start-transcription-job
例では、オーディオファイルを書き起こし、以前に作成した語彙フィルターを使用して不要な単語をマスクします。aws transcribe start-transcription-job \ --cli-input-json
file://myfifthfile.json
myfifthfile.json
の内容:{ "TranscriptionJobName": "cli-filter-remove-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "remove" } }
出力:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-filter-remove-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "remove" } } }
詳細については、「Amazon Transcribe 開発者ガイド」の「トランスクリプションのフィルタリング」を参照してください。
例 6: カスタム語彙を使用して、オーディオファイルをより正確に文字起こしするには
次の
start-transcription-job
例では、オーディオファイルを書き起こし、以前に作成した語彙フィルターを使用して不要な単語をマスクします。aws transcribe start-transcription-job \ --cli-input-json
file://mysixthfile.json
mysixthfile.json
の内容:{ "TranscriptionJobName": "cli-vocab-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyName": "your-vocabulary" } }
出力:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-vocab-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyName": "your-vocabulary" } } }
詳細については、「Amazon Transcribe 開発者ガイド」の「トランスクリプションのフィルタリング」を参照してください。
例 7: オーディオファイルの言語を識別して文字起こしするには
次の
start-transcription-job
例では、オーディオファイルを書き起こし、以前に作成した語彙フィルターを使用して不要な単語をマスクします。aws transcribe start-transcription-job \ --cli-input-json
file://myseventhfile.json
myseventhfile.json
の内容:{ "TranscriptionJobName": "cli-identify-language-transcription-job", "IdentifyLanguage": true, "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" } }
出力:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-identify-language-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T22:27:23.970000+00:00", "CreationTime": "2020-09-18T22:27:23.948000+00:00", "IdentifyLanguage": true } }
詳細については、「Amazon Transcribe 開発者ガイド」の「言語の特定」を参照してください。
例 8: 個人を特定できる情報をマスクしてオーディオファイルを文字起こしするには
次の
start-transcription-job
の例は、オーディオファイルを文字起こしして、文字起こし出力内の個人を特定できる情報をマスクします。aws transcribe start-transcription-job \ --cli-input-json
file://myeighthfile.json
myeigthfile.json
の内容:{ "TranscriptionJobName": "cli-redaction-job", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "ContentRedaction": { "RedactionOutput":"redacted", "RedactionType":"PII" } }
出力:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-redaction-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-25T23:49:13.195000+00:00", "CreationTime": "2020-09-25T23:49:13.176000+00:00", "ContentRedaction": { "RedactionType": "PII", "RedactionOutput": "redacted" } } }
詳細については、「Amazon Transcribe デベロッパーガイド」の「自動コンテンツリダクション」を参照してください。
例 9: 個人を特定できる情報 (PII) を編集し、未編集の文字起こしを生成するには
次の
start-transcription-job
の例は、オーディオファイルの 2 つの文字起こしを生成します。1 つでは個人を特定できる情報をマスクし、別の 1 つではマスクしません。aws transcribe start-transcription-job \ --cli-input-json
file://myninthfile.json
myninthfile.json
の内容:{ "TranscriptionJobName": "cli-redaction-job-with-unredacted-transcript", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "ContentRedaction": { "RedactionOutput":"redacted_and_unredacted", "RedactionType":"PII" } }
出力:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-redaction-job-with-unredacted-transcript", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-25T23:59:47.677000+00:00", "CreationTime": "2020-09-25T23:59:47.653000+00:00", "ContentRedaction": { "RedactionType": "PII", "RedactionOutput": "redacted_and_unredacted" } } }
詳細については、「Amazon Transcribe デベロッパーガイド」の「自動コンテンツリダクション」を参照してください。
例 10: 以前に作成したカスタム言語モデルを使用してオーディオファイルを文字起こしするには
次の
start-transcription-job
の例は、以前に作成したカスタム言語モデルを使用してオーディオファイルを文字起こしします。aws transcribe start-transcription-job \ --cli-input-json
file://mytenthfile.json
mytenthfile.json
の内容:{ "TranscriptionJobName": "cli-clm-2-job-1", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "ModelSettings": { "LanguageModelName":"cli-clm-2" } }
出力:
{ "TranscriptionJob": { "TranscriptionJobName": "cli-clm-2-job-1", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "StartTime": "2020-09-28T17:56:01.835000+00:00", "CreationTime": "2020-09-28T17:56:01.801000+00:00", "ModelSettings": { "LanguageModelName": "cli-clm-2" } } }
詳細については、「Amazon Transcribe 開発者ガイド」の「カスタム言語モデルを使用したドメイン固有のトランスクリプション精度の向上」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のStartTranscriptionJob
」を参照してください。
-
次の例は、update-medical-vocabulary
を使用する方法を説明しています。
- AWS CLI
-
新しい用語で医療カスタム語彙を更新するには。
次の
update-medical-vocabulary
例では、医療カスタム語彙で使用される用語を新しい語彙に置き換えます。前提条件: 医療カスタム語彙の用語を置き換えるには、新しい用語を持つファイルが必要です。aws transcribe update-medical-vocabulary \ --vocabulary-file-uri
s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/medical-custom-vocabulary.txt
\ --vocabulary-namemedical-custom-vocabulary
\ --language
-code language出力:
{ "VocabularyName": "medical-custom-vocabulary", "LanguageCode": "en-US", "VocabularyState": "PENDING" }
詳細については、「Amazon Transcribe 開発者ガイド」の「医療カスタムボキャブラリー」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のUpdateMedicalVocabulary
」を参照してください。
-
次の例は、update-vocabulary-filter
を使用する方法を説明しています。
- AWS CLI
-
語彙フィルターの単語を置き換えるには
次の
update-vocabulary-filter
例では、語彙フィルターの単語を新しい単語に置き換えます。前提条件: 語彙フィルターを新しい単語で更新するには、それらの単語をテキストファイルとして保存する必要があります。aws transcribe update-vocabulary-filter \ --vocabulary-filter-file-uri
s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/your-text-file-to-update-your-vocabulary-filter.txt
\ --vocabulary-filter-name
vocabulary-filter-name出力:
{ "VocabularyFilterName": "vocabulary-filter-name", "LanguageCode": "language-code", "LastModifiedTime": "2020-09-23T18:40:35.139000+00:00" }
詳細については、Amazon Transcribe デベロッパーガイドの「不要な単語のフィルタリング」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のUpdateVocabularyFilter
」を参照してください。
-
次のコード例は、update-vocabulary
を使用する方法を示しています。
- AWS CLI
-
カスタム語彙を新しい用語で更新するには
次の
update-vocabulary
の例は、カスタム語彙の作成に使用した用語を、指定した新しい用語で上書きします。前提条件: カスタム語彙の用語を置き換えるには、新しい用語を含むファイルが必要です。aws transcribe update-vocabulary \ --vocabulary-file-uri
s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/custom-vocabulary.txt
\ --vocabulary-namecustom-vocabulary
\ --language-code
language-code出力:
{ "VocabularyName": "custom-vocabulary", "LanguageCode": "language", "VocabularyState": "PENDING" }
詳細については、「Amazon Transcribe デベロッパーガイド」の「カスタムボキャブラリー」を参照してください。
-
API の詳細については、AWS CLI 「 コマンドリファレンス」のUpdateVocabulary
」を参照してください。
-