使用轉錄AWS CLI - Amazon Transcribe

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用轉錄AWS CLI

使用開始AWS CLI轉錄時,您可以在 CLI 層級執行所有命令。或者,您也可以執行您要使用的命令,然後執行包含要求主體的 JSON 檔案的AWS 區域和位置。本指南中的範例展示了這兩種方法;但是,本節著重於前一個方法。

AWS CLI不支援串流轉錄。

在繼續之前,請確保您已經:

您可以在《AWS CLI指令參考》Amazon Transcribe中找到的所有指AWS CLI令

開始新的轉錄工作

若要開始新的轉錄,請使用start-transcription-job指令。

  1. 在終端機視窗中,輸入下列內容:

    aws transcribe start-transcription-job \

    下一行會出現> '',您現在可以繼續新增必要的參數,如下一個步驟所述。

    您也可以省略 '\' 並附加所有參數,每個參數都用空格分隔。

  2. 使用start-transcription-job指令時,您必須包含regiontranscription-job-namemedia、、和language-codeidentify-language

    如果要指定輸出位置,請在請求output-bucket-name中包含;如果要指定指定輸出存儲桶的子文件夾,也請包括output-key

    aws transcribe start-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job \ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac \ --language-code en-US

    如果附加所有參數,則此請求如下所示:

    aws transcribe start-transcription-job --region us-west-2 --transcription-job-name my-first-transcription-job --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac --language-code en-US

    如果您選擇不使用指定輸出值區output-bucket-name,請將轉錄輸出Amazon Transcribe放置在服務管理的值區中。儲存在服務管理儲存貯體中的成績單會在 90 天後過期。

    Amazon Transcribe響應:

    { "TranscriptionJob": { "TranscriptionJobName": "my-first-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "en-US", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" }, "StartTime": "2022-03-07T15:03:44.246000-08:00", "CreationTime": "2022-03-07T15:03:44.229000-08:00" } }

如果從TranscriptionJobStatusIN_PROGRESS變更為,您的轉錄工作就會成功COMPLETED。若要查看更新 TranscriptionJobStatus,請使用get-transcription-joblist-transcription-job指令,如下節所示。

取得轉錄任務的狀態

若要取得轉錄工作的相關資訊,請使用get-transcription-job指令。

此命令唯一需要的參數是工作所AWS 區域在的位置和作業的名稱。

aws transcribe get-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job

Amazon Transcribe響應:

{ "TranscriptionJob": { "TranscriptionJobName": "my-first-transcription-job", "TranscriptionJobStatus": "COMPLETED", "LanguageCode": "en-US", "MediaSampleRateHertz": 48000, "MediaFormat": "flac", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" }, "Transcript": { "TranscriptFileUri": "https://s3.the-URI-where-your-job-is-located.json" }, "StartTime": "2022-03-07T15:03:44.246000-08:00", "CreationTime": "2022-03-07T15:03:44.229000-08:00", "CompletionTime": "2022-03-07T15:04:01.158000-08:00", "Settings": { "ChannelIdentification": false, "ShowAlternatives": false } } }

如果您已為轉錄輸出選取自己的Amazon S3儲存貯體,則會列出此值區TranscriptFileUri。如果您已選取服務管理值區,則會提供暫時 URI;請使用此 URI 下載您的成績單。

注意

服務管理Amazon S3值區的臨時 URI 僅在 15 分鐘內有效。如果您在使用 URI 時收到AccesDenied錯誤,get-transcription-job請再次執行要求以取得新的暫存 URI。

列出您的轉錄工作

若要列出指定的所有轉錄工作AWS 區域,請使用list-transcription-jobs指令。

此命令唯一必要的參數是轉錄工作所AWS 區域在的參數。

aws transcribe list-transcription-jobs \ --region us-west-2

Amazon Transcribe響應:

{ "NextToken": "A-very-long-string", "TranscriptionJobSummaries": [ { "TranscriptionJobName": "my-first-transcription-job", "CreationTime": "2022-03-07T15:03:44.229000-08:00", "StartTime": "2022-03-07T15:03:44.246000-08:00", "CompletionTime": "2022-03-07T15:04:01.158000-08:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" } ] }

刪除轉錄工作

若要刪除轉錄工作,請使用delete-transcription-job指令。

此命令唯一需要的參數是工作所AWS 區域在的位置和作業的名稱。

aws transcribe delete-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job

要確認刪除請求是否成功,您可以運行list-transcription-jobs命令。您的任務應該會顯示在清單中。