本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用轉錄AWS CLI
使用開始AWS CLI轉錄時,您可以在 CLI 層級執行所有命令。或者,您也可以執行您要使用的命令,然後執行包含要求主體的 JSON 檔案的AWS 區域和位置。本指南中的範例展示了這兩種方法;但是,本節著重於前一個方法。
AWS CLI不支援串流轉錄。
在繼續之前,請確保您已經:
-
將您的媒體文件上傳到存Amazon S3儲桶中。如果您不確定如何建立Amazon S3值區或上傳檔案,請參閱建立您的第一個Amazon S3值區和將物件上傳到值區。
-
安裝了 AWS CLI.
您可以在《AWS CLI指令參考》Amazon Transcribe中找到的所有指AWS CLI令
開始新的轉錄工作
若要開始新的轉錄,請使用start-transcription-job
指令。
-
在終端機視窗中,輸入下列內容:
aws transcribe start-transcription-job \
下一行會出現
>
'',您現在可以繼續新增必要的參數,如下一個步驟所述。您也可以省略 '
\
' 並附加所有參數,每個參數都用空格分隔。 -
使用
start-transcription-job
指令時,您必須包含region
transcription-job-name
media
、、和language-code
或identify-language
。如果要指定輸出位置,請在請求
output-bucket-name
中包含;如果要指定指定輸出存儲桶的子文件夾,也請包括output-key
。aws transcribe start-transcription-job \ --region
us-west-2
\ --transcription-job-namemy-first-transcription-job
\ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
\ --language-codeen-US
如果附加所有參數,則此請求如下所示:
aws transcribe start-transcription-job --region
us-west-2
--transcription-job-namemy-first-transcription-job
--media MediaFileUri=s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
--language-codeen-US
如果您選擇不使用指定輸出值區
output-bucket-name
,請將轉錄輸出Amazon Transcribe放置在服務管理的值區中。儲存在服務管理儲存貯體中的成績單會在 90 天後過期。Amazon Transcribe響應:
{ "TranscriptionJob": { "TranscriptionJobName": "my-first-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "en-US", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" }, "StartTime": "2022-03-07T15:03:44.246000-08:00", "CreationTime": "2022-03-07T15:03:44.229000-08:00" } }
如果從TranscriptionJobStatus
IN_PROGRESS
變更為,您的轉錄工作就會成功COMPLETED
。若要查看更新 TranscriptionJobStatus
,請使用get-transcription-job
或list-transcription-job
指令,如下節所示。
取得轉錄任務的狀態
若要取得轉錄工作的相關資訊,請使用get-transcription-job
指令。
此命令唯一需要的參數是工作所AWS 區域在的位置和作業的名稱。
aws transcribe get-transcription-job \ --region
us-west-2
\ --transcription-job-namemy-first-transcription-job
Amazon Transcribe響應:
{ "TranscriptionJob": { "TranscriptionJobName": "my-first-transcription-job", "TranscriptionJobStatus": "COMPLETED", "LanguageCode": "en-US", "MediaSampleRateHertz": 48000, "MediaFormat": "flac", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" }, "Transcript": { "TranscriptFileUri": "https://s3.the-URI-where-your-job-is-located.json" }, "StartTime": "2022-03-07T15:03:44.246000-08:00", "CreationTime": "2022-03-07T15:03:44.229000-08:00", "CompletionTime": "2022-03-07T15:04:01.158000-08:00", "Settings": { "ChannelIdentification": false, "ShowAlternatives": false } } }
如果您已為轉錄輸出選取自己的Amazon S3儲存貯體,則會列出此值區TranscriptFileUri
。如果您已選取服務管理值區,則會提供暫時 URI;請使用此 URI 下載您的成績單。
注意
服務管理Amazon S3值區的臨時 URI 僅在 15 分鐘內有效。如果您在使用 URI 時收到AccesDenied
錯誤,get-transcription-job
請再次執行要求以取得新的暫存 URI。
列出您的轉錄工作
若要列出指定的所有轉錄工作AWS 區域,請使用list-transcription-jobs
指令。
此命令唯一必要的參數是轉錄工作所AWS 區域在的參數。
aws transcribe list-transcription-jobs \ --region
us-west-2
Amazon Transcribe響應:
{ "NextToken": "A-very-long-string", "TranscriptionJobSummaries": [ { "TranscriptionJobName": "my-first-transcription-job", "CreationTime": "2022-03-07T15:03:44.229000-08:00", "StartTime": "2022-03-07T15:03:44.246000-08:00", "CompletionTime": "2022-03-07T15:04:01.158000-08:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" } ] }
刪除轉錄工作
若要刪除轉錄工作,請使用delete-transcription-job
指令。
此命令唯一需要的參數是工作所AWS 區域在的位置和作業的名稱。
aws transcribe delete-transcription-job \ --region
us-west-2
\ --transcription-job-namemy-first-transcription-job
要確認刪除請求是否成功,您可以運行list-transcription-jobs
命令。您的任務應該會顯示在清單中。