本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
執行批次翻譯工作
您可以使用 Amazon 翻譯主控台、或 Amazon Translate 譯來執行 AWS CLI批次 Amazon Translate 譯任務API。
注意
批次翻譯工作是長時間執行的作業,可能需要大量時間才能完成。例如,小型資料集的批次轉譯可能需要幾分鐘的時間,而非常大的資料集可能需要 2 天或更長時間。完成時間也取決於資源的可用性。
若要使用 Amazon Translate 主控台執行翻譯任務,請使用 Batch 翻譯頁面建立任務:
-
在左側的導覽選單中,選擇「Batch 轉譯」。
-
在 [翻譯工作] 頁面上,選擇 [建立工作]。主控台會顯示 [建立翻譯工作] 頁面。
-
在 Job 設定之下,執行下列操作:
-
在名稱中,輸入批次轉譯工作的自訂名稱。
-
對於「來源語言」,請選取來源檔案的語言。如果您不知道來源檔案的語言,或您的輸入文件包含不同的來源語言,請選取
auto
。Amazon Translate 會 auto 偵測每個檔案的來源語言。 -
針對目標語言,最多可選取 10 種語言。Amazon Translate 會將每個來源檔案翻譯成每種目標語言。
-
-
在「輸入資料」下,執行下列操作:
-
對於輸入 S3 位置,請指定包含 Amazon S3 中翻譯來源檔案的輸入資料夾。若要透過在 Amazon S3 中導覽至該資料夾來提供資料夾,請選擇「選取資料夾」。
-
在檔案格式中,選取翻譯來源檔案的格式。
-
-
在「輸出資料」下,執行下列操作:
-
對於輸出 S3 位置,請在 Amazon S3 中指定輸出資料夾,Amazon Translate 放置翻譯輸出的位置。若要透過在 Amazon S3 中導覽至該資料夾來提供資料夾,請選擇「選取資料夾」。
-
如果您要使用您在 () 中管理的客戶管理金鑰來加密輸出,請選擇 [自訂加密設定 AWS Key Management Service (進階AWS KMS)]。
根據預設,Amazon Translate 會使用代表您建立、管理和使用的KMS金鑰來 AWS加密您的翻譯輸出。如果您要改用自己的KMS金鑰加密輸出,請選擇此選項。
如果您要使用目前 AWS 帳戶中的KMS金鑰,請在 [選擇金鑰] 下方選取該 AWS Key Management Service 金鑰。或者,如果您想要使用其他AWS帳戶的KMS金鑰,請輸入該金鑰的 Amazon 資源名稱 (ARN)。
注意
在您可以使用自己的KMS金鑰之前,您必須在中為 Amazon Translate 新增服務角色的許可IAM。如果您要使用來自不同帳戶的KMS金鑰,您還必須更新中的金鑰政策 AWS KMS。如需詳細資訊,請參閱自訂加密的先決條件權限。
-
-
在 [自訂-選用] 底下,您可以選擇使用下列設定來自訂翻譯工作的輸出:
- 褻瀆
-
在翻譯輸出中掩蓋褻瀆的單詞和短語。如果您為工作指定多種目標語言,則所有目標語言都必須支援粗俗遮罩。如果任何目標語言不支援粗言遮罩,翻譯工作就不會遮罩任何目標語言的不雅用語。
如需詳細資訊,請參閱在 Amazon Translate 中掩蓋褻瀆的單詞和短語。
- 簡潔
-
Amazon Translate 不支援批次翻譯任務的簡潔性。
如需詳細資訊,請參閱在 Amazon Translate 中使用簡潔。
- 形式
-
對於某些目標語言,您可以將「形式化」設定為正式或非正式。如果您為工作指定多種目標語言,翻譯會忽略任何不支援的目標語言的格式設定。
如需詳細資訊,請參閱在 Amazon Translate 中設置形式。
- 自訂術語
-
包含範例來源詞彙和每個字詞所需的翻譯。如果您為工作指定多種目標語言,翻譯會針對每個要求的目標語言使用指定的術語,該語言在術語檔案中具有來源術語的項目。
如需詳細資訊,請參閱使用自訂術語自訂翻譯。
- 平行資料
-
由範例組成,顯示您希望如何翻譯文字區段。如果您為工作指定多種目標語言,parallel 資料檔案必須包含所有目標語言的翻譯。
當您將 parallel 資料新增至批次轉譯工作時,您會建立「使用中自訂翻譯」工作。
注意
使用中自訂翻譯工作的定價比其他不使用 parallel 資料的工作更高。如需詳細資訊,請參閱 Amazon Translate 定價
。 如需詳細資訊,請參閱使用 parallel 資料自訂翻譯 (使用中自訂翻譯)。
-
在存取許可下,向 Amazon Translate 提供一個IAM角色,以授與 Amazon S3 中的輸入和輸出檔案所需權限:
-
如果您的帳戶中已有此IAM角色,請選擇 [使用現有IAM角色],然後在 [角色] 底下選取該IAM角色。
-
如果您的帳戶中還沒有此IAM角色,請選擇 [建立IAM角色]。對於IAM角色,請選擇輸入和輸出 S3 儲存貯體。對於「角色名稱」,請提供自訂名稱。當您建立翻譯任務時,Amazon Translate 會自動建立角色。中的角色名IAM稱前置為 AmazonTranslateServiceRole-。
注意
如果您選擇使用自己的KMS金鑰加密翻譯輸出,則無法選擇 [建立IAM角色]。在這種情況下,您必須使用預先存在的IAM角色,並且您的KMS金鑰必須具有允許角色使用金鑰的金鑰原則。
如需詳細資訊,請參閱 自訂加密的先決條件權限
-
-
選擇建立作業。
主控台會返回「翻譯工作」頁面,其中工作建立狀態會顯示在頁面頂端的橫幅中。幾分鐘後,您的工作會顯示在表格中。
-
在「名稱」資料欄中選擇工作名稱,以開啟工作詳細資訊頁面。
當您執行翻譯工作時,[狀態] 欄位會顯示 [進行中]。
-
當狀態變為「已完成」時,請選擇「輸出檔案位置」下的連結來移至您的翻譯輸出。主控台會移至 Amazon S3 中的輸出儲存貯體。
-
若要下載輸出檔案,請選取每個輸出檔案的核取方塊,然後選擇「下載」。
若要使用執行轉譯工作 AWS CLI,請使用start-text-translation-job
命令,並為parallel-data-names
參數指定 parallel 資料資源的名稱。
範例 S tart-text-translation-job 命令
下列範例透過提交存放在 Amazon S3 輸入儲存貯體中的 Excel 檔案來執行翻譯任務。此工作是由包含在要求中的 parallel 資料自訂。
$
aws translate start-text-translation-job \>
--input-data-config ContentType=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
,S3Uri=s3://amzn-s3-demo-bucket/input
/ \>
--output-data-config S3Uri=s3://amzn-s3-demo-bucket/output
/ \>
--data-access-role-arnarn:aws:iam::111122223333:role/my-iam-role
\>
--source-language-codeen
\>
--target-language-codeses it
\>
--job-namemy-translation-job
如果命令成功,Amazon Translate 會以任務 ID 和狀態回應:
{ "JobId": "4446f95f20c88a4b347449d3671fbe3d", "JobStatus": "SUBMITTED" }
如果要自訂翻譯工作的輸出,可以使用下列參數:
--settings
-
設定翻譯輸出的設定,包括下列選項:
打開翻譯輸出的簡潔性。Amazon Translate 不支援批次翻譯任務的簡潔性。如需詳細資訊,請參閱在 Amazon Translate 中使用簡潔。
啟用褻瀆內容以遮罩褻瀆的單詞和短語。若要啟用,請將褻瀆參數設定為
Profanity=MASK
。如需詳細資訊,請參閱在 Amazon Translate 中掩蓋褻瀆的單詞和短語。如果任何目標語言不支援粗言遮罩,翻譯工作就不會遮罩任何目標語言的不雅用語。設定翻譯輸出中的形式程度。將
Formality
參數設定為FORMAL
或INFORMAL
。如果您為工作指定多種目標語言,翻譯會忽略任何不支援的目標語言的格式設定。如需詳細資訊,請參閱在 Amazon Translate 中設置形式。 --terminology-names
-
要新增至翻譯工作的自訂術語資源名稱。此資源列出來源詞彙範例,以及每個字詞所需的翻譯。如果您為工作指定多種目標語言,翻譯會針對每個要求的目標語言使用指定的術語,該語言在術語檔案中具有來源術語的項目。
此參數僅接受一個自訂術語資源。
如需可用的自訂術語資源清單,請使用
list-terminologies
指令。如需詳細資訊,請參閱使用自訂術語自訂翻譯。
--parallel-data-names
-
要新增至翻譯工作的 parallel 資料資源名稱。此資源包含示範如何翻譯文字區段的範例。如果您為工作指定多種目標語言,parallel 資料檔案必須包含所有目標語言的翻譯。
將 parallel 資料新增至翻譯工作時,即建立「使用中自訂翻譯」工作。
此參數只接受一個 parallel 資料資源。
注意
使用中自訂翻譯工作的定價比其他不使用 parallel 資料的工作更高。如需詳細資訊,請參閱 Amazon Translate 定價
。 如需可用 parallel 資料資源的清單,請使用
list-parallel-data
指令。如需詳細資訊,請參閱使用 parallel 資料自訂翻譯 (使用中自訂翻譯)。
若要檢查翻譯工作的狀態,請使用describe-text-translation-job
指令。
範例 D escribe-text-translation-job 命令
下列範例會透過提供工作 ID 來檢查工作狀態。此 ID 是由 Amazon Translate 在start-text-translation-job
命令啟動任務時提供的。
$
aws translate describe-text-translation-job \>
--job-id 4446f95f20c88a4b347449d3671fbe3d
Amazon Translate 回應任務屬性,其中包括其狀態:
{ "TextTranslationJobProperties": { "JobId": "4446f95f20c88a4b347449d3671fbe3d", "JobName": "my-translation-job", "JobStatus": "COMPLETED", "JobDetails": { "TranslatedDocumentsCount": 0, "DocumentsWithErrorsCount": 0, "InputDocumentsCount": 1 }, "SourceLanguageCode": "en", "TargetLanguageCodes": [ "es", "it" ], "SubmittedTime": 1598661012.468, "InputDataConfig": { "S3Uri": "s3://amzn-s3-demo-bucket/input/", "ContentType": "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet" }, "OutputDataConfig": { "S3Uri": "s3://amzn-s3-demo-bucket/output/111122223333-TranslateText-4446f95f20c88a4b347449d3671fbe3d/" }, "DataAccessRoleArn": "arn:aws:iam::111122223333:role/my-iam-role" } }
如果該JobStatus
值是IN_PROGRESS
,請等待幾分鐘的時間,然describe-text-translation-job
後再次運行,直到狀態為止COMPLETED
。工作完成時,您可以在下S3Uri
欄位所提供的位置下載翻譯結果OutputDataConfig
。
若要使用 Amazon Translate 翻譯提交批次翻譯任務API,請使用此StartTextTranslationJob作業。