執行批次翻譯工作 - Amazon Translate

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

執行批次翻譯工作

您可以使用 Amazon 翻譯主控台、或 Amazon Translate 譯來執行 AWS CLI批次 Amazon Translate 譯任務API。

注意

批次翻譯工作是長時間執行的作業,可能需要大量時間才能完成。例如,小型資料集的批次轉譯可能需要幾分鐘的時間,而非常大的資料集可能需要 2 天或更長時間。完成時間也取決於資源的可用性。

若要使用 Amazon Translate 主控台執行翻譯任務,請使用 Batch 翻譯頁面建立任務:

  1. 打開 Amazon Translate 控制台

  2. 在左側的導覽選單中,選擇「Batch 轉譯」。

  3. 在 [翻譯工作] 頁面上,選擇 [建立工作]。主控台會顯示 [建立翻譯工作] 頁面。

  4. Job 設定之下,執行下列操作:

    1. 名稱中,輸入批次轉譯工作的自訂名稱。

    2. 對於「來源語言」,請選取來源檔案的語言。如果您不知道來源檔案的語言,或您的輸入文件包含不同的來源語言,請選取auto。Amazon Translate 會 auto 偵測每個檔案的來源語言。

    3. 針對目標語言,最多可選取 10 種語言。Amazon Translate 會將每個來源檔案翻譯成每種目標語言。

  5. 在「輸入資料」下,執行下列操作:

    1. 對於輸入 S3 位置,請指定包含 Amazon S3 中翻譯來源檔案的輸入資料夾。若要透過在 Amazon S3 中導覽至該資料夾來提供資料夾,請選擇「選取資料夾」

    2. 檔案格式中,選取翻譯來源檔案的格式。

  6. 在「輸出資料」下,執行下列操作:

    1. 對於輸出 S3 位置,請在 Amazon S3 中指定輸出資料夾,Amazon Translate 放置翻譯輸出的位置。若要透過在 Amazon S3 中導覽至該資料夾來提供資料夾,請選擇「選取資料夾」

    2. 如果您要使用您在 () 中管理的客戶管理金鑰來加密輸出,請選擇 [自訂加密設定 AWS Key Management Service (進階AWS KMS)]。

      根據預設,Amazon Translate 會使用代表您建立、管理和使用的KMS金鑰來 AWS加密您的翻譯輸出。如果您要改用自己的KMS金鑰加密輸出,請選擇此選項。

      如果您要使用目前 AWS 帳戶中的KMS金鑰,請在 [選擇金鑰] 下方選取該 AWS Key Management Service 金鑰。或者,如果您想要使用其他AWS帳戶的KMS金鑰,請輸入該金鑰的 Amazon 資源名稱 (ARN)。

      注意

      在您可以使用自己的KMS金鑰之前,您必須在中為 Amazon Translate 新增服務角色的許可IAM。如果您要使用來自不同帳戶的KMS金鑰,您還必須更新中的金鑰政策 AWS KMS。如需詳細資訊,請參閱自訂加密的先決條件權限

  7. 在 [自訂-選用] 底下,您可以選擇使用下列設定來自訂翻譯工作的輸出:

    褻瀆

    在翻譯輸出中掩蓋褻瀆的單詞和短語。如果您為工作指定多種目標語言,則所有目標語言都必須支援粗俗遮罩。如果任何目標語言不支援粗言遮罩,翻譯工作就不會遮罩任何目標語言的不雅用語。

    如需詳細資訊,請參閱在 Amazon Translate 中掩蓋褻瀆的單詞和短語

    簡潔

    Amazon Translate 不支援批次翻譯任務的簡潔性。

    如需詳細資訊,請參閱在 Amazon Translate 中使用簡潔

    形式

    對於某些目標語言,您可以將「形式化」設定為正式或非正式。如果您為工作指定多種目標語言,翻譯會忽略任何不支援的目標語言的格式設定。

    如需詳細資訊,請參閱在 Amazon Translate 中設置形式

    自訂術語

    包含範例來源詞彙和每個字詞所需的翻譯。如果您為工作指定多種目標語言,翻譯會針對每個要求的目標語言使用指定的術語,該語言在術語檔案中具有來源術語的項目。

    如需詳細資訊,請參閱使用自訂術語自訂翻譯

    平行資料

    由範例組成,顯示您希望如何翻譯文字區段。如果您為工作指定多種目標語言,parallel 資料檔案必須包含所有目標語言的翻譯。

    當您將 parallel 資料新增至批次轉譯工作時,您會建立「使用中自訂翻譯」工作。

    注意

    使用中自訂翻譯工作的定價比其他不使用 parallel 資料的工作更高。如需詳細資訊,請參閱 Amazon Translate 定價

    如需詳細資訊,請參閱使用 parallel 資料自訂翻譯 (使用中自訂翻譯)

  8. 存取許可下,向 Amazon Translate 提供一個IAM角色,以授與 Amazon S3 中的輸入和輸出檔案所需權限:

    • 如果您的帳戶中已有此IAM角色,請選擇 [使用現有IAM角色],然後在 [角色] 底下選取該IAM角色

    • 如果您的帳戶中還沒有此IAM角色,請選擇 [建立IAM角色]。對於IAM角色,請選擇輸入和輸出 S3 儲存貯體。對於「角色名稱」,請提供自訂名稱。當您建立翻譯任務時,Amazon Translate 會自動建立角色。中的角色名IAM稱前置為 AmazonTranslateServiceRole-

      注意

      如果您選擇使用自己的KMS金鑰加密翻譯輸出,則無法選擇 [建立IAM角色]。在這種情況下,您必須使用預先存在的IAM角色,並且您的KMS金鑰必須具有允許角色使用金鑰的金鑰原則。

      如需詳細資訊,請參閱 自訂加密的先決條件權限

  9. 選擇建立作業

    主控台會返回「翻譯工作」頁面,其中工作建立狀態會顯示在頁面頂端的橫幅中。幾分鐘後,您的工作會顯示在表格中。

  10. 在「名稱」資料欄中選擇工作名稱,以開啟工作詳細資訊頁面。

    當您執行翻譯工作時,[狀態] 欄位會顯示 [進行中]。

  11. 當狀態變為「已完成」時,請選擇「輸出檔案位置」下的連結來移至您的翻譯輸出。主控台會移至 Amazon S3 中的輸出儲存貯體。

  12. 若要下載輸出檔案,請選取每個輸出檔案的核取方塊,然後選擇「下載」。

若要使用執行轉譯工作 AWS CLI,請使用start-text-translation-job命令,並為parallel-data-names參數指定 parallel 資料資源的名稱。

範例 S tart-text-translation-job 命令

下列範例透過提交存放在 Amazon S3 輸入儲存貯體中的 Excel 檔案來執行翻譯任務。此工作是由包含在要求中的 parallel 資料自訂。

$ aws translate start-text-translation-job \ > --input-data-config ContentType=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet,S3Uri=s3://amzn-s3-demo-bucket/input/ \ > --output-data-config S3Uri=s3://amzn-s3-demo-bucket/output/ \ > --data-access-role-arn arn:aws:iam::111122223333:role/my-iam-role \ > --source-language-code en \ > --target-language-codes es it \ > --job-name my-translation-job

如果命令成功,Amazon Translate 會以任務 ID 和狀態回應:

{ "JobId": "4446f95f20c88a4b347449d3671fbe3d", "JobStatus": "SUBMITTED" }

如果要自訂翻譯工作的輸出,可以使用下列參數:

--settings

設定翻譯輸出的設定,包括下列選項:

打開翻譯輸出的簡潔性。Amazon Translate 不支援批次翻譯任務的簡潔性。如需詳細資訊,請參閱在 Amazon Translate 中使用簡潔

啟用褻瀆內容以遮罩褻瀆的單詞和短語。若要啟用,請將褻瀆參數設定為Profanity=MASK。如需詳細資訊,請參閱在 Amazon Translate 中掩蓋褻瀆的單詞和短語。如果任何目標語言不支援粗言遮罩,翻譯工作就不會遮罩任何目標語言的不雅用語。

設定翻譯輸出中的形式程度。將Formality參數設定為FORMALINFORMAL。如果您為工作指定多種目標語言,翻譯會忽略任何不支援的目標語言的格式設定。如需詳細資訊,請參閱在 Amazon Translate 中設置形式

--terminology-names

要新增至翻譯工作的自訂術語資源名稱。此資源列出來源詞彙範例,以及每個字詞所需的翻譯。如果您為工作指定多種目標語言,翻譯會針對每個要求的目標語言使用指定的術語,該語言在術語檔案中具有來源術語的項目。

此參數僅接受一個自訂術語資源。

如需可用的自訂術語資源清單,請使用list-terminologies指令。

如需詳細資訊,請參閱使用自訂術語自訂翻譯

--parallel-data-names

要新增至翻譯工作的 parallel 資料資源名稱。此資源包含示範如何翻譯文字區段的範例。如果您為工作指定多種目標語言,parallel 資料檔案必須包含所有目標語言的翻譯。

將 parallel 資料新增至翻譯工作時,即建立「使用中自訂翻譯」工作。

此參數只接受一個 parallel 資料資源。

注意

使用中自訂翻譯工作的定價比其他不使用 parallel 資料的工作更高。如需詳細資訊,請參閱 Amazon Translate 定價

如需可用 parallel 資料資源的清單,請使用list-parallel-data指令。

如需詳細資訊,請參閱使用 parallel 資料自訂翻譯 (使用中自訂翻譯)

若要檢查翻譯工作的狀態,請使用describe-text-translation-job指令。

範例 D escribe-text-translation-job 命令

下列範例會透過提供工作 ID 來檢查工作狀態。此 ID 是由 Amazon Translate 在start-text-translation-job命令啟動任務時提供的。

$ aws translate describe-text-translation-job \ > --job-id 4446f95f20c88a4b347449d3671fbe3d

Amazon Translate 回應任務屬性,其中包括其狀態:

{ "TextTranslationJobProperties": { "JobId": "4446f95f20c88a4b347449d3671fbe3d", "JobName": "my-translation-job", "JobStatus": "COMPLETED", "JobDetails": { "TranslatedDocumentsCount": 0, "DocumentsWithErrorsCount": 0, "InputDocumentsCount": 1 }, "SourceLanguageCode": "en", "TargetLanguageCodes": [ "es", "it" ], "SubmittedTime": 1598661012.468, "InputDataConfig": { "S3Uri": "s3://amzn-s3-demo-bucket/input/", "ContentType": "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet" }, "OutputDataConfig": { "S3Uri": "s3://amzn-s3-demo-bucket/output/111122223333-TranslateText-4446f95f20c88a4b347449d3671fbe3d/" }, "DataAccessRoleArn": "arn:aws:iam::111122223333:role/my-iam-role" } }

如果該JobStatus值是IN_PROGRESS,請等待幾分鐘的時間,然describe-text-translation-job後再次運行,直到狀態為止COMPLETED。工作完成時,您可以在下S3Uri欄位所提供的位置下載翻譯結果OutputDataConfig

若要使用 Amazon Translate 翻譯提交批次翻譯任務API,請使用此StartTextTranslationJob作業。