在 Amazon Translate 中查看和管理您的并行数据 - Amazon Translate

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 Amazon Translate 中查看和管理您的并行数据

您可以查看已添加到 Amazon Translate 的所有并行数据资源,也可以访问每个资源的详细摘要。随着翻译要求的变化,您可以通过更新并行数据来优化翻译输出。

查看和管理并行数据(Amazon Translate 控制台)

要在 Amazon Translate 控制台中添加并行数据,请使用并行数据页面:

查看您的并行数据资源列表
  1. 打开 Amazon Translate 控制台

  2. 在左侧导航菜单中,选择自定义,然后选择并行数据。本页的表列出了您已添加到 Amazon Translate 的并行数据资源。

查看并行数据资源的详细信息
  • 并行数据页面上,在名称列中选择并行数据资源的名称。控制台会打开详细信息页面,其中包含状态、上次更新日期、源语言和目标语言等信息。

更新并行数据资源
  1. 将并行数据的更新版本作为新输入文件上传到 Amazon S3 存储桶中。

  2. 在 Amazon Translate 控制台中,转到并行数据页面。

  3. 选择想要更新的并行数据,然后选择更新。控制台显示创建并行数据页面。

  4. 提供以下项:

    描述 - 可选

    更新的描述。

    S3 上的并行数据位置

    Amazon S3 中更新的并行数据输入文件的位置。要通过导航到 Amazon S3 中的文件来提供位置,请选择选择文件

    选择并行数据文件格式

    并行数据输入文件的格式。支持的格式包括翻译记忆库交换 (TMX)、逗号分隔值 (CSV) 和制表符分隔值 (TSV)。

  5. 选择保存。Amazon Translate 会将旧的并行数据替换为新的输入文件。

查看和管理并行数据 (AWS CLI)

您可以使用 AWS CLI 来查看和更新您的并行数据资源。

查看您的并行数据资源列表

要查看您已添加到 Amazon Translate 的并行数据资源列表,请使用 list-parallel-data 命令。

例 list-parallel-data 命令

以下示例返回并行数据资源及其属性的列表。

$ aws translate list-parallel-data

如果此命令成功,Amazon Translate 将返回类似以下内容的数组:

{ "ParallelDataPropertiesList": [ { "Name": "my-parallel-data", "Arn": "arn:aws:translate:us-west-2:111122223333:parallel-data/my-parallel-data", "Status": "ACTIVE", "SourceLanguageCode": "en", "TargetLanguageCodes": [ "es", "ja", "zh" ], "ParallelDataConfig": { "S3Uri": "s3://input-bucket/parallel-data-file.tsv", "Format": "TSV" }, "ImportedDataSize": 2283, "ImportedRecordCount": 3, "FailedRecordCount": 0, "CreatedAt": 1598597751.406, "LastUpdatedAt": 1598597911.675 } ] }

查看并行数据对象的详细信息

要查找单个并行数据资源的详细信息,请使用 get-parallel-data 命令。此命令将返回并行数据的属性以及预签名 S3 URL,您可以通过该 URL 下载用于创建该数据的输入文件。

例 get-parallel-data 命令

以下示例可获取 my-parallel-data 对象的属性和下载位置:

$ aws translate get-parallel-data \ > --name my-parallel-data

如果命令成功,Amazon Translate 将返回属性和下载位置:

{ "ParallelDataProperties": { "Name": "my-parallel-data", "Arn": "arn:aws:translate:us-west-2:111122223333:parallel-data/my-parallel-data", "Status": "ACTIVE", "SourceLanguageCode": "en", "TargetLanguageCodes": [ "es", "ja", "zh" ], "ParallelDataConfig": { "S3Uri": "s3://input-bucket/parallel-data-file.tsv", "Format": "TSV" }, "ImportedDataSize": 2283, "ImportedRecordCount": 3, "FailedRecordCount": 0, "CreatedAt": 1598597751.406, "LastUpdatedAt": 1598597911.675 }, "DataLocation": { "RepositoryType": "S3", "Location": "pre-signed S3 URL" } }

更新并行数据资源

要更新并行数据资源,请先将新的输入文件上传到 Amazon S3 输入存储桶。然后,使用 update-parallel-data 命令并指定想要更新的并行数据资源。Amazon Translate 将使用新输入文件中的信息替换旧的并行数据。

例 update-parallel-data 命令

以下命令使用来自 Amazon S3 的新输入文件更新 my-parallel-data

$ aws translate update-parallel-data \ > --name my-parallel-data \ > --parallel-data-config S3Uri=s3://input-bucket/parallel-data-file.tsv,Format=TSV

如果此命令成功,Amazon Translate 将返回如下响应:

{ "Name": "my-parallel-data", "Status": "ACTIVE", "LatestUpdateAttemptStatus": "UPDATING", "LatestUpdateAttemptAt": 1598601455.844 }

在此响应中,Status 字段提供预先存在的并行数据对象的状态,LatestUpdateAttemptStatus 字段提供当前更新尝试的状态。