本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在 Amazon Translate 中查看和管理您的并行数据
您可以查看已添加到 Amazon Translate 的所有并行数据资源,也可以访问每个资源的详细摘要。随着翻译要求的变化,您可以通过更新并行数据来优化翻译输出。
查看和管理并行数据(Amazon Translate 控制台)
要在 Amazon Translate 控制台中添加并行数据,请使用并行数据页面:
查看您的并行数据资源列表
-
在左侧导航菜单中,选择自定义,然后选择并行数据。本页的表列出了您已添加到 Amazon Translate 的并行数据资源。
查看并行数据资源的详细信息
-
在并行数据页面上,在名称列中选择并行数据资源的名称。控制台会打开详细信息页面,其中包含状态、上次更新日期、源语言和目标语言等信息。
更新并行数据资源
-
将并行数据的更新版本作为新输入文件上传到 Amazon S3 存储桶中。
-
在 Amazon Translate 控制台中,转到并行数据页面。
-
选择想要更新的并行数据,然后选择更新。控制台显示创建并行数据页面。
-
提供以下项:
- 描述 - 可选
-
更新的描述。
- S3 上的并行数据位置
-
Amazon S3 中更新的并行数据输入文件的位置。要通过导航到 Amazon S3 中的文件来提供位置,请选择选择文件。
- 选择并行数据文件格式
-
并行数据输入文件的格式。支持的格式包括翻译记忆库交换 (TMX)、逗号分隔值 (CSV) 和制表符分隔值 (TSV)。
-
选择保存。Amazon Translate 会将旧的并行数据替换为新的输入文件。
查看和管理并行数据 (AWS CLI)
您可以使用 AWS CLI 来查看和更新您的并行数据资源。
查看您的并行数据资源列表
要查看您已添加到 Amazon Translate 的并行数据资源列表,请使用 list-parallel-data
命令。
例 list-parallel-data 命令
以下示例返回并行数据资源及其属性的列表。
$
aws translate list-parallel-data
如果此命令成功,Amazon Translate 将返回类似以下内容的数组:
{ "ParallelDataPropertiesList": [ { "Name": "my-parallel-data", "Arn": "arn:aws:translate:us-west-2:111122223333:parallel-data/my-parallel-data", "Status": "ACTIVE", "SourceLanguageCode": "en", "TargetLanguageCodes": [ "es", "ja", "zh" ], "ParallelDataConfig": { "S3Uri": "s3://input-bucket/parallel-data-file.tsv", "Format": "TSV" }, "ImportedDataSize": 2283, "ImportedRecordCount": 3, "FailedRecordCount": 0, "CreatedAt": 1598597751.406, "LastUpdatedAt": 1598597911.675 } ] }
查看并行数据对象的详细信息
要查找单个并行数据资源的详细信息,请使用 get-parallel-data
命令。此命令将返回并行数据的属性以及预签名 S3 URL,您可以通过该 URL 下载用于创建该数据的输入文件。
例 get-parallel-data 命令
以下示例可获取 my-parallel-data
对象的属性和下载位置:
$
aws translate get-parallel-data \>
--name my-parallel-data
如果命令成功,Amazon Translate 将返回属性和下载位置:
{ "ParallelDataProperties": { "Name": "my-parallel-data", "Arn": "arn:aws:translate:us-west-2:111122223333:parallel-data/my-parallel-data", "Status": "ACTIVE", "SourceLanguageCode": "en", "TargetLanguageCodes": [ "es", "ja", "zh" ], "ParallelDataConfig": { "S3Uri": "s3://input-bucket/parallel-data-file.tsv", "Format": "TSV" }, "ImportedDataSize": 2283, "ImportedRecordCount": 3, "FailedRecordCount": 0, "CreatedAt": 1598597751.406, "LastUpdatedAt": 1598597911.675 }, "DataLocation": { "RepositoryType": "S3", "Location": "
pre-signed S3 URL
" } }
更新并行数据资源
要更新并行数据资源,请先将新的输入文件上传到 Amazon S3 输入存储桶。然后,使用 update-parallel-data
命令并指定想要更新的并行数据资源。Amazon Translate 将使用新输入文件中的信息替换旧的并行数据。
例 update-parallel-data 命令
以下命令使用来自 Amazon S3 的新输入文件更新 my-parallel-data
:
$
aws translate update-parallel-data \>
--name my-parallel-data \>
--parallel-data-config S3Uri=s3://input-bucket/parallel-data-file.tsv,Format=TSV
如果此命令成功,Amazon Translate 将返回如下响应:
{ "Name": "my-parallel-data", "Status": "ACTIVE", "LatestUpdateAttemptStatus": "UPDATING", "LatestUpdateAttemptAt": 1598601455.844 }
在此响应中,Status
字段提供预先存在的并行数据对象的状态,LatestUpdateAttemptStatus
字段提供当前更新尝试的状态。