

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 导入训练数据
<a name="create-ml-model-training-data"></a>

**注意**  
您只能提供训练数据集，以便在数据存储在 Amazon S3 中的 Clean Rooms ML 相似模型中使用。但是，您可以使用 SQL 为相似模型提供种子数据，该模型跨存储在任何支持的数据源中的数据运行。

在创建相似模型之前，必须指定包含训练数据的 AWS Glue 表。Clean Rooms ML 不存储该数据的副本，仅存储允许其访问该数据的元数据。

**要在中导入训练数据 AWS Clean Rooms**

1. 登录 AWS 管理控制台 并使用您的[AWS Clean Rooms 主机](https://console.aws.amazon.com/cleanrooms/home)打开主机 AWS 账户 （如果您尚未这样做）。

1. 在左侧导航窗格中，选择 **AWS ML 模型**。

1. 在**训练数据集**选项卡上，选择**创建训练数据集**。

1. 在**创建训练数据集**页面上，对于**训练数据集详细信息**，请输入**名称**，以及**描述**（可选）。

1. 通过从下拉列表中选择要配置的**数据库**和**表**来选择**训练数据来源**。
**注意**  
要验证是否是正确的表，请执行以下任一操作：  
选择 “**查看方式” AWS Glue**。
打开**查看架构**以查看架构。

1. 对于**训练详细信息**，请从下拉列表中选择**用户标识符列**、**项目标识符列**和**时间戳列**。训练数据必须包含这三个列。您也可以选择要在训练数据中包含的任何其他列。

   **时间戳列**中的数据必须采用 Unix 纪元时间格式，以秒为单位。

1. （可选）如果您还有**要训练的其他列**，请从下拉列表中选择**列名称**和**类型**。

1. 在**服务访问**中，您必须指定可以访问您数据的服务角色，如果您的数据已加密，则必须提供 KMS 密钥。选择**创建并使用新的服务角色**，Clean Rooms ML 将自动创建服务角色并添加必要的权限策略。如果您要使用特定的服务角色，请选择**使用现有服务角色**，并将其输入到**服务角色名称**字段中。

   如果您的数据已加密，请在 **AWS KMS key**字段中输入您的 KMS 密钥，或者单击**创建 AWS KMS key**以生成新的 KMS 密钥。

1. 如果要为训练数据集启用**标签**，请选择**添加新标签**，然后输入**键**和**值**对。

1. 选择**创建训练数据集**。

有关相应的 API 操作，请参阅[CreateTrainingDataset](https://docs.aws.amazon.com/cleanrooms-ml/latest/APIReference/API_CreateTrainingDataset.html)。