步骤 6：转换数据集

到目前为止，您仅在数据集的样本上测试了您的配置。现在是时候通过创建 DataBrew 配方作业来转换整个数据集了。

任务运行时， DataBrew 将您的配方应用于数据集中的所有数据，并将转换后的数据写入 Amazon S3 存储桶。转换后的数据与原始数据集是分开的。 DataBrew 不会更改源数据。

在您继续之前，请确保您的账户中有 Amazon S3 存储桶可供您写入。在该存储桶中，创建一个用于捕获任务输出的文件夹 DataBrew。要执行这些步骤，请使用以下过程。

登录 AWS Management Console 并打开 Amazon S3 控制台，网址为https://console.aws.amazon.com/databrew/。

如果您已有一个 Amazon S3 存储桶可用，并且您具有写入权限，请跳到下一个步骤。
如果没有 Amazon S3 存储桶，请选择创建存储桶。对于存储桶名称，请为新存储桶输入一个唯一名称。选择 创建存储桶 。
从存储桶列表中，选择您想要使用的存储桶。
请选择 Create folder（创建文件夹）。
对于文件夹名称，输入 databrew-output，然后选择创建文件夹。

在创建用于包含作业的 Amazon S3 存储桶和文件夹后，请使用以下过程运行您的作业。

在导航窗格上，选择作业。
在配方作业选项卡上，选择创建作业。
对于作业名称，输入 chess-winner-summary。
对于作业类型，选择创建配方作业。
在作业输入窗格上，执行以下操作：
- 对于运行于，选择数据集。
- 选择选择数据集以查看可用数据集列表，然后选择 chess-games。
- 选择选择配方以查看可用配方列表，然后选择 chess-project-recipe。
在作业输出设置窗格上，执行以下操作：
- 文件类型：选择 CSV（逗号分隔值）。
- S3 位置：选择此字段可查看可用 Amazon S3 存储桶列表，然后选择要使用的存储桶。然后选择浏览。在文件夹列表中，选择 databrew-output，然后选择选择。
在访问权限窗格上，选择 AwsGlueDataBrewDataAccessRole。此服务相关角色允许您代表您 DataBrew访问您的 Amazon S3 存储桶。
选择创建并运行作业。 DataBrew 使用您的设置创建作业，然后运行它。
在作业运行历史记录窗格上，等待作业状态从 Running 更改为 Succeeded。
选择输出以访问 Amazon S3 控制台。选择您的 S3 存储桶，然后选择用于访问作业输出的 databrew-output 文件夹。
（可选）选择下载以下载文件并查看其内容。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

步骤 5：创建数据配置文件

步骤 7：（可选）清理