本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在中使用数据集 AWS Glue DataBrew
要在 DataBrew 控制台中查看您的数据集列表,请选择左侧的 D ATA SET。在数据集页面中,您可以通过单击每个数据集的名称或从其快捷菜单中选择操作、编辑来查看每个数据集的详细信息。
要创建新数据集,请选择 DATASE T、Connect 新数据集。不同的数据源具有不同的连接参数,您输入这些参数是为了 DataBrew 进行连接。保存连接并选择 “创建数据集” 后, DataBrew 将连接到您的数据并开始加载数据。有关更多信息,请参阅 连接到您的数据。
数据集页面包含以下元素,可帮助您浏览数据。
数据集预览-在此选项卡上,您可以找到数据集的连接信息以及数据集整体结构的概述,如下所示。

数据配置文件概述 — 在此选项卡上,您可以找到数据集统计数据和体积的图形数据配置文件,如下所示。

注意
要创建数据配置文件,请对您的数据集运行 DataBrew 分析作业。有关如何执行此操作的信息,请参阅 步骤 5:创建数据配置文件。
列统计信息-在此选项卡上,您可以找到有关数据集中每列的详细统计信息,如下所示。

数据谱系-此选项卡以图形方式显示您的数据集是如何创建的,以及如何使用它 DataBrew,如下所示。
