选择您的 Cookie 首选项

我们使用必要 Cookie 和类似工具提供我们的网站和服务。我们使用性能 Cookie 收集匿名统计数据,以便我们可以了解客户如何使用我们的网站并进行改进。必要 Cookie 无法停用,但您可以单击“自定义”或“拒绝”来拒绝性能 Cookie。

如果您同意,AWS 和经批准的第三方还将使用 Cookie 提供有用的网站功能、记住您的首选项并显示相关内容,包括相关广告。要接受或拒绝所有非必要 Cookie,请单击“接受”或“拒绝”。要做出更详细的选择,请单击“自定义”。

在中使用数据集 AWS Glue DataBrew - AWS Glue DataBrew

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在中使用数据集 AWS Glue DataBrew

要在 DataBrew 控制台中查看您的数据集列表,请选择左侧的 D ATA SET。在数据集页面中,您可以通过单击每个数据集的名称或从其快捷菜单中选择操作编辑来查看每个数据集的详细信息。

要创建新数据集,请选择 DATASE T、Connect 新数据集不同的数据源具有不同的连接参数,您输入这些参数是为了 DataBrew 进行连接。保存连接并选择 “创建数据集” 后, DataBrew 将连接到您的数据并开始加载数据。有关更多信息,请参阅 连接到您的数据

数据集页面包含以下元素,可帮助您浏览数据。

数据集预览-在此选项卡上,您可以找到数据集的连接信息以及数据集整体结构的概述,如下所示。

Dataset details and preview showing metadata and sample rows from a JSON file stored in S3.

数据配置文件概述 — 在此选项卡上,您可以找到数据集统计数据和体积的图形数据配置文件,如下所示。

Data profile overview showing dataset summary, data types, missing cells, and correlations.
注意

要创建数据配置文件,请对您的数据集运行 DataBrew 分析作业。有关如何执行此操作的信息,请参阅 步骤 5:创建数据配置文件

列统计信息-在此选项卡上,您可以找到有关数据集中每列的详细统计信息,如下所示。

Data profile overview showing column statistics, data quality, and value distribution for a dataset.

数据谱系-此选项卡以图形方式显示您的数据集是如何创建的,以及如何使用它 DataBrew,如下所示。

Data lineage diagram showing dataset creation and usage flow in DataBrew.
隐私网站条款Cookie 首选项
© 2025, Amazon Web Services, Inc. 或其附属公司。保留所有权利。