

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 使用可视化技术探索数据
<a name="canvas-explore-data-visualization"></a>

**注意**  
只能对基于表格数据集构建的模型使用 SageMaker Canvas 可视化。多元文本预测模型也排除在外。

借助 Amazon SageMaker Canvas，您可以探索和可视化数据，以便在构建机器学习模型之前获得对数据的高级见解。您可以使用散点图、条形图和方框图进行可视化，这有助于您了解数据，并发现可能影响模型准确性的特征之间的关系。

在 SageMaker Canvas 应用程序的 “**构建**” 选项卡中，选择**数据可视化工具**开始创建您的可视化效果。

您可以更改可视化样本大小，以调整从数据集中抽取的随机样本的大小。样本量过大可能会影响数据可视化的性能，因此我们建议您选择适当的样本量。要更改样本量，请按照下列过程操作。

1. 选择**可视化样本**。

1. 使用滑块选择所需的样本量。

1. 选择**更新**以确认对样本量的更改。

**注意**  
某些可视化技术需要特定数据类型的列。例如，对于散点图的 x 轴和 y 轴，只能使用数值列。

## 散点图
<a name="canvas-explore-data-scatterplot"></a>

要使用您的数据集创建散点图，请在**可视化**面板中选择**散点图**。从**列**部分中选择要在 x 轴和 y 轴上绘制的特征。您可以将列拖放到坐标轴上，或者拖放坐标轴后，可以从支持的列列表中选择一列。

您可以使用**着色依据**根据第三个特征为绘图上的数据点着色。您也可以使用**分组依据**根据第四个特征将数据分组到单独的绘图中。

下图显示了使用**着色依据**和**分组依据**的散点图。在此示例中，每个数据点都按 `MaritalStatus` 特征着色，按 `Department` 特征分组会生成每个部门的数据点的散点图。

![\[Canvas 应用程序的数据可视化工具视图中散点图的屏幕截图。\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/studio/canvas/canvas-eda-scatter-plot.png)


## 条形图
<a name="canvas-explore-data-barchart"></a>

要使用您的数据集创建条形图，请在**可视化**面板中选择**条形图**。从**列**部分中选择要在 x 轴和 y 轴上绘制的特征。您可以将列拖放到坐标轴上，或者拖放坐标轴后，可以从支持的列列表中选择一列。

您可以使用**分组依据**按第三个特征对条形图进行分组。您可以使用**堆叠依据**，根据第四个特征的唯一值对每个条形图进行垂直阴影处理。

下图显示了使用**分组依据**和**堆叠依据**的条形图。在此示例中，条形图按 `MaritalStatus` 特征分组，并按 `JobLevel` 特征堆叠。对于 x 轴上的每个 `JobRole`，`MaritalStatus` 特征中的独特类别都有一个单独的条形图，每个条形图都按 `JobLevel` 特征垂直堆叠。

![\[Canvas 应用程序的数据可视化工具视图中条形图的屏幕截图。\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/studio/canvas/canvas-eda-bar-chart.png)


## 方框图
<a name="canvas-explore-data-boxplot"></a>

要使用您的数据集创建方框图，请在**可视化**面板中选择**方框图**。从**列**部分中选择要在 x 轴和 y 轴上绘制的特征。您可以将列拖放到坐标轴上，或者拖放坐标轴后，可以从支持的列列表中选择一列。

您可以使用**分组依据**按第三个特征对方框图进行分组。

下图显示了使用**分组依据**的方框图。在此示例中，x 轴和 y 轴分别显示 `JobLevel` 和 `JobSatisfaction`，彩色方框图按 `Department` 特征分组。

![\[Canvas 应用程序的数据可视化工具视图中方框图的屏幕截图。\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/studio/canvas/canvas-eda-box-plot.png)
