数据湖仪表板 - AWS Supply Chain

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

数据湖仪表板

您可以使用 … AWS Supply Chain 数据湖,用于从各种数据源摄取数据。有关支持的数据源的信息,请参见数据湖

数据湖概述

数据摄取

您可以查看当前连接、源流和目标流。要查看采集数据的状态,请按照以下步骤操作。

  1. 在 AWS Supply Chain 控制面板,在左侧导航窗格中,选择 Data Lake,然后选择数据摄取选项卡。

    将出现 “数据摄取” 页面。

  2. 选择 “源流” 选项卡。

    • 源流-显示已上传数据集的文件或文件夹结构。

    • S3 前缀-显示上传源文件的 Amazon S3 路径。

    • 状态-显示源文件的上传状态。

    • 上次同步-显示文件上次同步或更新的时间。

    • 操作-您可以查看以下内容:

      • 管理流程-您可以更新数据映射。

      • 上传文件-您可以向现有源流中添加其他源文件。

      • 删除流程-您可以完全删除源流程。

  3. 选择 “目标流” 选项卡。

  4. 在 “操作” 下,选择 “管理流程” 以查看和更新数据映射。

    此时将出现 “管理目标流” 页面。

  5. 将 “源列” 下所有未关联的源列移至 “目标列”

  6. 选择 “退出并查看目标流”,返回 “目标流” 页面以查看目标流。

  7. 选择连接选项卡。

    您可以查看所有现有连接。

数据集

您可以查看已提取的数据集的状态。

要查看上传到现有连接的所有数据集,请按照以下步骤操作。

  1. 在 AWS Supply Chain 控制面板,在左侧导航窗格中,选择数据湖,然后选择数据集选项卡。

    此时将出现 “数据集” 页面。

  2. 要查看数据集,请选择查看

  3. 数据集字段选项卡下,您可以查看数据集中的所有现有数据集字段。

  4. 在 “源连接” 选项卡下,您可以查看为该数据集提供信息的连接。