首次上传文件 - AWS Supply Chain

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

首次上传文件

您可以使用 AWS Supply Chain 自动关联功能上传原始数据,并自动将原始数据与 AWS Supply Chain 数据模型相关联。您还可以查看 AWS Supply Chain Web 应用程序中每个 AWS Supply Chain 模块所需的列和表。

要简要演示自动关联的工作原理,请观看以下视频:

注意

使用自动关联时,您只能将 CSV 文件上传到 Amazon S3。

将数据集中的源列与目标列关联后, AWS Supply Chain 将自动生成 SQL 配方。

注意

AWS Supply Chain 使用 Amazon Bedrock 进行自动关联,但并非所有可用的和AWS 区域 AWS Supply Chain 都支持自动关联。因此, AWS Supply Chain 将从最近的可用区域调用 Amazon Bedrock 终端节点,即欧洲(爱尔兰)区域 — 欧洲(法兰克福)和亚太地区(悉尼)区域 — 美国西部(俄勒冈)。

注意

仅当通过 Amazon S3 摄取数据时,才支持使用大型语言模型 (LLM) 进行自动关联。

  1. 在 AWS Supply Chain 控制面板的左侧导航窗格中,选择数据湖,然后选择数据摄取选项卡。

    将出现 “数据摄取” 页面。

  2. 选择 “添加新来源”。

    将出现 “选择您的数据源” 页面。

  3. “选择您的数据源” 页面上,选择 “上传文件”。

  4. 选择继续

    上传您的源文件
  5. 在 “要运行哪些功能” 页面上,选择要使用的 AWS Supply Chain 模块。您可以选择多个模块。

  6. 在 “上传您的源文件” 部分下,为源系统名称添加后缀。例如,oracle_test。

  7. 要上传源数据集,请选择文件或拖放文件。

    将显示带有名称和状态的源表。

  8. 选择 “上传到 S3”。上传状态将更改为显示状态。

  9. 在 “查看数据要求” 下,查看所选 AWS Supply Chain 要素的所有必需数据实体和列。将显示所有必需的主键和外键。

  10. 选择继续

  11. 在 “管理您的源表” 下,以下源表和列出的列将自动关联并导入到数据湖中。

    选择 Delete table 可在导入数据湖之前删除任何源表。

    管理您的源文件
  12. 选择 “全部接受” 并继续

    屏幕上会显示一条关于将您的表自动关联到 AWS Supply Chain 数据湖的消息。

    管理目标流
  13. 在 “管理目标流程” 下,您可以查看每个自动关联的表。

    默认情况下,自动关联处于启用状态,并且源列与目标列自动关联。要更新自动关联的列,您可以更新 SQL 配方以创建您的自定义配方。

  14. 在 “源列” 下,列出了所有未关联的源列。将未关联的列拖放到右侧的目标列中。

  15. 对每个自动关联的表执行上述步骤。

  16. 选择提交

  17. 选择退出并查看目标流程