正在为现有连接摄取数据 - AWS Supply Chain

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

正在为现有连接摄取数据

如果您使用的是 Amazon S3,以下是提取选项:

  • Append — 为了追加摄取数据或进行增量摄取,源路径中的所有文件在被摄取到数据湖之前都将合并到一个数据集中。此方法可确保跨越多天的文件数据的完整性。当您从 S3 存储桶的源路径中移除文件时,仅在源路径中可用的文件会被提取到数据湖中。

    追加” 选项可确保您在 Amazon S3 中的文件在数据湖中进行复制和同步。

  • 覆盖-在替换期间,数据文件在源路径中更新时会被提取到数据湖中。每个新文件都会完全替换数据集。

    注意

    您可以在 “追加” 和 “覆盖” 选项中删除源流和相应的数据。

以下是EDI、S SAP/4 HANA 和的摄取操作选项:SAPECC

  • 更新-使用与配方中使用的相同字段更新现有数据行。

  • 替换-删除已上传的现有数据,并将其替换为新的传入数据。

  • 删除-使用主数据删除一行或多行数据IDs。

要开始数据摄取,请按照以下步骤操作。
  1. 在 AWS Supply Chain 控制面板的左侧导航窗格中,选择数据湖

  2. 在 “数据接入” 选项卡上,选择 “连接”。

  3. 选择要摄取数据的连接,然后选择 “数据接入”。

    此时将出现 “数据摄取配置” 页面。

  4. 选择开始

  5. 在 “数据提取详细信息” 页面上,选择是要更新替换还是删除数据。选择 “复制” 复制 Amazon S3 路径。