擷取現有連線的資料 - AWS Supply Chain

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

擷取現有連線的資料

如果您使用的是 Amazon S3,以下是擷取選項:

  • 附加 — 為了附加擷取資料或增量擷取,來源路徑中的所有檔案都會合併為單一資料集,然後才會擷取到資料湖中。此方法可確保跨越多天的文件數據的完整性。當您從 S3 儲存貯體的來源路徑移除檔案時,只有來源路徑中可用的檔案會擷取到資料湖中。

    附加選項可確保 Amazon S3 中的檔案會在資料湖中進行複寫和同步。

  • 覆寫 — 取代期間,資料檔案會在來源路徑中進行更新時擷取到資料湖中。每個新檔案都會完全取代資料集。

    注意

    您可以在「附加」和「覆寫」選項中刪除來源流程和對應的資料。

以下是EDISAPS/4 HANA 和的擷取作業選項:SAPECC

  • 更新 — 使用方案中使用的相同欄位更新現有的資料列。

  • — 刪除現有的已上傳資料,並將其取代為新的傳入資料。

  • 刪除 — 使用主資料列刪除一或多列資料IDs。

若要開始資料擷取,請遵循以下程序。
  1. 在「」 AWS Supply Chain 儀表板的左側導覽窗格中,選擇 [資料湖]。

  2. 在 [資料擷取] 索引標籤上,選擇 [連線]。

  3. 選取要擷取資料的連線,然後選擇「資料擷取」。

    便會顯示「資料擷取組態」頁面。

  4. 選擇開始使用

  5. 在「資料擷取詳細資料」頁面上,選取是否要更新、取刪除資料。選擇複製以複 Amazon S3 路徑。