擷取現有連線的資料 - AWS Supply Chain

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

擷取現有連線的資料

如果您使用的是 Amazon S3,下列是擷取選項:

  • 附加 – 若要附加擷取資料或增量擷取,來源路徑中的所有檔案都會合併為單一資料集,然後再擷取至資料湖。此方法可確保跨越數天之檔案的資料完整性。當您從 S3 儲存貯體中的來源路徑移除檔案時,只有來源路徑中可用的檔案會擷取到資料湖中。

    附加選項可確保在資料湖中複寫和同步 Amazon S3 中的檔案。

  • 覆寫 – 在取代期間,資料檔案會在來源路徑中更新時擷取到資料湖中。每個新檔案都會完全取代資料集。

    注意

    您可以在附加覆寫選項中刪除來源流程和對應的資料。

以下是 EDISAPS/4 HANASAP ECC的擷取操作選項:

  • 更新 – 使用配方中使用的相同欄位更新現有資料列。

  • 取代 – 刪除現有上傳的資料,並將其取代為新的傳入資料。

  • 刪除 – 使用主要 刪除一或多個資料列IDs。

若要開始擷取資料,請依照下列程序執行。
  1. 在 AWS Supply Chain 儀表板的左側導覽窗格中,選擇 Data Lake

  2. Data Ingestion 索引標籤上,選擇 Connections

  3. 選取要擷取資料的連線,然後選擇 Data Ingestion

    隨即出現 Data Ingestion Configuration 頁面。

  4. 選擇開始使用

  5. 資料擷取詳細資訊頁面上,選取您是否要更新 取代 或刪除資料。選擇複製 ,以複製 Amazon S3 路徑。