本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
擷取現有連線的資料
如果您使用的是 Amazon S3,下列是擷取選項:
-
附加 – 若要附加擷取資料或增量擷取,來源路徑中的所有檔案都會合併為單一資料集,然後再擷取至資料湖。此方法可確保跨越數天之檔案的資料完整性。當您從 S3 儲存貯體中的來源路徑移除檔案時,只有來源路徑中可用的檔案會擷取到資料湖中。
附加選項可確保在資料湖中複寫和同步 Amazon S3 中的檔案。
覆寫 – 在取代期間,資料檔案會在來源路徑中更新時擷取到資料湖中。每個新檔案都會完全取代資料集。
注意
您可以在附加和覆寫選項中刪除來源流程和對應的資料。
以下是 EDI、SAPS/4 HANA和 SAP ECC的擷取操作選項:
-
更新 – 使用配方中使用的相同欄位更新現有資料列。
-
取代 – 刪除現有上傳的資料,並將其取代為新的傳入資料。
-
刪除 – 使用主要 刪除一或多個資料列IDs。
若要開始擷取資料,請依照下列程序執行。
-
在 AWS Supply Chain 儀表板的左側導覽窗格中,選擇 Data Lake 。
在 Data Ingestion 索引標籤上,選擇 Connections 。
選取要擷取資料的連線,然後選擇 Data Ingestion 。
隨即出現 Data Ingestion Configuration 頁面。
-
選擇開始使用。
-
在資料擷取詳細資訊頁面上,選取您是否要更新 、取代 或刪除資料。選擇複製 ,以複製 Amazon S3 路徑。