編輯資料流程步驟 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

編輯資料流程步驟

在 Amazon SageMaker Canvas 中,您可以編輯資料流程中的個別步驟,以轉換資料集,而無需建立新的資料流程。以下頁面說明如何編輯聯結和串連步驟,以及資料來源步驟。

編輯聯結和串連步驟

在資料流程中,您可以靈活地編輯聯結和串連步驟。您可以對資料處理工作流程進行必要的調整,確保您的資料正確合併和轉換,而不必重做整個資料流程。

若要編輯資料流程中的聯結或串連步驟,請執行下列動作:

  1. 開啟資料流程。

  2. 選擇您要編輯的聯結或串連節點旁的加號圖示 ()。

  3. 從內容功能表選擇 Edit (編輯)

  4. 側邊面板隨即開啟,您可以在其中編輯聯結或串連的詳細資訊。修改您的步驟欄位,例如聯結類型。若要切換資料節點並選取不同的節點來加入或串連,請選擇節點旁的刪除圖示,然後在資料流程檢視中,選取您要包含在轉換中的新節點。

    注意

    在編輯過程中移出節點時,您只能選取聯結或串連操作之前發生的步驟。您可以交換左節點或右節點,但一次只能交換一個節點。此外,您無法選取來源節點做為取代。

  5. 選擇預覽以檢視合併操作的結果。

  6. 選擇 Update (更新) 以儲存您的設定。

您的資料流程現在應更新。

編輯或取代資料來源步驟

您可能需要對資料來源或資料集進行變更,而不刪除套用至原始資料的轉換和資料流程步驟。在 Data Wrangler 中,您可以編輯或取代資料來源組態,同時保留資料流程的步驟。編輯資料來源時,您可以變更匯入設定,例如取樣大小或方法,以及任何進階設定。您也可以新增更多具有相同結構描述的檔案,或者對於查詢型資料來源,例如 Amazon Athena,您可以編輯查詢。取代資料來源時,您可以選擇不同的資料集,或甚至從不同的資料來源匯入資料,只要新資料的結構描述符合原始資料。

若要編輯資料來源組態,請執行下列動作:

  1. 在 Canvas 應用程式中,前往 Data Wrangler 頁面。

  2. 選擇您的資料流程以檢視。

  3. 在顯示資料流程步驟的資料流程索引標籤中,尋找您要編輯的來源節點。

  4. 選擇來源節點旁的省略號圖示。

  5. 從內容功能表選擇 Edit (編輯)

  6. 對於 Amazon S3 資料來源和本機上傳,您可以選擇選取或上傳與原始資料具有相同結構描述的更多檔案。對於 Amazon Athena 等查詢型資料來源,您可以移除和選取視覺化查詢建置器中的不同資料表,也可以直接編輯 SQL 查詢。完成後,請選擇 Next (下一步)

  7. 對於匯入設定,進行任何所需的變更。

  8. 完成後,請選擇儲存變更

您的資料來源現在應更新。

若要取代資料來源,請執行下列動作:

  1. 在 Canvas 應用程式中,前往 Data Wrangler 頁面。

  2. 選擇您的資料流程以檢視。

  3. 在顯示資料流程步驟的資料流程索引標籤中,尋找您要編輯的來源節點。

  4. 選擇來源節點旁的省略圖示。

  5. 從內容功能表中,選擇取代

  6. 完成建立資料流程體驗,以選取另一個資料來源和資料。

  7. 當您選取資料並準備好更新來源節點時,請選擇儲存

您現在應該會在資料流程中看到來源節點已更新。