疑難排解 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

疑難排解

如果使用 Amazon SageMaker 資料牧馬人時出現問題,建議您執行下列動作:

  • 如果出現錯誤訊息,則請閱讀該訊息,並在可行的狀況下解析訊息內報告的問題。

  • 確保您的 Studio 經典版用戶的IAM角色具有執行操作所需的權限。如需詳細資訊,請參閱安全與許可

  • 如果您嘗試從另一個匯入時發生問題 AWS 服務 (例如 Amazon Redshift 或 Athena) 請確定您已設定必要的許可和資源來執行資料匯入。如需詳細資訊,請參閱匯入

  • 如果您仍然遇到問題,請選擇螢幕頂部右方的獲取幫助以聯繫 Data Wrangler 團隊。如需更多資訊,請參閱下列影像。

    資料牧馬人說明表單在資料牧馬人主控台中的位置。
    資料牧馬人主控台中的資料牧馬人說明表單。

作為最後的手段,您可以嘗試重新啟動 Data Wrangler 正在執行的核心。

  1. 儲存並結束您要重新啟動核心的 .flow 檔案。

  2. 選取正在執行的終端機和核心圖示,如下列影像所示。

    主控台中「執行中終端機和核心」圖示的位置。
  3. 選取您要終止核心之 .flow 檔案右側的停止圖示,如下列影像所示。

    主控台中「停止」圖示的位置。
  4. 重新整理瀏覽器。

  5. 重新開啟您之前使用的 .flow 檔案。

Amazon 問題疑難排解 EMR

使用下列資訊協助您疑難排解使用 Amazon 時可能出現的錯誤EMR。

  • 連線失敗 — 如果連線失敗並顯示下列訊息The IP address of the EMR cluster isn't private error message,表示您的 Amazon EMR 叢集可能尚未在私有子網路中啟動。作為安全性最佳實務,資料牧馬人僅支援連接到私有 Amazon EMR 叢集。選擇您啟動EMR叢集的私有EC2子網路。

  • 連線中斷和逾時 — 此問題很可能是因為網路連線問題所致。開始連線至叢集之後,螢幕不會重新整理。大約 2 分鐘後,您可能會看到以下錯誤 JdbcAddConnectionError: An error occurred when trying to connect to presto: xxx: Connect to xxx failed: Connection timed out (Connection timed out) will display on top of the screen.

    錯誤可能有兩個根本原因:

    • Amazon EMR 和 Amazon SageMaker 工作室經典有所不同VPCs。我們建議同時推出 Amazon EMR 和工作室經典在同一VPC。您也可以使用VPC對等互連。如需詳細資訊,請參閱什麼是對VPC等互連? 。

    • Amazon EMR 主安全組缺少用於普雷斯托的端口上 Amazon SageMaker 工作室經典安全組的入站流量規則。若要解決此問題,請允許連接埠 8889 上的傳入流量。

  • 連線失敗,由於連線類型設定錯誤 — 您可能會看到以下錯誤訊息: Data Wrangler couldn't create a connection to {connection_source} successfully. Try connecting to {connection_source} again. For more information, see Troubleshoot. If you’re still experiencing issues, contact support.

    檢查身分驗證方法。您在 Data Wrangler 中指定的驗證方法,應符合您在叢集上使用的驗證方法。

  • 您沒有LDAP驗證HDFS權限 — 請使用下列指引來解決使用 Linux 認證設定HDFS權限的問題。您可以使用下列命令來登入叢集:

    hdfs dfs -mkdir /user/USERNAME hdfs dfs -chown USERNAME:USERNAME /user/USERNAME
  • LDAP驗證遺失連線金鑰錯誤 — 您可能會看到下列錯誤訊息:Data Wrangler couldn't connect to EMR hive successfully. JDBC connection is missing required connection key(s): PWD

    若要進行LDAP驗證,您必須同時指定使用者名稱和密碼。存JDBCURL儲在 Secrets Manager 中缺少屬性PWD

  • 疑難排解LDAP組態時:建議您確定LDAP驗證器 (LDAP伺服器) 已正確設定為連線至 Amazon EMR 叢集。使用 ldapwhoami 命令來協助您解決組態問題。以下是您可以執行的範例命令:

    • 對於 LDAPS — ldapwhoami -x -H ldaps://ldap-server

    • 對於 LDAP — ldapwhoami -x -H ldap://ldap-server

    如果您已成功已設定驗證器,則命令之一應該傳回 Anonymous

Salesforce 的 故障診斷

生命週期組態錯誤

當您的用戶第一次打開 Studio Classic 時,他們可能會收到一個錯誤,指出他們的生命週期配置有問題。使用 Amazon 存 CloudWatch 取生命週期組態指令碼撰寫的日誌。如需生命週期組態偵錯的更多相關資訊,請參閱生命週期組態偵錯

如果您無法對錯誤進行偵錯,您可以手動建立組態檔案。您必須在每次刪除或重新啟動 Jupyter 伺服器時建立檔案。使用下列程序手動建立檔案。

建立組態檔案
  1. 瀏覽至「經典工作室」。

  2. 選擇檔案新增終端機

  3. 建立 .sfgenie_identity_provider_oauth_config

  4. 在文字編輯器中開啟該檔案。

  5. 將包JSON含秘 Secrets Manager 碼的 Amazon 資源名稱 (ARN) 的物件新增至檔案。您可以透過以下範本來建立物件。

    { "secret_arn": "example-secret-ARN" }
  6. 儲存您對該檔案所做的變更。

無法從 Data Wrangler 流程存取 Salesforce 資料雲

當您的使用者從 Data Wrangler 流程中選擇 Salesforce 資料雲 之後,他們可能會收到錯誤訊息,指出尚未符合設定連線的先決條件。可能是以下的錯誤造成:

  • Secrets Manager 中的 Salesforce 機密尚未建立。

  • 已建立 Secrets Manager 中的 Salesforce 機密,但缺少 Salesforce 標籤。

  • 秘密管理器中的 Salesforce 秘密創建了錯誤 AWS 區域。 例如,您的使用者將無法存取中的 Salesforce 資料雲端,ca-central-1因為您已在中建立密碼。us-east-1您可以將機密複寫到 ca-central-1 中,或使用相同憑證在 ca-central-1 中建立新的機密。如需複製密碼的相關資訊,請參閱複製 AWS Secrets Manager 其他秘密 AWS 區域.

  • 您的使用者用來存取 Amazon SageMaker 工作室傳統版的政策缺少的許可 AWS Secrets Manager

  • 在您透過生命週期組態指定ARN的JSON物件的 Secrets Manager 中有一個錯字。

  • Secrets Manager 員密碼中有一個錯字,其中包含您的 Salesforce OAuth 設定

空白頁顯示 redirect_uri_mismatch

使用者選擇儲存並連線後,他們可能會被重新導向至顯示 redirect_uri_mismatch 的頁面。您在 Salesforce 連線的應用程式設定中註冊的回呼URI遺失或不正確。

請使用下列URL步驟來檢查您的 Studio 傳統版URL是否已在 Salesforce 組織的連線應用程式設定中正確註冊:https://EXAMPLE_SALESFORCE_ORG/lightning/setup/NavigationMenus/home/如需有關使用已連線應用程式設定的詳細資訊,請瀏覽至下列各項URL:https://EXAMPLE_SALESFORCE_ORG/lightning/setup/NavigationMenus/home/

注意

大約需要十分鐘的時間才能URI在 Salesforce 的系統中傳播。

共用空間

共用空間目前無法與 Salesforce 資料雲端整合搭配使用。您可以刪除想要使用的 Amazon SageMaker 網域中的共用空間,也可以使用未設定共用空間的其他網域。

OAuth重定向錯誤

您的使用者應該能夠在選擇連線之後,從 Salesforce 資料雲匯入其資料。如果他們遇到錯誤,我們建議他們執行以下操作:

  • 告訴他們耐心等待 — 當他們重新導向回 Amazon SageMaker Studio 經典版時,最多可能需要一分鐘的時間才能完成身份驗證程序。當他們被重新導向時,我們建議告訴他們避免與瀏覽器互動。例如,不應該關閉瀏覽器標籤頁、切換至其他標籤頁,或與 Data Wrangler 流程互動。與瀏覽器互動可能會移除連線至資料雲必要的授權碼。

  • 讓您的使用者重新連接至資料雲 — 有一些暫時性問題可能會導致與 Salesforce 資料雲的連線失敗。讓您的使用者建立新的 Data Wrangler 流程,並嘗試再次連線至 Salesforce 資料雲。

  • 確保您的使用者透過 Amazon SageMaker Studio 傳統版關閉所有其他索引標籤 — 在多個索引標籤中開啟工作室傳統版可能會導致 Salesforce 資料雲端連線失敗。確保您的用戶只打開一個工作室經典選項卡。

  • 多個使用者同時存取工作室經典版 — 一次只能有一個使用者存取一個 Amazon SageMaker 網域。如果有多個使用者存取同一個網域,則使用者嘗試建立至 Salesforce 資料雲端的連線可能會失敗。

更新數據牧馬人和工作室經典版也可能會修復他們的錯誤。如需有關更新 Data Wrangler 資訊,請參閱更新 Data Wrangler。如需更新工作室傳統版的資訊,請參閱關閉並更新 SageMaker 工作室經典版

如果上述疑難排解步驟都不起作用,您可能會發現 Salesforce 發出的錯誤訊息,其中包含 Studio 傳統版URL中內嵌的對應說明。以下是您可能會看見的訊息範例:error=invalid_client_id&error_description=client%20identifier%20invalid

您可以查看中的錯誤訊息,URL並嘗試解決它所呈現的問題。如果錯誤訊息或描述不清楚,建議您搜尋 Salesforce 知識庫。如果搜尋知識庫沒有用,您可以聯絡 Salesforce 服務台尋求更多協助。

Data Wrangler 需要很長時間才能載入

當您的使用者從 Salesforce 資料雲端重新導向回 Data Wrangler 時,可能會遇到較長的載入時間。

如果這是使用者第一次使用 Data Wrangler,或是刪除了核心,則佈建新 Amazon EC2 執行個體以使用資料 Wrangler 可能需要大約 5 分鐘的時間。

如果這不是用戶第一次使用 Data Wrangler,並且他們尚未刪除核心,您可以要求他們重新整理頁面或盡可能關閉多餘的瀏覽器標籤頁。

如果上述干預措施都沒用,請讓他們設定與 Salesforce 資料雲的新連線。

使用者無法匯出資料並出現 Invalid batch Id 錯誤

當您的使用者匯出他們對其 Salesforce 資料進行的轉換時,資料牧馬人在後端使用的 SageMaker 處理工作可能會失敗。Salesforce 資料雲可能暫時無法使用,或可能有快取問題。

若要解決此問題,建議您讓使用者返回匯入資料的步驟,並變更他們要查詢的資料欄排序。例如,他們可以變更以下查詢:

SELECT col_A, col_B FROM table

成為下列查詢:

SELECT col_B, col_A FROM table

變更資料欄的排序,並確定後續進行的轉換仍然有效之後,就可以再次開始匯出資料。

使用者無法匯出非常大的資料集

如果您的使用者從 Salesforce 資料雲匯入非常大的資料集,他們可能無法匯出他們所做的轉換。大型資料集可能有太多列,或是因為複雜的查詢所產生。

建議您的使用者採取以下動作:

  • 簡化他們的查詢 SQL

  • 將他們的資料取樣

以下是他們可以用來簡化查詢的一些策略:

  • 指定資料欄名稱,而不是使用 * 運算子

  • 查找他們想要匯入的資料的子集,而不是使用較大的子集

  • 最小化非常大的資料集之間的連接

他們可以使用取樣來減少資料集中的資料列數目。有關採樣方法的資訊,您的使用者可以參考 抽樣

由於重新整理權杖無效,使用者無法匯出資料

資料牧馬人使用JDBC驅動程式與 Salesforce 資料雲端整合。驗證的方法是OAuth。對於OAuth,重新整理權杖和存取權杖是兩個不同的資料片段,用來授權存取 Salesforce 資料雲端中的資源。

存取權杖或核心權杖可讓您直接透過 Data Wrangler 存取 Salesforce 資料並執行查詢。它的壽命很短,並且設計為很快就會過期。為了維護對 Salesforce 資料的存取權,Data Wrangler 使用重新整理權杖從 Salesforce 取得新的存取權杖。

您可能將重新整理設定成太快過期,以致無法為使用者取得新的存取權杖。您可能必須重新檢視重新整理權杖的政策,以確保它可以用於需要花費很長時間才能為使用者執行的查詢。如需設定重新整理權杖政策的相關資訊,請參閱https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ConnectedApplication/home/

查詢失敗或資料表未載入

Salesforce 遇到服務中斷的情況。即使您已正確設定所有項目,您的使用者也可能有一段時間無法匯入其資料。

服務中斷可能出於維護原因所導致。我們建議您在第二天檢視問題是否已解決。

如果您遇到服務中斷一天以上的問題,建議您聯絡 Salesforce 的服務台以取得進一步協助。如需聯絡 Salesforce 的相關資訊,請參閱您希望以何種方式聯絡 Salesforce

OAUTH_APP_BLOCKED在工作室經典重定向

當您的使用者重新導向回 Amazon SageMaker Studio 經典版時,他們可能會注意error=OAUTH_APP_BLOCKED到URL. 他們可能遇到了一個暫時的問題,應該在一天之內會自行解決。

也有可能是您已封鎖他們存取連線應用程式。如需解決此問題的資訊,請參閱https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ConnectedApplication/home/

OAUTH_APP_DENIED在工作室經典重定向

當您的使用者重新導向回 Amazon SageMaker Studio 經典版時,他們可能會注意error=OAUTH_APP_ACCESS_DENIED到URL. 您尚未授予他們的設定檔類型存取許可,以存取與 Data Wrangler 相關聯的 Connected App

若要解決他們的存取問題,請導覽至 https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ManageUsers/home/ 並檢查使用者是否已被指派正確的設定檔。