疑難排解 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

疑難排解

如果使用 Amazon SageMaker Data Wrangler 時發生問題,建議您執行下列動作:

  • 如果出現錯誤訊息,則請閱讀該訊息,並在可行的狀況下解析訊息內報告的問題。

  • 請確定 Studio Classic 使用者IAM的角色具有執行動作所需的許可。如需詳細資訊,請參閱安全與許可

  • 如果您嘗試從 Amazon Redshift 或 Athena AWS 等其他服務匯入時發生問題,請確定您已設定必要的許可和資源來執行資料匯入。如需詳細資訊,請參閱匯入

  • 如果您仍然遇到問題,請選擇螢幕頂部右方的獲取幫助以聯繫 Data Wrangler 團隊。如需更多資訊,請參閱下列影像。

    Data Wrangler 主控台中 Data Wrangler 說明表單的位置。
    Data Wrangler 主控台中的 Data Wrangler 說明表單。

作為最後的手段,您可以嘗試重新啟動 Data Wrangler 正在執行的核心。

  1. 儲存並結束您要重新啟動核心的 .flow 檔案。

  2. 選取正在執行的終端機和核心圖示,如下列影像所示。

    主控台中執行中的終端機和核心圖示的位置。
  3. 選取您要終止核心之 .flow 檔案右側的停止圖示,如下列影像所示。

    主控台中停止圖示的位置。
  4. 重新整理瀏覽器。

  5. 重新開啟您之前使用的 .flow 檔案。

對 Amazon 的問題進行故障診斷 EMR

使用下列資訊來協助您疑難排解使用 Amazon 時可能發生的錯誤EMR。

  • 連線失敗 – 如果連線失敗並顯示下列訊息 The IP address of the EMR cluster isn't private error message,您的 Amazon EMR叢集可能尚未在私有子網路中啟動。作為安全最佳實務,Data Wrangler 僅支援連線至私有 Amazon EMR叢集。選擇您啟動EMR叢集的私有EC2子網路。

  • 連線中斷和逾時 — 此問題很可能是因為網路連線問題所致。開始連線至叢集之後,螢幕不會重新整理。大約 2 分鐘後,您可能會看到以下錯誤 JdbcAddConnectionError: An error occurred when trying to connect to presto: xxx: Connect to xxx failed: Connection timed out (Connection timed out) will display on top of the screen.

    錯誤可能有兩個根本原因:

    • Amazon EMR和 Amazon SageMaker Studio Classic 位於不同的 中VPCs。建議您在相同的 中同時啟動 Amazon EMR和 Studio ClassicVPC。您也可以使用VPC對等。如需詳細資訊,請參閱什麼是VPC互連?

    • Amazon EMR主要安全群組缺少用於 Presto 的連接埠上 Amazon SageMaker Studio Classic 安全群組的傳入流量規則。若要解決此問題,請允許連接埠 8889 上的傳入流量。

  • 連線失敗,由於連線類型設定錯誤 — 您可能會看到以下錯誤訊息: Data Wrangler couldn't create a connection to {connection_source} successfully. Try connecting to {connection_source} again. For more information, see Troubleshoot. If you’re still experiencing issues, contact support.

    檢查身分驗證方法。您在 Data Wrangler 中指定的驗證方法,應符合您在叢集上使用的驗證方法。

  • 您沒有LDAP身分驗證的HDFS許可 – 使用下列指引來解決使用 Linux 憑證 設定HDFS許可的問題。您可以使用下列命令來登入叢集:

    hdfs dfs -mkdir /user/USERNAME hdfs dfs -chown USERNAME:USERNAME /user/USERNAME
  • LDAP 驗證遺失連線金鑰錯誤 – 您可能會看到下列錯誤訊息:Data Wrangler couldn't connect to EMR hive successfully. JDBC connection is missing required connection key(s): PWD

    若要LDAP進行身分驗證,您必須指定使用者名稱和密碼。JDBC URL 存放在 Secrets Manager 中的 缺少屬性 PWD

  • 當您對LDAP組態進行疑難排解時:我們建議您確保LDAP身分驗證器 (LDAP 伺服器) 已正確設定為連線至 Amazon EMR叢集。使用 ldapwhoami 命令來協助您解決組態問題。以下是您可以執行的範例命令:

    • 對於 LDAPS – ldapwhoami -x -H ldaps://ldap-server

    • 對於 LDAP – ldapwhoami -x -H ldap://ldap-server

    如果您已成功已設定驗證器,則命令之一應該傳回 Anonymous

Salesforce 的 故障診斷

生命週期組態錯誤

當您的使用者第一次開啟 Studio Classic 時,他們可能會收到錯誤,表示生命週期組態有問題。使用 Amazon CloudWatch 存取生命週期組態指令碼編寫的日誌。如需生命週期組態偵錯的更多相關資訊,請參閱生命週期組態偵錯

如果您無法對錯誤進行偵錯,您可以手動建立組態檔案。您必須在每次刪除或重新啟動 Jupyter 伺服器時建立檔案。使用下列程序手動建立檔案。

建立組態檔案
  1. 導覽至 Studio Classic。

  2. 選擇檔案新增終端機

  3. 建立 .sfgenie_identity_provider_oauth_config

  4. 在文字編輯器中開啟該檔案。

  5. 將包含 Secrets Manager 秘密 Amazon Resource Name (ARN) 的JSON物件新增至 檔案。您可以透過以下範本來建立物件。

    { "secret_arn": "example-secret-ARN" }
  6. 儲存您對該檔案所做的變更。

無法從 Data Wrangler 流程存取 Salesforce 資料雲

當您的使用者從 Data Wrangler 流程中選擇 Salesforce 資料雲 之後,他們可能會收到錯誤訊息,指出尚未符合設定連線的先決條件。可能是以下的錯誤造成:

  • Secrets Manager 中的 Salesforce 機密尚未建立。

  • 已建立 Secrets Manager 中的 Salesforce 機密,但缺少 Salesforce 標籤。

  • Secrets Manager 中的 Salesforce 秘密已在錯誤的 中建立 AWS 區域。例如,您的使用者將無法存取 ca-central-1 中的 Salesforce 資料雲,因為您已在 us-east-1 中建立機密。您可以將機密複寫到 ca-central-1 中,或使用相同憑證在 ca-central-1 中建立新的機密。如需複製秘密的資訊,請參閱將 AWS Secrets Manager 秘密複製到其他 AWS 區域

  • 您的使用者用來存取 Amazon SageMaker Studio Classic 的政策缺少 的許可 AWS Secrets Manager

  • 您在生命週期組態中指定的JSON物件ARN的 Secrets Manager 中存在錯字。

  • Secrets Manager 秘密中包含 Salesforce OAuth組態的錯字

空白頁顯示 redirect_uri_mismatch

使用者選擇儲存並連線後,他們可能會被重新導向至顯示 redirect_uri_mismatch 的頁面。您在 Salesforce Connected App 設定中註冊URI的回呼遺失或不正確。

使用下列項目URL來檢查 Studio Classic URL 是否已在 Salesforce 組織的 Connected App 設定中正確註冊:https://EXAMPLE_SALESFORCE_ORG/lightning/setup/NavigationMenus/home/。如需使用連線應用程式設定的詳細資訊,請瀏覽至下列 URL:https://EXAMPLE_SALESFORCE_ORG/lightning/setup/NavigationMenus/home/

注意

在 URI Salesforce 系統中傳播 大約需要十分鐘。

共用空間

共用空間目前無法與 Salesforce 資料雲端整合搭配使用。您可以刪除您打算使用的 Amazon SageMaker 網域中的共用空間,也可以使用沒有共用空間設定的另一個網域。

OAuth 重新導向錯誤

您的使用者應該能夠在選擇連線之後,從 Salesforce 資料雲匯入其資料。如果他們遇到錯誤,我們建議他們執行以下操作:

  • 告訴他們保持耐心:當他們重新引導回 Amazon SageMaker Studio Classic 時,可能需要一分鐘的時間來完成身分驗證程序。當他們被重新導向時,我們建議告訴他們避免與瀏覽器互動。例如,不應該關閉瀏覽器標籤頁、切換至其他標籤頁,或與 Data Wrangler 流程互動。與瀏覽器互動可能會移除連線至資料雲必要的授權碼。

  • 讓您的使用者重新連接至資料雲 — 有一些暫時性問題可能會導致與 Salesforce 資料雲的連線失敗。讓您的使用者建立新的 Data Wrangler 流程,並嘗試再次連線至 Salesforce 資料雲。

  • 確保您的使用者使用 Amazon SageMaker Studio Classic – 在多個索引標籤中開啟 Studio Classic 關閉所有其他索引標籤,可能會導致 Salesforce Data Cloud 連線失敗。確保您的使用者只有一個 Studio Classic 索引標籤開啟。

  • 同時存取 Studio Classic 的多個使用者 – 一次只能有一個使用者存取 Amazon SageMaker 網域。如果多個使用者存取相同的網域,則使用者嘗試建立的 Salesforce Data Cloud 連線可能會失敗。

更新 Data Wrangler 和 Studio Classic 也可能修正其錯誤。如需有關更新 Data Wrangler 資訊,請參閱更新 Data Wrangler。如需更新 Studio Classic 的相關資訊,請參閱 關閉並更新 SageMaker Studio Classic

如果上述疑難排解步驟都無效,您可能會從 Salesforce 找到錯誤訊息,並在 Studio Classic 中嵌入對應的描述URL。以下是您可能會看見的訊息範例:error=invalid_client_id&error_description=client%20identifier%20invalid

您可以查看 中的錯誤訊息,URL並嘗試解決它顯示的問題。如果錯誤訊息或描述不清楚,建議您搜尋 Salesforce 知識庫。如果搜尋知識庫沒有用,您可以聯絡 Salesforce 服務台尋求更多協助。

Data Wrangler 需要很長時間才能載入

當您的使用者從 Salesforce 資料雲端重新導向回 Data Wrangler 時,可能會遇到較長的載入時間。

如果這是使用者第一次使用 Data Wrangler,或者他們已刪除核心,則佈建新的 Amazon EC2執行個體以使用 Data Wrangler,可能需要約 5 分鐘的時間。

如果這不是用戶第一次使用 Data Wrangler,並且他們尚未刪除核心,您可以要求他們重新整理頁面或盡可能關閉多餘的瀏覽器標籤頁。

如果上述干預措施都沒用,請讓他們設定與 Salesforce 資料雲的新連線。

使用者無法匯出資料並出現 Invalid batch Id 錯誤

當您的使用者匯出轉換至其 Salesforce 資料時,Data Wrangler 在後端上使用的 SageMaker 處理任務可能會失敗。Salesforce 資料雲可能暫時無法使用,或可能有快取問題。

若要解決此問題,建議您讓使用者返回匯入資料的步驟,並變更他們要查詢的資料欄排序。例如,他們可以變更以下查詢:

SELECT col_A, col_B FROM table

成為下列查詢:

SELECT col_B, col_A FROM table

變更資料欄的排序,並確定後續進行的轉換仍然有效之後,就可以再次開始匯出資料。

使用者無法匯出非常大的資料集

如果您的使用者從 Salesforce 資料雲匯入非常大的資料集,他們可能無法匯出他們所做的轉換。大型資料集可能有太多列,或是因為複雜的查詢所產生。

建議您的使用者採取以下動作:

  • 簡化查詢 SQL

  • 將他們的資料取樣

以下是他們可以用來簡化查詢的一些策略:

  • 指定資料欄名稱,而不是使用 * 運算子

  • 查找他們想要匯入的資料的子集,而不是使用較大的子集

  • 最小化非常大的資料集之間的連接

他們可以使用取樣來減少資料集中的資料列數目。有關採樣方法的資訊,您的使用者可以參考 抽樣

由於重新整理權杖無效,使用者無法匯出資料

Data Wrangler 使用JDBC驅動程式與 Salesforce Data Cloud 整合。身分驗證方法是 OAuth。對於 OAuth,重新整理權杖和存取權杖是兩種不同的資料,用於授權存取 Salesforce Data Cloud 中的資源。

存取權杖或核心權杖可讓您直接透過 Data Wrangler 存取 Salesforce 資料並執行查詢。它的壽命很短,並且設計為很快就會過期。為了維護對 Salesforce 資料的存取權,Data Wrangler 使用重新整理權杖從 Salesforce 取得新的存取權杖。

您可能將重新整理設定成太快過期,以致無法為使用者取得新的存取權杖。您可能必須重新檢視重新整理權杖的政策,以確保它可以用於需要花費很長時間才能為使用者執行的查詢。如需設定重新整理權杖政策的相關資訊,請參閱https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ConnectedApplication/home/

查詢失敗或資料表未載入

Salesforce 遇到服務中斷的情況。即使您已正確設定所有項目,您的使用者也可能有一段時間無法匯入其資料。

服務中斷可能出於維護原因所導致。我們建議您在第二天檢視問題是否已解決。

如果您遇到服務中斷一天以上的問題,建議您聯絡 Salesforce 的服務台以取得進一步協助。如需聯絡 Salesforce 的相關資訊,請參閱您希望以何種方式聯絡 Salesforce

OAUTH_APP_BLOCKED Studio Classic 重新導向期間

當您的使用者重新導向回 Amazon SageMaker Studio Classic 時,他們可能會注意到 error=OAUTH_APP_BLOCKED中的查詢參數URL。他們可能遇到了一個暫時的問題,應該在一天之內會自行解決。

也有可能是您已封鎖他們存取連線應用程式。如需解決此問題的資訊,請參閱https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ConnectedApplication/home/

OAUTH_APP_DENIED Studio Classic 重新導向期間

當您的使用者重新導向回 Amazon SageMaker Studio Classic 時,他們可能會注意到 error=OAUTH_APP_ACCESS_DENIED中的查詢參數URL。您尚未授予他們的設定檔類型存取許可,以存取與 Data Wrangler 相關聯的 Connected App

若要解決他們的存取問題,請導覽至 https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ManageUsers/home/ 並檢查使用者是否已被指派正確的設定檔。