本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
疑難排解
如果使用 Amazon SageMaker 資料牧馬人時出現問題,建議您執行下列動作:
作為最後的手段,您可以嘗試重新啟動 Data Wrangler 正在執行的核心。
-
儲存並結束您要重新啟動核心的 .flow 檔案。
-
選取正在執行的終端機和核心圖示,如下列影像所示。
-
選取您要終止核心之 .flow 檔案右側的停止圖示,如下列影像所示。
-
重新整理瀏覽器。
-
重新開啟您之前使用的 .flow 檔案。
Amazon 問題疑難排解 EMR
使用下列資訊協助您疑難排解使用 Amazon 時可能出現的錯誤EMR。
-
連線失敗 — 如果連線失敗並顯示下列訊息
The IP address of the EMR cluster isn't private error message
,表示您的 Amazon EMR 叢集可能尚未在私有子網路中啟動。作為安全性最佳實務,資料牧馬人僅支援連接到私有 Amazon EMR 叢集。選擇您啟動EMR叢集的私有EC2子網路。 -
連線中斷和逾時 — 此問題很可能是因為網路連線問題所致。開始連線至叢集之後,螢幕不會重新整理。大約 2 分鐘後,您可能會看到以下錯誤
JdbcAddConnectionError: An error occurred when trying to connect to presto: xxx: Connect to xxx failed: Connection timed out (Connection timed out) will display on top of the screen.
。錯誤可能有兩個根本原因:
-
Amazon EMR 和 Amazon SageMaker 工作室經典有所不同VPCs。我們建議同時推出 Amazon EMR 和工作室經典在同一VPC。您也可以使用VPC對等互連。如需詳細資訊,請參閱什麼是對VPC等互連? 。
-
Amazon EMR 主安全組缺少用於普雷斯托的端口上 Amazon SageMaker 工作室經典安全組的入站流量規則。若要解決此問題,請允許連接埠 8889 上的傳入流量。
-
-
連線失敗,由於連線類型設定錯誤 — 您可能會看到以下錯誤訊息:
Data Wrangler couldn't create a connection to {connection_source} successfully. Try connecting to {connection_source} again. For more information, see Troubleshoot. If you’re still experiencing issues, contact support.
檢查身分驗證方法。您在 Data Wrangler 中指定的驗證方法,應符合您在叢集上使用的驗證方法。
-
您沒有LDAP驗證HDFS權限 — 請使用下列指引來解決使用 Linux 認證設定HDFS權限的問題。您可以使用下列命令來登入叢集:
hdfs dfs -mkdir /user/USERNAME hdfs dfs -chown USERNAME:USERNAME /user/USERNAME
-
LDAP驗證遺失連線金鑰錯誤 — 您可能會看到下列錯誤訊息:
Data Wrangler couldn't connect to EMR hive successfully. JDBC connection is missing required connection key(s): PWD
。若要進行LDAP驗證,您必須同時指定使用者名稱和密碼。存JDBCURL儲在 Secrets Manager 中缺少屬性
PWD
。 -
疑難排解LDAP組態時:建議您確定LDAP驗證器 (LDAP伺服器) 已正確設定為連線至 Amazon EMR 叢集。使用
ldapwhoami
命令來協助您解決組態問題。以下是您可以執行的範例命令:-
對於 LDAPS —
ldapwhoami -x -H ldaps://ldap-server
-
對於 LDAP —
ldapwhoami -x -H ldap://ldap-server
如果您已成功已設定驗證器,則命令之一應該傳回
Anonymous
。 -
Salesforce 的 故障診斷
生命週期組態錯誤
當您的用戶第一次打開 Studio Classic 時,他們可能會收到一個錯誤,指出他們的生命週期配置有問題。使用 Amazon 存 CloudWatch 取生命週期組態指令碼撰寫的日誌。如需生命週期組態偵錯的更多相關資訊,請參閱生命週期組態偵錯。
如果您無法對錯誤進行偵錯,您可以手動建立組態檔案。您必須在每次刪除或重新啟動 Jupyter 伺服器時建立檔案。使用下列程序手動建立檔案。
建立組態檔案
-
瀏覽至「經典工作室」。
-
選擇檔案、新增、終端機。
-
建立
.sfgenie_identity_provider_oauth_config
。 -
在文字編輯器中開啟該檔案。
-
將包JSON含秘 Secrets Manager 碼的 Amazon 資源名稱 (ARN) 的物件新增至檔案。您可以透過以下範本來建立物件。
{ "secret_arn": "
example-secret-ARN
" } -
儲存您對該檔案所做的變更。
無法從 Data Wrangler 流程存取 Salesforce 資料雲
當您的使用者從 Data Wrangler 流程中選擇 Salesforce 資料雲 之後,他們可能會收到錯誤訊息,指出尚未符合設定連線的先決條件。可能是以下的錯誤造成:
-
Secrets Manager 中的 Salesforce 機密尚未建立。
-
已建立 Secrets Manager 中的 Salesforce 機密,但缺少 Salesforce 標籤。
-
秘密管理器中的 Salesforce 秘密創建了錯誤 AWS 區域。 例如,您的使用者將無法存取中的 Salesforce 資料雲端,
ca-central-1
因為您已在中建立密碼。us-east-1
您可以將機密複寫到ca-central-1
中,或使用相同憑證在ca-central-1
中建立新的機密。如需複製密碼的相關資訊,請參閱複製 AWS Secrets Manager 其他秘密 AWS 區域. -
您的使用者用來存取 Amazon SageMaker 工作室傳統版的政策缺少的許可 AWS Secrets Manager
-
在您透過生命週期組態指定ARN的JSON物件的 Secrets Manager 中有一個錯字。
-
Secrets Manager 員密碼中有一個錯字,其中包含您的 Salesforce OAuth 設定
空白頁顯示 redirect_uri_mismatch
使用者選擇儲存並連線後,他們可能會被重新導向至顯示 redirect_uri_mismatch
的頁面。您在 Salesforce 連線的應用程式設定中註冊的回呼URI遺失或不正確。
請使用下列URL步驟來檢查您的 Studio 傳統版URL是否已在 Salesforce 組織的連線應用程式設定中正確註冊:https://EXAMPLE_SALESFORCE_ORG/lightning/setup/NavigationMenus/home/
如需有關使用已連線應用程式設定的詳細資訊,請瀏覽至下列各項URL:https://EXAMPLE_SALESFORCE_ORG/lightning/setup/NavigationMenus/home/
。
注意
大約需要十分鐘的時間才能URI在 Salesforce 的系統中傳播。
共用空間
共用空間目前無法與 Salesforce 資料雲端整合搭配使用。您可以刪除想要使用的 Amazon SageMaker 網域中的共用空間,也可以使用未設定共用空間的其他網域。
OAuth重定向錯誤
您的使用者應該能夠在選擇連線之後,從 Salesforce 資料雲匯入其資料。如果他們遇到錯誤,我們建議他們執行以下操作:
-
告訴他們耐心等待 — 當他們重新導向回 Amazon SageMaker Studio 經典版時,最多可能需要一分鐘的時間才能完成身份驗證程序。當他們被重新導向時,我們建議告訴他們避免與瀏覽器互動。例如,不應該關閉瀏覽器標籤頁、切換至其他標籤頁,或與 Data Wrangler 流程互動。與瀏覽器互動可能會移除連線至資料雲必要的授權碼。
-
讓您的使用者重新連接至資料雲 — 有一些暫時性問題可能會導致與 Salesforce 資料雲的連線失敗。讓您的使用者建立新的 Data Wrangler 流程,並嘗試再次連線至 Salesforce 資料雲。
-
確保您的使用者透過 Amazon SageMaker Studio 傳統版關閉所有其他索引標籤 — 在多個索引標籤中開啟工作室傳統版可能會導致 Salesforce 資料雲端連線失敗。確保您的用戶只打開一個工作室經典選項卡。
-
多個使用者同時存取工作室經典版 — 一次只能有一個使用者存取一個 Amazon SageMaker 網域。如果有多個使用者存取同一個網域,則使用者嘗試建立至 Salesforce 資料雲端的連線可能會失敗。
更新數據牧馬人和工作室經典版也可能會修復他們的錯誤。如需有關更新 Data Wrangler 資訊,請參閱更新 Data Wrangler。如需更新工作室傳統版的資訊,請參閱關閉並更新 SageMaker 工作室經典版。
如果上述疑難排解步驟都不起作用,您可能會發現 Salesforce 發出的錯誤訊息,其中包含 Studio 傳統版URL中內嵌的對應說明。以下是您可能會看見的訊息範例:error=invalid_client_id&error_description=client%20identifier%20invalid
。
您可以查看中的錯誤訊息,URL並嘗試解決它所呈現的問題。如果錯誤訊息或描述不清楚,建議您搜尋 Salesforce 知識庫。如果搜尋知識庫沒有用,您可以聯絡 Salesforce 服務台尋求更多協助。
Data Wrangler 需要很長時間才能載入
當您的使用者從 Salesforce 資料雲端重新導向回 Data Wrangler 時,可能會遇到較長的載入時間。
如果這是使用者第一次使用 Data Wrangler,或是刪除了核心,則佈建新 Amazon EC2 執行個體以使用資料 Wrangler 可能需要大約 5 分鐘的時間。
如果這不是用戶第一次使用 Data Wrangler,並且他們尚未刪除核心,您可以要求他們重新整理頁面或盡可能關閉多餘的瀏覽器標籤頁。
如果上述干預措施都沒用,請讓他們設定與 Salesforce 資料雲的新連線。
使用者無法匯出資料並出現 Invalid batch Id
錯誤
當您的使用者匯出他們對其 Salesforce 資料進行的轉換時,資料牧馬人在後端使用的 SageMaker 處理工作可能會失敗。Salesforce 資料雲可能暫時無法使用,或可能有快取問題。
若要解決此問題,建議您讓使用者返回匯入資料的步驟,並變更他們要查詢的資料欄排序。例如,他們可以變更以下查詢:
SELECT col_A, col_B FROM table
成為下列查詢:
SELECT col_B, col_A FROM table
變更資料欄的排序,並確定後續進行的轉換仍然有效之後,就可以再次開始匯出資料。
使用者無法匯出非常大的資料集
如果您的使用者從 Salesforce 資料雲匯入非常大的資料集,他們可能無法匯出他們所做的轉換。大型資料集可能有太多列,或是因為複雜的查詢所產生。
建議您的使用者採取以下動作:
-
簡化他們的查詢 SQL
-
將他們的資料取樣
以下是他們可以用來簡化查詢的一些策略:
-
指定資料欄名稱,而不是使用
*
運算子 -
查找他們想要匯入的資料的子集,而不是使用較大的子集
-
最小化非常大的資料集之間的連接
他們可以使用取樣來減少資料集中的資料列數目。有關採樣方法的資訊,您的使用者可以參考 抽樣。
由於重新整理權杖無效,使用者無法匯出資料
資料牧馬人使用JDBC驅動程式與 Salesforce 資料雲端整合。驗證的方法是OAuth。對於OAuth,重新整理權杖和存取權杖是兩個不同的資料片段,用來授權存取 Salesforce 資料雲端中的資源。
存取權杖或核心權杖可讓您直接透過 Data Wrangler 存取 Salesforce 資料並執行查詢。它的壽命很短,並且設計為很快就會過期。為了維護對 Salesforce 資料的存取權,Data Wrangler 使用重新整理權杖從 Salesforce 取得新的存取權杖。
您可能將重新整理設定成太快過期,以致無法為使用者取得新的存取權杖。您可能必須重新檢視重新整理權杖的政策,以確保它可以用於需要花費很長時間才能為使用者執行的查詢。如需設定重新整理權杖政策的相關資訊,請參閱https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ConnectedApplication/home/
。
查詢失敗或資料表未載入
Salesforce 遇到服務中斷的情況。即使您已正確設定所有項目,您的使用者也可能有一段時間無法匯入其資料。
服務中斷可能出於維護原因所導致。我們建議您在第二天檢視問題是否已解決。
如果您遇到服務中斷一天以上的問題,建議您聯絡 Salesforce 的服務台以取得進一步協助。如需聯絡 Salesforce 的相關資訊,請參閱您希望以何種方式聯絡 Salesforce
OAUTH_APP_BLOCKED
在工作室經典重定向
當您的使用者重新導向回 Amazon SageMaker Studio 經典版時,他們可能會注意error=OAUTH_APP_BLOCKED
到URL. 他們可能遇到了一個暫時的問題,應該在一天之內會自行解決。
也有可能是您已封鎖他們存取連線應用程式。如需解決此問題的資訊,請參閱https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ConnectedApplication/home/
。
OAUTH_APP_DENIED
在工作室經典重定向
當您的使用者重新導向回 Amazon SageMaker Studio 經典版時,他們可能會注意error=OAUTH_APP_ACCESS_DENIED
到URL. 您尚未授予他們的設定檔類型存取許可,以存取與 Data Wrangler 相關聯的 Connected App
。
若要解決他們的存取問題,請導覽至 https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ManageUsers/home/
並檢查使用者是否已被指派正確的設定檔。