本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
當 AWS Glue 爬蟲程式或任務使用連線屬性來存取資料存放區時,可能會在您嘗試連線時發生錯誤。當 AWS Glue 在您指定的虛擬私有雲端 (VPC) 和子網路中建立彈性網路界面時,會使用子網路中的私有 IP 地址。 連線中指定的安全群組將套用至每個彈性網路界面。檢查安全群組是否允許對外存取,以及是否允許連線到資料庫叢集。
此外,Apache Spark 需要驅動程式和執行器節點之間的雙向連線。安全群組的需求之一是允許所有 TCP 連接埠的輸入規則。您可以利用自我參考的安全群組,將安全群組的來源限制為安全群組本身,以防止向全世界開放。
以下是您可採取的一些典型動作以排除連線問題:
-
檢查您的連線的連接埠位址。
-
檢查您連線或秘密中的使用者名稱和密碼字串。
-
對於 JDBC 資料存放區,驗證它允許傳入的連線。
-
確認您的資料存放區可在 VPC 內存取。
-
如果您使用 AWS Secrets Manager 存放連線憑證,請確定 AWS Glue 的 IAM 角色具有存取秘密的許可。如需詳細資訊,請參閱《AWS Secrets Manager 使用者指南》中的 Example: Permission to retrieve secret values (範例:擷取秘密值的許可)。根據您的網路設定而定,您可能還需要建立 VPC 端點,以在 VPC 與 Secrets Manager 之間建立私有連線。如需詳細資訊,請參閱使用 AWS Secrets Manager VPC 端點。