SQL 延伸資料來源連線 (適用於管理員) - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

SQL 延伸資料來源連線 (適用於管理員)

在 JupyterLab 筆記本中使用SQL擴充功能之前,管理員必須設定 AWS Glue 與資料來源的連線。Amazon SageMaker Studio 中的SQL擴充功能會使用 AWS Glue 連線來存取資料來源,例如 Amazon Redshift 或 Amazon Athena 連線會存放連線到資料來源所需的憑證和參數。

建立連線之前,管理員必須授予必要IAM許可,允許 Studio 存取資料來源。此外,管理員應確保其網路允許 Studio 與資料來源之間的通訊。如需管理員如何設定聯網的資訊,請參閱 設定 Studio 和資料來源之間的網路存取 (適用於管理員)

本節說明如何設定 AWS Glue 連線,並列出 Studio JupyterLab 應用程式透過連線存取資料所需的IAM許可。

注意

Amazon SageMaker AssetsAmazon DataZone 與 Studio 整合。它包含一個 SageMaker 藍圖,供管理員從 Amazon DataZone 網域內的 Amazon DataZone 專案建立 Studio 環境。

從使用藍圖建立的 Studio 網域啟動 JupyterLab 的應用程式使用者可以在使用SQL擴充功能時自動存取其 Amazon DataZone 目錄中的資料資產 AWS Glue 連線。這允許在不手動設定連線的情況下查詢這些資料來源。