本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
若要執行擷取、轉換和載入 (ETL) 任務,AWS Glue 必須能夠存取您的資料存放區。如果工作不需要在虛擬私有雲端 (VPC) 子網路中執行,例如,從 Amazon S3 到 Amazon S3 轉換資料,無需額外組態。
如果任務需要在 VPC 子網路內執行—例如,在私有子網路中轉換 JDBC 資料存放區內的資料—AWS Glue 會設定彈性網路界面,讓您的任務能安全地連接到 VPC 內的其他資源。每個彈性網路界面都會指派一個私有 IP 地址,而此地址來自您在子網路中指定的 IP 地址範圍。未指派公有 IP 地址。AWS Glue 連線中指定的安全群組將套用至每個彈性網路界面。如需詳細資訊,請參閱 為 Amazon RDS 資料存放區的 JDBC 連線設定 Amazon VPC AWS Glue。
任務可存取的所有 JDBC 資料存放區必須可從 VPC 子網路使用。要從 VPC 存取 Amazon S3,需有 VPC 端點。如果您的任務需要同時存取 VPC 資源和公有網際網路,則 VPC 需要在 VPC 中有一個網路位址轉譯 (NAT) 閘道。
任務或開發端點一次只能存取一個 VPC (和子網路)。如果您需要存取其他 VPC 內的資料存放區,您有下列選項:
使用 VPC 對等存取資料存放區。如需有關 VPC 對等的詳細資訊,請參閱 VPC 對等基本概念
使用 Amazon S3 儲存貯體做為媒介儲存位置。將任務分割成兩個任務,以任務 1 的 Amazon S3 輸出做為任務 2 的輸入。
如需有關如何使用 Amazon VPC 連線至 Amazon Redshift 資料存放區的詳細資訊,請參閱 設定 Redshift 連線。
如需有關如何使用 Amazon VPC 連線至 Amazon RDS 資料存放區的詳細資訊,請參閱 為 Amazon RDS 資料存放區的 JDBC 連線設定 Amazon VPC AWS Glue。
在 Amazon VPC 中設定所需規則後,您可以在 AWS Glue 中建立具有必要屬性的連線,以連線至資料存放區。如需有關連線的詳細資訊,請參閱 連線至資料。
注意
務必針對 AWS Glue 設定您的 DNS 環境。如需詳細資訊,請參閱 設定 VPC 中的 DNS。