在您的 AWS Glue DataBrew VPC 中使用 - AWS Glue DataBrew

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在您的 AWS Glue DataBrew VPC 中使用

如果您使用 Amazon VPC 托管 AWS 资源,则可以配置 AWS Glue DataBrew 为基于亚马逊 VPC 服务的虚拟私有云 (VPC) 路由流量。 DataBrew 为此,首先在您指定的子网中配置一个 elastic network 接口。 DataBrew 然后将您指定的安全组附加到该网络接口以控制访问权限。指定的安全组必须具有适用于所有流量的自引用入站和出站规则。此外,您的 VPC 必须启用 DNS 主机名和解析。有关更多信息,请参阅AWS Glue 开发人员指南中的设置 VPC 以连接到 JDBC 数据存储

对于 AWS Glue Data Catalog 数据集,VPC 信息是在您在数据目录中创建 AWS Glue 连接时配置的。要为此连接创建数据目录表,请从 AWS Glue 控制台运行 Crawler。有关更多信息,请参阅《AWS Glue 开发人员指南》 AWS Glue Data Catalog中的填充

对于数据库数据集,请在从 DataBrew 控制台创建连接时指定您的 VPC 信息。

要 AWS Glue DataBrew 与没有 NAT 的 VPC 子网配合使用,您必须有一个连接到 Amazon S3 的网关 VPC 终端节点和用于 AWS Glue 接口的 VPC 终端节点。有关更多信息,请参阅 Amazon VPC 文档中的创建网关终端节点和接口 VPC 终端节点 (AWS PrivateLink)。由配置的弹性接口 DataBrew 没有公有 IPv4 地址,因此它不支持使用 VPC Internet Gateway。

目前不支持 Amazon S3 接口终端节点。如果您使用 AWS Secrets Manager 存储密钥,则需要一条通往 Secrets Manager 的路径。如果您使用的是加密,则需要一个到 AWS Key Management Service (AWS KMS) 的路由。