本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在 VPC 中为 Amazon EMR 配置联网
大多数集群都使用 Amazon Virtual Private Cloud(Amazon VPC)启动到虚拟网络。VPC 是其中的一个隔离虚拟网络 AWS ,在您的 AWS 账户中逻辑上是隔离的。您可以对私有 IP 地址范围、子网、路由表和网络网关等进行配置。有关更多信息,请参阅《Amazon VPC 用户指南》。
VPC 提供以下功能:
-
处理敏感数据
在 VPC 中启动集群与使用路由表和网络等其他工具将集群启动到私有网络类似ACLs,用于定义谁有权访问该网络。如果您正在处理集群中的敏感数据,您可能希望获得在 VPC 中启动集群所提供的额外访问控制。此外,您还可以选择在私有子网中启动您的资源,其中,所有这些资源都没有直接的 Internet 连接。
-
访问内部网络上的资源
如果您的数据源位于私有网络中,则将该数据上传到以导入 Amazon EMR 可能不切实际或不可取,这要么是因为要传输的数据量很大,要么是因为数据的敏感性。 AWS 相反,您可以在 VPC 中启动集群,并通过 VPN 连接将您的数据中心连接到 VPC,从而允许集群访问内部网络上的资源。例如,如果数据中心内有 Oracle 数据库,则在通过 VPN 连接到该网络的 VPC 中启动集群,可使集群能够访问 Oracle 数据库。
公有子网和私有子网
您可以同时在公有 VPC 子网和私有 VPC 子网中启动 Amazon EMR 集群。这意味着您不需要互联网连接即可运行 Amazon EMR 集群;但是,您可能需要配置网络地址转换 (NAT) 和 VPN 网关才能访问位于 VPC 之外的服务或资源,例如企业内部网或公共 AWS 服务终端节点(例如)。 AWS Key Management Service
重要
Amazon EMR 仅支持在版本 4.2 及更高版本中的私有子网中启动集群。
有关 Amazon VPC 的更多信息,请参阅 Amazon VPC 用户指南。
主题
更多可供学习的资源 VPCs
使用以下主题了解有关 VPCs 和子网的更多信息。
-
VPC 中的私有子网
-
VPC 中的公有子网
-
一般 VPC 信息