在適用於 Amazon EMR 的 VPC 中設定聯網 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在適用於 Amazon EMR 的 VPC 中設定聯網

大多數叢集使用 Amazon Virtual Private Cloud (Amazon VPC) 在虛擬網路中啟動。VPC 是在您的帳戶 AWS 內 AWS 邏輯隔離的隔離虛擬網路。您可以設定私有 IP 地址範圍、子網路、路由表和網路閘道等方面。如需詳細資訊,請參閱 Amazon VPC 使用者指南

VPC 提供下列功能:

  • 處理敏感資料

    在 VPC 中啟動叢集與使用其他工具 (例如路由表和網路 ACL) 在私有網路中啟動叢集類似,以定義可存取網路的人員。如果您正在處理的是叢集中的敏感資料,您可能需要在 VPC 中啟動叢集所提供的其他存取控制。此外,您可以選擇在私有子網路中啟動資源,其中這些資源都沒有直接的網際網路連線。

  • 透過內部網路存取資源

    如果您的資料來源位於私有網路中,由於要傳輸的資料量或資料的敏感性質,將資料上傳至 AWS 以匯入 Amazon EMR 可能不切實際或不理想。但您可以在 VPC 中啟動叢集,並透過 VPN 將資料中心連接到 VPC,讓叢集可透過內部網路存取資源。例如,如果您在資料中心中有一個 Oracle 資料庫,在透過 VPN 連接到該網路的 VPC 中啟動叢集可讓叢集存取 Oracle 資料庫。

公有和私有子網路

您可以同時在公有和私有 VPC 子網路中啟動 Amazon EMR 叢集。這表示您不需要網際網路連線才能執行 Amazon EMR 叢集;不過,您可能需要設定網路地址轉譯 (NAT) 和 VPN 閘道來存取位於 VPC 外部的服務或資源,例如公司內部網路或公有 AWS 服務端點 AWS Key Management Service。

重要

Amazon EMR 僅支援在發行版本 4.2 和更新版本中的私有子網路中啟動叢集。

如需 Amazon VPC 的詳細資訊,請參閱《Amazon VPC 使用者指南》https://docs.aws.amazon.com/vpc/latest/userguide/

了解 VPC 的更多資源

若要進一步了解 VPC 與子網路,請參閱下列主題。