本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
VPC 使用 Amazon 在 中啟動叢集 EMR
在子網路設定為託管 Amazon EMR叢集之後,請在建立叢集時指定相關聯的子網路識別符,以在該子網路中啟動叢集。
注意
Amazon EMR支援 4.2 版及更高版本的私有子網路。
叢集啟動時,Amazon 會根據叢集是否啟動至VPC私有或公有子網路來EMR新增安全群組。所有安全群組都允許連接埠 8443 的輸入與 Amazon EMR服務通訊,但公有和私有子網路的 IP 地址範圍有所不同。Amazon 會EMR管理所有這些安全群組,而且可能需要將額外的 IP 地址隨時間新增至 AWS 範圍。如需詳細資訊,請參閱使用 Amazon EMR叢集的安全群組控制網路流量。
若要管理 上的叢集VPC,Amazon 會將網路裝置EMR連接至主要節點,並透過此裝置進行管理。您可以使用 Amazon EC2API動作 檢視此裝置DescribeInstances
。如果您以任何方式修改此裝置,叢集可能會失敗。
確保 上EMR叢集的可用 IP 地址 EC2
為確保啟動時可用可用 IP 地址足夠的EC2子網路,子網路選擇會檢查 IP 可用性。其建立程序會視需要使用具有必要 IP 地址計數的子網路來啟動核心、主要節點和任務節點,即使初始建立時,只會建立叢集的核心節點。EMR 會檢查在建立期間啟動主要節點和任務節點所需的 IP 地址數目,以及分別計算啟動核心節點所需的 IP 地址數目。所需的主執行個體和任務執行個體或節點數量下限由 Amazon 自動決定EMR。
重要
如果 中沒有VPC足夠IPs容納必要節點的子網路,則會傳回錯誤,而且不會建立叢集。
在大多數部署案例中,核心、主要節點和任務節點的每次啟動都有時間差異。此外,多個叢集可以共用子網路。在這些情況下,IP 地址可用性可能會波動,而後續的任務節點啟動可能會受到可用 IP 地址的限制。