本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
連線至 Amazon EMR叢集
當您執行 Amazon EMR叢集時,通常只需要執行應用程式來分析資料,然後從 Amazon S3 儲存貯體收集輸出。或者,您可能要在叢集執行時與主節點互動。例如,您可能想要連接到主節點執行互動式查詢、檢查日誌檔、偵錯叢集、使用在主節點上執行的應用程式上 (例如 Ganglia) 監控效能問題,以此類推。以下章節描述了您可以用來連接到主節點的技術。
在EMR叢集中,主要節點是 Amazon EC2執行個體,可協調作為任務和核心節點執行的EC2執行個體。主要節點會公開一個公有DNS名稱,供您用來連線到它。根據預設,Amazon 會為主要節點以及核心和任務節點EMR建立安全群組規則,以決定您存取節點的方式。
注意
您可以在叢集執行時連接到主節點。當叢集終止時,充當主要節點的EC2執行個體會終止且不再可用。若要連接到主節點,您還必須對叢集進行驗證。您可以使用 Kerberos 進行身分驗證,或在啟動叢集時指定 Amazon EC2金鑰對私有金鑰。如需有關設定 Kerberos 然後連線的詳細資訊,請參閱 使用 Kerberos 與 Amazon 進行身分驗證 EMR。當您從主控台啟動叢集時,Amazon EC2金鑰對私有金鑰會在建立叢集頁面上的安全與存取區段中指定。
根據預設, ElasticMapReduce-master 安全群組不允許傳入SSH存取。您可能需要新增傳入規則,以允許從您想要SSH存取的來源存取 (TCP連接埠 22)。如需修改安全群組規則的詳細資訊,請參閱 Amazon EC2使用者指南 中的將規則新增至安全群組。
重要
請勿修改 ElasticMapReduce-master 安全群組中的其餘規則。修改這些規則可能會干擾叢集的操作。