本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
設定 Amazon EMR 叢集在步驟執行後繼續或終止
本主題說明使用長時間執行的叢集與建立一個在最後一步執行後會關閉的暫時性叢集之間的差異。內容涵蓋如何設定叢集的步驟執行。
建立一個長時間執行的叢集
根據預設,您使用 主控台或 建立的叢集 AWS CLI 會長時間執行。長時間執行的叢集會繼續執行、接受工作並產生費用,直到您採取動作將其關閉為止。
長時間執行的叢集在下列情況下有效:
-
在您需要以互動方式或自動查詢資料時。
-
當您需要持續與叢集上託管的大數據應用程式互動時。
-
當您定期處理大型資料集,或您經常處理資料集,導致無法每次都有效啟動新的叢集並載入資料時。
您也可以在長時間執行的叢集上設定終止保護,以避免意外或錯誤關閉 EC2 執行個體。如需詳細資訊,請參閱使用終止保護來保護 Amazon EMR 叢集免於意外關閉。
注意
Amazon EMR 會自動為具有多個主節點的所有叢集啟用終止保護,並覆寫您在建立叢集時提供的任何步驟執行設定。您可以在叢集啟動之後停用終止保護。請參閱 對執行中的叢集設定終止保護。若要關閉具有多個主節點的叢集,您必須先修改叢集屬性以停用終止保護。如需說明,請參閱 終止具有多個主節點的 Amazon EMR 叢集。
將叢集設定為在步驟執行後終止
當您設定在步驟執行後終止時,叢集會啟動、執行引導操作,然後執行您指定的步驟。一旦最後一步完成,Amazon EMR 就會終止叢集的 Amazon EC2 執行個體。依預設,您使用 Amazon EMR API 啟動的叢集已啟用步驟執行。
步驟執行後終止對執行定期處理任務 (例如每日資料處理執行) 的叢集有效。步驟執行也有助於確保您只需為處理資料所需的時間付費。如需步驟的詳細資訊,請參閱 將工作提交至 Amazon EMR 叢集。