本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
啟動 Amazon EMR叢集時設定應用程式
當您選取軟體版本時,Amazon EMR會使用 Amazon Machine Image (AMI) 搭配 Amazon Linux 來安裝您在啟動叢集時選擇的軟體,例如 Hadoop、Spark 和 Hive。Amazon 定期EMR提供新版本,新增新功能、新應用程式和一般更新。我們建議您盡可能使用最新的版本來啟動您的叢集。當您從主控台啟動叢集時,最新版本為預設選項。
如需每個EMR版本可用的 Amazon 版本和軟體版本的詳細資訊,請參閱 Amazon EMR版本指南。如需如何編輯叢集上安裝之應用程式和軟體的預設組態的詳細資訊,請參閱《Amazon EMR版本指南》中的設定應用程式。Amazon EMR發行版本中包含的某些開放原始碼 Hadoop 和 Spark 生態系統元件版本具有修補程式和改進功能,如 Amazon EMR發行指南所述。
除了可安裝在您叢集上的標準軟體和應用程式外,您可以使用引導操作來安裝自訂軟體。引導操做為叢集啟動時在執行個體上執行的指令碼,且是在叢集建立時新增的新節點上執行。引導動作也有助於叫用每個節點上的 AWS CLI 命令,將物件從 Amazon S3 複製到叢集中的每個節點。
注意
在 Amazon 4.x 版和更新EMR版本中,引導動作的使用方式不同。如需這些與 Amazon 2.x 版和 3.x EMRAMI版不同之處的詳細資訊,請參閱《Amazon EMR版本指南》中的 4.x 版引進的差異。