作業調校考量 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

作業調校考量

EMRFS S3-optimized遞交者會對任務嘗試寫入的每個檔案耗用少量記憶體,直到任務遞交或中止為止。在大多數任務中,記憶體的消耗量極少。對於具有寫入大量檔案之長期執行任務的工作,遞交器耗用的記憶體量可能會很明顯,並需要調整配置給 Spark 執行器的記憶體。您可以使用 spark.executor.memory 屬性調校執行器記憶體。根據準則,寫入 100,000 個檔案的單一任務通常需要額外 100 MB 的記憶體。如需詳細資訊,請參閱 Apache Spark 組態文件中的應用程式屬性