使用 Amazon 偵測和處理壓縮檔案 EMR - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 Amazon 偵測和處理壓縮檔案 EMR

Hadoop 會檢查副檔名以偵測壓縮檔案。Hadoop 支援的壓縮類型為:gzip、bzip2 和 LZO。您不需要採取任何額外的動作來擷取使用這些壓縮類型的檔案;Hadoop 會為您處理。

若要為LZO檔案編製索引,您可以使用可從 hadoop-lzo 下載的 https://github.com/kevinweil/hadoop-lzo 程式庫。請注意,由於這是第三方程式庫,Amazon EMR不提供開發人員如何使用此工具的支援。如需使用資訊,請參閱 hadoop-lzo 讀我檔。