检测和处理压缩文件 - Amazon EMR

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

检测和处理压缩文件

Hadoop 会检查文件扩展名以检测压缩文件。Hadoop 支持的压缩类型有:gzip、bzip2 和。LZO不需要执行任何额外操作来解压缩使用这些压缩类型的文件;Hadoop 会为您执行这些操作。

要索引LZO文件,你可以使用 hadoop-lzo 库,该库可以从 hadoop-lzo 下载。https://github.com/kevinweil/请注意,由于这是第三方库,因此 Amazon EMR 不为开发者提供有关如何使用此工具的支持。有关使用信息,请参阅 hadoop-lzo readme 文件