Detectando e processando arquivos compactados - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Detectando e processando arquivos compactados

O Hadoop verifica a extensão do arquivo para detectar arquivos compactados. Os tipos de compactação suportados pelo Hadoop são: gzip, bzip2 e. LZO Você não precisa tomar medidas adicionais para extrair arquivos usando esses tipos de compactação; o Hadoop manipula o processo para você.

Para indexar LZO arquivos, você pode usar a biblioteca hadoop-lzo, que pode ser baixada do hadoop-lzo. https://github.com/kevinweil/ Observe que, como essa é uma biblioteca de terceiros, EMR a Amazon não oferece suporte ao desenvolvedor sobre como usar essa ferramenta. Para obter informações de uso, consulte o arquivo leiame da hadoop-lzo.