Amazon을 사용하여 압축 파일 감지 및 처리 EMR - Amazon EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon을 사용하여 압축 파일 감지 및 처리 EMR

하둡은 파일 확장명을 확인하여 압축 파일을 감지합니다. 하둡에서 지원하는 압축 유형은 gzip, bzip2 및 입니다LZO. 이러한 압축 형식을 사용하는 파일을 압축 해제하기 위해 추가 작업을 수행할 필요는 없으며 하둡에서 자동으로 처리됩니다.

LZO 파일을 인덱싱하려면 hadoop-lzo에서 다운로드할 수 있는 https://github.com/kevinweil/hadoop-lzo 라이브러리를 사용할 수 있습니다. 이 라이브러리는 타사 라이브러리이므로 AmazonEMR은이 도구 사용 방법에 대한 개발자 지원을 제공하지 않습니다. 사용 방법에 대한 자세한 내용은 hadoop-lzo readme 파일을 참조하십시오.