Amazon이 수락EMR할 수 있는 입력 유형 - Amazon EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon이 수락EMR할 수 있는 입력 유형

클러스터의 기본 입력 형식은 각 줄이 줄 바꿈(\n) 문자로 구분되는 텍스트 파일로, 이 형식은 가장 일반적으로 사용되는 입력 형식입니다.

입력 데이터가 기본 텍스트 파일 이외의 다른 형식인 경우 하둡 인터페이스 InputFormat을 사용하여 다른 입력 형식을 지정할 수 있습니다. 사용자 지정 데이터 유형을 처리하기 위해 FileInputFormat 클래스의 하위 클래스를 만들 수도 있습니다. 자세한 내용은 http://hadoop.apache.org/docs/current/api/org/apache/hadoop/mapred/InputFormat.html을 참조하세요.

Hive를 사용하는 경우 직렬화기/직렬 해제기(SerDe)를 사용하여의 데이터를 지정된 형식에서 로 읽을 수 있습니다HDFS. 자세한 내용은 https://cwiki.apache.org/confluence/display/Hive/SerDe 참조하세요.