Amazon EMR은 어떤 형식을 반환할 수 있나요? - Amazon EMR

Amazon EMR은 어떤 형식을 반환할 수 있나요?

클러스터의 기본 출력 형식은 키 값 쌍이 텍스트 파일의 개별 행에 쓰여진 텍스트입니다. 이 형식은 가장 일반적으로 사용되는 출력 형식입니다.

출력 데이터가 기본 텍스트 파일 이외의 다른 형식으로 작성되어야 하는 경우 Hadoop 인터페이스 OutputFormat을 사용하여 다른 출력 형식을 지정할 수 있습니다. 사용자 지정 데이터 유형을 처리하기 위해 FileOutputFormat 클래스의 하위 클래스를 만들 수도 있습니다. 자세한 내용은 http://hadoop.apache.org/docs/current/api/org/apache/hadoop/mapred/OutputFormat.html 단원을 참조하십시오.

Hive 클러스터를 실행 중인 경우 serializer/deserializer(SerDe)를 사용하여 HDFS에서 지정된 형식으로 데이터를 출력할 수 있습니다. 자세한 내용은 https://cwiki.apache.org/confluence/display/Hive/SerDe를 참조하십시오.