Amazon 可以EMR返回哪些格式? - Amazon EMR

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon 可以EMR返回哪些格式?

集群的默认输出格式是将密钥和值对写入单独文本文件行的文本。这是最常用的输出格式。

如果默认输出数据需要采用默认文本文件以外的格式,则可以使用 Hadoop 接口 OutputFormat 指定其它输出类型。您甚至可以创建 FileOutputFormat 类型的子类,用于处理自定义数据类型。欲了解更多信息,请参阅 http://hadoop.apache。 org/docs/current/api/org/apache/hadoop/mapred/OutputFormat.html。

如果您要启动 Hive 集群,则可以使用序列化器/反序列化器 (SerDe) 将数据输出为给定格式。HDFS欲了解更多信息,请参阅 https://cwiki.apache。 org/confluence/display/Hive/SerDe