Amazon EMR 可以傳回什麼格式? - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon EMR 可以傳回什麼格式?

叢集的預設輸出格式是帶有金鑰的文字、寫入至文字檔案個別行的值對。這是最常用的輸出格式。

如果您的輸出資料必須以預設文字檔案以外的格式來寫入,您可以使用 Hadoop 界面 OutputFormat 來指定其他輸出類型。您甚至可以建立 FileOutputFormat 的子類別,以處理自訂資料類型。如需詳細資訊,請參閱 http://hadoop.apache.org/docs/current/api/org/apache/hadoop/mapred/OutputFormat.html

如果您正在啟動 Hive 叢集,您可以使用串聯器/解串器 (SerDe) 以從 HDFS 輸出指定格式的資料。如需詳細資訊,請參閱 https://cwiki.apache.org/confluence/display/Hive/SerDe