Amazon EMR 可接受的輸入類型

叢集的預設輸入格式為文字檔，其中每列以換行 (\n) 字元分隔，這是最常用的輸入格式。

如果您的輸入資料是使用預設文字檔案以外的格式，您可以使用 Hadoop 界面 InputFormat 來指定其他輸入類型。您甚至可以建立 FileInputFormat 的子類別，以處理自訂資料類型。如需詳細資訊，請參閱 http://hadoop.apache.org/docs/current/api/org/apache/hadoop/mapred/InputFormat.html。

如果您使用的是 Hive，您可以使用串聯器/解串器 (SerDe) 來將指定格式的資料讀取至 HDFS 中。如需詳細資訊，請參閱 https://cwiki.apache.org/confluence/display/Hive/SerDe。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

準備輸入資料以使用 Amazon EMR 處理

將資料取得至 Amazon EMR 的不同方式