Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Arten von Eingaben, die Amazon akzeptieren EMR kann
Das Standardeingabeformat für einen Cluster sind Textdateien, bei denen jede Zeile durch ein Zeilenvorschubzeichen (\ n) getrennt ist. Dies ist das am häufigsten verwendete Eingabeformat.
Wenn Ihre Eingabedaten in einem anderen Format geschrieben werden müssen als Standardtextdateien, können Sie die Hadoop-Benutzeroberfläche InputFormat
verwenden, um andere Eingabetypen anzugeben. Sie können auch eine Unterklasse der FileInputFormat
-Klasse für den Umgang mit benutzerdefinierten Datentypen verwenden. Weitere Informationen finden Sie unter http://hadoop.apache. org/docs/current/api/org/apache/hadoop/mapred/InputFormat
Wenn Sie Hive verwenden, können Sie einen Serializer/Deserializer (SerDe) verwenden, um Daten aus einem bestimmten Format einzulesen. HDFS Weitere Informationen finden Sie unter https://cwiki.apache. org/confluence/display/Hive/SerDe