Quali formati può EMR restituire Amazon? - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Quali formati può EMR restituire Amazon?

Il formato di output predefinito per un cluster è il testo con coppie di chiavi e valori scritte su singole righe nei file di testo. Questo è il formato di output utilizzato più comunemente.

Se devi scrivere i dati di output in un formato diverso da quello predefinito dei file di testo, puoi utilizzare l'interfaccia di Hadoop OutputFormat per specificare altri tipi di output. Puoi persino creare una sottoclasse della classe FileOutputFormat per gestire i tipi di dati personalizzati. Per ulteriori informazioni, consulta http://hadoop.apache. org/docs/current/api/org/apache/hadoop/mapred/OutputFormat.html.

Se stai lanciando un cluster Hive, puoi usare un serializzatore/deserializzatore (SerDe) per generare dati da un determinato formato. HDFS Per ulteriori informazioni, consultate https://cwiki.apache. org/confluence/display/Hive/SerDe.