Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Quali formati può EMR restituire Amazon?
Il formato di output predefinito per un cluster è il testo con coppie di chiavi e valori scritte su singole righe nei file di testo. Questo è il formato di output utilizzato più comunemente.
Se devi scrivere i dati di output in un formato diverso da quello predefinito dei file di testo, puoi utilizzare l'interfaccia di Hadoop OutputFormat
per specificare altri tipi di output. Puoi persino creare una sottoclasse della classe FileOutputFormat
per gestire i tipi di dati personalizzati. Per ulteriori informazioni, consulta http://hadoop.apache. org/docs/current/api/org/apache/hadoop/mapred/OutputFormat.html
Se stai lanciando un cluster Hive, puoi usare un serializzatore/deserializzatore (SerDe) per generare dati da un determinato formato. HDFS Per ulteriori informazioni, consultate https://cwiki.apache. org/confluence/display/Hive/SerDe