Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Quels formats peuvent être EMR renvoyés par Amazon ?
Le format de sortie par défaut pour un cluster est du texte avec des paires de valeurs clés, écrites dans les lignes individuelles des fichiers texte. Il s'agit du format de sortie le plus couramment utilisé.
Si vos données de sortie doivent être écrites dans un format autre que les fichiers de texte par défaut, vous pouvez utiliser l'interface Hadoop OutputFormat
pour spécifier d'autres types de sortie. Vous pouvez même créer une sous-classe de la classe FileOutputFormat
pour gérer les types de données personnalisés. Pour plus d'informations, consultez http://hadoop.apache. org/docs/current/api/org/apache/hadoop/mapred/OutputFormat.html
Si vous lancez un cluster Hive, vous pouvez utiliser un sérialiseur/désérialiseur (SerDe) pour générer des données dans un format donné. HDFS Pour plus d'informations, consultez https://cwiki.apache. org/confluence/display/Hive/SerDe