Jenis input yang EMR dapat diterima Amazon - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Jenis input yang EMR dapat diterima Amazon

Format input default untuk klaster adalah file teks dengan setiap baris dipisahkan oleh karakter baris baru (\n), yang merupakan format input yang paling sering digunakan.

Jika data input Anda dalam format selain file teks default, Anda bisa menggunakan antarmuka Hadoop InputFormat untuk menentukan jenis input lainnya. Anda bahkan dapat membuat subkelas dari kelas FileInputFormat untuk menangani jenis data khusus. Untuk informasi lebih lanjut, lihat http://hadoop.apache. org/docs/current/api/org/apache/hadoop/mapred/InputFormat.html.

Jika Anda menggunakan Hive, Anda dapat menggunakan serializer/deserializer (SerDe) untuk membaca data dari format tertentu ke dalam. HDFS Untuk informasi lebih lanjut, lihat https://cwiki.apache. org/confluence/display/Hive/SerDe.