Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Jenis input yang EMR dapat diterima Amazon
Format input default untuk klaster adalah file teks dengan setiap baris dipisahkan oleh karakter baris baru (\n), yang merupakan format input yang paling sering digunakan.
Jika data input Anda dalam format selain file teks default, Anda bisa menggunakan antarmuka Hadoop InputFormat
untuk menentukan jenis input lainnya. Anda bahkan dapat membuat subkelas dari kelas FileInputFormat
untuk menangani jenis data khusus. Untuk informasi lebih lanjut, lihat http://hadoop.apache. org/docs/current/api/org/apache/hadoop/mapred/InputFormat.html
Jika Anda menggunakan Hive, Anda dapat menggunakan serializer/deserializer (SerDe) untuk membaca data dari format tertentu ke dalam. HDFS Untuk informasi lebih lanjut, lihat https://cwiki.apache. org/confluence/display/Hive/SerDe