Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Konfigurasikan lokasi untuk keluaran kluster EMR Amazon
Format output paling umum dari klaster Amazon EMR adalah sebagai file teks, baik yang dikompresi atau tidak dikompresi. Biasanya, ini ditulis ke bucket Amazon S3. Bucket ini harus dibuat sebelum Anda meluncurkan klaster. Anda menentukan S3 bucket sebagai lokasi output ketika Anda memulai klaster.
Untuk informasi selengkapnya, lihat topik berikut:
Topik
Buat dan konfigurasikan bucket Amazon S3
Amazon EMR (Amazon EMR) menggunakan Amazon S3 untuk menyimpan data input, berkas log, dan data output. Amazon S3 mengacu pada lokasi penyimpanan ini sebagai bucket. Bucket memiliki pembatasan dan batasan tertentu agar sesuai dengan persyaratan Amazon S3 dan DNS. Untuk informasi lebih lanjut, kunjungi Pembatasan dan Batasan Bucket dalam Panduan Developer Amazon Simple Storage Service.
Untuk membuat bucket Amazon S3, ikuti petunjuk di halaman Membuat bucket dalam Panduan Developer Amazon Simple Storage Service.
catatan
Jika Anda mengaktifkan pencatatan log di panduan Membuat Bucket, ini hanya mengaktifkan log akses bucket, bukan log cluster.
catatan
Untuk informasi selengkapnya tentang menentukan bucket khusus Wilayah, lihat Bucket dan Wilayah di Panduan Pengembang Layanan Penyimpanan Sederhana Amazon dan Titik Akhir Wilayah yang Tersedia
Setelah Anda membuat bucket, Anda dapat mengatur izin yang sesuai terhadapnya. Biasanya, Anda memberi diri Anda (pemilik) akses baca dan tulis. Kami sangat menyarankan agar Anda mengikuti Praktik Terbaik Keamanan untuk Amazon S3 saat mengonfigurasi bucket Anda.
Bucket Amazon S3 yang diperlukan harus ada sebelum Anda dapat membuat klaster. Anda harus mengunggah skrip atau data yang diperlukan yang dimaksud dalam klaster ke Amazon S3. Tabel berikut menjelaskan contoh data, skrip, dan lokasi berkas log.
Informasi | Contoh Lokasi di Amazon S3 |
---|---|
skrip atau program |
s3://amzn-s3-demo-bucket1/script/MapperScript.py
|
berkas log |
s3://amzn-s3-demo-bucket1/logs
|
data input |
s3://amzn-s3-demo-bucket1/input
|
data output |
s3://amzn-s3-demo-bucket1/output
|