

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Memulai dengan EMR Serverless dari konsol
<a name="gs-console"></a>

Bagian ini menjelaskan bekerja dengan EMR Tanpa Server, termasuk membuat EMR Studio. Ini juga menjelaskan cara mengirimkan pekerjaan berjalan dan melihat log.

**Topics**
+ [Langkah 1: Buat aplikasi EMR Tanpa Server](#gs-application-console)
+ [Langkah 2: Kirimkan pekerjaan atau beban kerja interaktif](#gs-job-run-console)
+ [Langkah 3: Lihat UI aplikasi dan log](#gs-output-console)
+ [Langkah 4: Membersihkan](#gs-cleanup-console)

## Langkah 1: Buat aplikasi EMR Tanpa Server
<a name="gs-application-console"></a>

Buat aplikasi baru dengan EMR Serverless sebagai berikut.

1. [Masuk ke Konsol Manajemen AWS dan buka konsol EMR Amazon di https://console.aws.amazon.com /emr.](https://console.aws.amazon.com/emr)

1. Di panel navigasi kiri, pilih **EMR** Tanpa Server untuk menavigasi ke halaman arahan EMR Tanpa Server.

1. Untuk membuat atau mengelola aplikasi EMR Tanpa Server, Anda memerlukan EMR Studio UI.
   + Jika Anda sudah memiliki EMR Studio di Wilayah AWS tempat Anda ingin membuat aplikasi, lalu pilih **Kelola aplikasi** untuk menavigasi ke EMR Studio Anda, atau pilih studio yang ingin Anda gunakan. 
   + Jika Anda tidak memiliki EMR Studio di Wilayah AWS tempat Anda ingin membuat aplikasi, pilih **Mulai** lalu Pilih **Buat dan luncurkan** Studio. EMR Serverless membuat EMR Studio untuk Anda sehingga Anda dapat membuat dan mengelola aplikasi.

1. Di UI **Buat studio** yang terbuka di tab baru, masukkan nama, jenis, dan versi rilis untuk aplikasi Anda. Jika Anda hanya ingin menjalankan pekerjaan batch, pilih **Gunakan pengaturan default untuk pekerjaan batch saja**. Untuk beban kerja interaktif, pilih **Gunakan pengaturan default untuk beban kerja interaktif**. Anda juga dapat menjalankan pekerjaan batch pada aplikasi yang diaktifkan interaktif dengan opsi ini. Jika perlu, Anda dapat mengubah pengaturan ini nanti.

   Untuk informasi selengkapnya, lihat [Membuat studio](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-studio-create-studio.html).

1. Pilih **Buat aplikasi** untuk membuat aplikasi pertama Anda. 

Lanjutkan ke bagian berikutnya [Langkah 2: Kirimkan pekerjaan atau beban kerja interaktif](#gs-job-run-console) untuk mengirimkan pekerjaan atau beban kerja interaktif.

## Langkah 2: Kirimkan pekerjaan atau beban kerja interaktif
<a name="gs-job-run-console"></a>

------
#### [ Spark job run ]

Dalam tutorial ini, kita menggunakan PySpark script untuk menghitung jumlah kemunculan kata-kata unik di beberapa file teks. Bucket S3 publik dan hanya-baca menyimpan skrip dan kumpulan data.

**Untuk menjalankan pekerjaan Spark**

1. Unggah skrip sampel `wordcount.py` ke bucket baru Anda dengan perintah berikut.

   ```
   aws s3 cp s3://us-east-1.elasticmapreduce/emr-containers/samples/wordcount/scripts/wordcount.py s3://amzn-s3-demo-bucket/scripts/
   ```

1. Menyelesaikan [Langkah 1: Buat aplikasi EMR Tanpa Server](#gs-application-console) membawa Anda ke halaman **detail Aplikasi** di EMR Studio. Di sana, pilih opsi **Kirim pekerjaan**.

1. Pada halaman **Kirim pekerjaan**, lengkapi yang berikut ini.
   + Di bidang **Nama**, masukkan nama yang ingin Anda panggil job run.
   + Di bidang **peran Runtime**, masukkan nama peran yang Anda buat. [Buat peran runtime pekerjaan](getting-started.md#gs-runtime-role)
   + Di bidang **lokasi Script**, masukkan `s3://amzn-s3-demo-bucket/scripts/wordcount.py` sebagai URI S3.
   + Di bidang **argumen Script**, masukkan`["s3://amzn-s3-demo-bucket/emr-serverless-spark/output"]`.
   + Di bagian **properti Spark**, pilih **Edit sebagai teks** dan masukkan konfigurasi berikut.

     ```
     --conf spark.executor.cores=1 --conf spark.executor.memory=4g --conf spark.driver.cores=1 --conf spark.driver.memory=4g --conf spark.executor.instances=1
     ```

1. Untuk memulai pekerjaan, pilih **Kirim pekerjaan**.

1. Di tab **Job runs**, Anda akan melihat pekerjaan baru Anda berjalan dengan status **Running**.

------
#### [ Hive job run ]

Di bagian tutorial ini, kita membuat tabel, menyisipkan beberapa catatan, dan menjalankan kueri agregasi hitungan. Untuk menjalankan pekerjaan Hive, pertama-tama buat file yang berisi semua kueri Hive untuk dijalankan sebagai bagian dari pekerjaan tunggal, unggah file ke S3, dan tentukan jalur S3 ini saat memulai pekerjaan Hive.

**Untuk menjalankan pekerjaan Hive**

1. Buat file bernama `hive-query.ql` yang berisi semua kueri yang ingin Anda jalankan dalam pekerjaan Hive Anda.

   ```
   create database if not exists emrserverless;
   use emrserverless;
   create table if not exists test_table(id int);
   drop table if exists Values__Tmp__Table__1;
   insert into test_table values (1),(2),(2),(3),(3),(3);
   select id, count(id) from test_table group by id order by id desc;
   ```

1. Unggah `hive-query.ql` ke bucket S3 Anda dengan perintah berikut.

   ```
   aws s3 cp hive-query.ql s3://amzn-s3-demo-bucket/emr-serverless-hive/query/hive-query.ql
   ```

1. Menyelesaikan [Langkah 1: Buat aplikasi EMR Tanpa Server](#gs-application-console) membawa Anda ke halaman **detail Aplikasi** di EMR Studio. Di sana, pilih opsi **Kirim pekerjaan**.

1. Pada halaman **Kirim pekerjaan**, lengkapi yang berikut ini.
   + Di bidang **Nama**, masukkan nama yang ingin Anda panggil job run.
   + Di bidang **peran Runtime**, masukkan nama peran yang Anda buat. [Buat peran runtime pekerjaan](getting-started.md#gs-runtime-role)
   + Di bidang **lokasi Script**, masukkan `s3://amzn-s3-demo-bucket/emr-serverless-hive/query/hive-query.ql` sebagai URI S3.
   + Di bagian **Properti sarang**, pilih **Edit sebagai teks**, dan masukkan konfigurasi berikut.

     ```
     --hiveconf hive.log.explain.output=false
     ```
   + Di bagian **konfigurasi Job**, pilih **Edit sebagai JSON**, dan masukkan JSON berikut.

     ```
     {
        "applicationConfiguration": 
        [{
            "classification": "hive-site",
               "properties": {
                   "hive.exec.scratchdir": "s3://amzn-s3-demo-bucket/emr-serverless-hive/hive/scratch",
                   "hive.metastore.warehouse.dir": "s3://amzn-s3-demo-bucket/emr-serverless-hive/hive/warehouse",
                   "hive.driver.cores": "2",
                   "hive.driver.memory": "4g",
                   "hive.tez.container.size": "4096",
                   "hive.tez.cpu.vcores": "1"
                }
         }]
     }
     ```

1. Untuk memulai pekerjaan, pilih **Kirim pekerjaan**.

1. Di tab **Job runs**, Anda akan melihat pekerjaan baru Anda berjalan dengan status **Running**.

------
#### [ Interactive workload ]

Dengan Amazon EMR 6.14.0 dan yang lebih tinggi, Anda dapat menggunakan notebook yang di-host di EMR Studio untuk menjalankan beban kerja interaktif untuk Spark di EMR Tanpa Server. Untuk informasi selengkapnya termasuk izin dan prasyarat, lihat. [Jalankan beban kerja interaktif dengan EMR Serverless melalui EMR Studio](interactive-workloads.md)

Setelah Anda membuat aplikasi dan menyiapkan izin yang diperlukan, gunakan langkah-langkah berikut untuk menjalankan notebook interaktif dengan EMR Studio:

1. Arahkan ke tab **Workspaces** di EMR Studio. Jika Anda masih perlu mengonfigurasi lokasi penyimpanan Amazon S3 dan [peran layanan EMR Studio](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-studio-service-role.html), pilih tombol **Configure studio** di spanduk di bagian atas layar.

1. Untuk mengakses buku catatan, pilih Workspace atau buat Workspace baru. Gunakan **Quick launch** untuk membuka Workspace Anda di tab baru.

1. Buka tab yang baru dibuka. Pilih ikon **Compute** dari navigasi kiri. **Pilih EMR Tanpa Server sebagai tipe Compute.**

1. Pilih aplikasi berkemampuan interaktif yang Anda buat di bagian sebelumnya.

1. Di bidang **peran Runtime**, masukkan nama peran IAM yang dapat diasumsikan oleh aplikasi EMR Tanpa Server Anda untuk menjalankan pekerjaan. Untuk mempelajari lebih lanjut tentang peran runtime, lihat Peran [runtime Job](https://docs.aws.amazon.com/emr/latest/EMR-Serverless-UserGuide/security-iam-runtime-role.html) di Panduan Pengguna Tanpa *Server Amazon EMR*.

1. Pilih **Lampirkan**. Ini mungkin memakan waktu hingga satu menit. Halaman akan disegarkan saat dilampirkan.

1. Pilih kernel dan mulai notebook. Anda juga dapat menelusuri contoh notebook di EMR Serverless dan menyalinnya ke Workspace Anda. Untuk mengakses contoh buku catatan, navigasikan ke **`{...}`**menu di navigasi kiri dan telusuri buku catatan yang ada `serverless` di nama file notebook.

1. Di buku catatan, Anda dapat mengakses tautan log driver dan tautan ke Apache Spark UI, antarmuka waktu nyata yang menyediakan metrik untuk memantau pekerjaan Anda. Untuk informasi selengkapnya, lihat [Memantau aplikasi dan pekerjaan EMR Tanpa Server di Panduan Pengguna](https://docs.aws.amazon.com/emr/latest/EMR-Serverless-UserGuide/app-job-metrics.html) Tanpa Server Amazon *EMR*.

Saat Anda melampirkan aplikasi ke ruang kerja Studio, aplikasi mulai terpicu secara otomatis jika aplikasi tersebut belum berjalan. Anda juga dapat memulai aplikasi terlebih dahulu dan menyiapkannya sebelum Anda melampirkannya ke ruang kerja.

------

## Langkah 3: Lihat UI aplikasi dan log
<a name="gs-output-console"></a>

Untuk melihat UI aplikasi, pertama-tama identifikasi pekerjaan yang dijalankan. Opsi untuk **Spark UI** atau **Hive Tez UI** tersedia di baris pertama opsi untuk pekerjaan itu, berdasarkan jenis pekerjaan. Pilih opsi yang sesuai.

Jika Anda memilih UI Spark, pilih tab **Executors untuk melihat log driver dan pelaksana**. Jika Anda memilih Hive Tez UI, pilih tab **Semua Tugas** untuk melihat log.

Setelah status job run ditampilkan sebagai **Sukses**, Anda dapat melihat output pekerjaan di bucket S3 Anda.

## Langkah 4: Membersihkan
<a name="gs-cleanup-console"></a>

Meskipun aplikasi yang Anda buat harus berhenti otomatis setelah 15 menit tidak aktif, kami tetap menyarankan Anda merilis sumber daya yang tidak ingin Anda gunakan lagi.

Untuk menghapus aplikasi, navigasikan ke halaman **Daftar aplikasi**. Pilih aplikasi yang Anda buat dan pilih **Tindakan → Berhenti** untuk menghentikan aplikasi. Setelah aplikasi dalam `STOPPED` keadaan, pilih aplikasi yang sama dan pilih **Tindakan → Hapus**.

Untuk lebih banyak contoh menjalankan pekerjaan Spark dan Hive, lihat [Menggunakan konfigurasi Spark saat Anda menjalankan pekerjaan EMR Tanpa Server](jobs-spark.md) dan. [Menggunakan konfigurasi Hive saat Anda menjalankan pekerjaan EMR Tanpa Server](jobs-hive.md)