Pemecahan masalah AI generatif untuk Apache Spark in Glue AWS - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pemecahan masalah AI generatif untuk Apache Spark in Glue AWS

Pemecahan masalah AI generatif untuk pratinjau Apache Spark tersedia untuk pekerjaan yang berjalan di AWS Glue 4.0, dan di AWS Wilayah berikut: AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (Oregon), AS Barat (California N.), Eropa (Irlandia), Eropa (Stockholm), Asia Pasifik (Tokyo), Asia Pasifik (Mumbai), dan Asia Pasifik (Sydney). Fitur pratinjau dapat berubah.

Pemecahan Masalah AI Generatif untuk pekerjaan Apache Spark di AWS Glue adalah kemampuan baru yang membantu insinyur data dan ilmuwan mendiagnosis dan memperbaiki masalah dalam aplikasi Spark mereka dengan mudah. Memanfaatkan pembelajaran mesin dan teknologi AI generatif, fitur ini menganalisis masalah dalam pekerjaan Spark dan memberikan analisis akar penyebab terperinci bersama dengan rekomendasi yang dapat ditindaklanjuti untuk menyelesaikan masalah tersebut.

Bagaimana cara kerja Pemecahan Masalah Generatif AI untuk Apache Spark?

Untuk pekerjaan Spark Anda yang gagal, Pemecahan Masalah Generatif AI menganalisis metadata pekerjaan dan metrik serta log tepat yang terkait dengan tanda tangan kesalahan pekerjaan Anda untuk menghasilkan analisis akar penyebab, dan merekomendasikan solusi dan praktik terbaik khusus untuk membantu mengatasi kegagalan pekerjaan.

Menyiapkan Pemecahan Masalah AI Generatif untuk Apache Spark untuk pekerjaan Anda

catatan

Selama pratinjau, fitur ini membantu memecahkan masalah pekerjaan AWS Glue 4.0 yang gagal dalam 30 menit pertama dari waktu eksekusi mereka.

Mengonfigurasi izin IAM

Memberikan izin untuk yang APIs digunakan oleh Spark Troubleshooting untuk pekerjaan Anda di AWS Glue memerlukan izin IAM yang sesuai. Anda dapat memperoleh izin dengan melampirkan AWS kebijakan kustom berikut ke identitas IAM Anda (seperti pengguna, peran, atau grup).

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "glue:StartCompletion", "glue:GetCompletion" ], "Resource": [ "arn:aws:glue:*:*:completion/*" ] } ] }
catatan

Selama pratinjau, Pemecahan Masalah Spark tidak APIs tersedia melalui AWS SDK yang dapat Anda gunakan secara terprogram. Dua berikut ini APIs digunakan dalam kebijakan IAM untuk mengaktifkan pengalaman ini melalui AWS Glue Studio Console: StartCompletion dan. GetCompletion

Menetapkan izin

Untuk memberikan akses dan menambahkan izin bagi pengguna, grup, atau peran Anda:

Menjalankan analisis pemecahan masalah dari pekerjaan yang gagal dijalankan

Anda dapat mengakses fitur pemecahan masalah melalui beberapa jalur di konsol AWS Glue. Berikut cara memulai:

Opsi 1: Dari halaman Daftar Pekerjaan

  1. Buka konsol AWS Glue di https://console.aws.amazon.com/glue/.

  2. Di panel navigasi, pilih ETL Jobs.

  3. Temukan pekerjaan Anda yang gagal di daftar pekerjaan.

  4. Pilih tab Runs di bagian detail pekerjaan.

  5. Klik pada tugas gagal yang ingin Anda analisis.

  6. Pilih Troubleshoot dengan AI untuk memulai analisis.

  7. Saat analisis pemecahan masalah selesai, Anda dapat melihat analisis akar penyebab dan rekomendasi di tab Analisis pemecahan masalah di bagian bawah layar.

GIF menunjukkan implementasi ujung ke ujung dari proses yang gagal dan pemecahan masalah dengan fitur AI yang berjalan.

Opsi 2: Menggunakan halaman Job Run Monitoring

  1. Arahkan ke halaman pemantauan Job run.

  2. Temukan pekerjaan Anda yang gagal dijalankan.

  3. Pilih menu tarik-turun Tindakan.

  4. Pilih Troubleshoot dengan AI.

GIF menunjukkan implementasi ujung ke ujung dari proses yang gagal dan pemecahan masalah dengan fitur AI yang berjalan.

Opsi 3: Dari halaman Detail Job Run

  1. Arahkan ke halaman detail job run yang gagal dengan mengklik Lihat detail pada proses gagal dari tab Runs atau memilih pekerjaan yang dijalankan dari halaman pemantauan Job run.

  2. Di halaman rincian pekerjaan, temukan tab Analisis pemecahan masalah.

Kategori pemecahan masalah yang didukung (pratinjau)

Layanan ini berfokus pada tiga kategori utama masalah yang sering dihadapi oleh insinyur dan pengembang data dalam aplikasi Spark mereka:

  • Penyiapan sumber daya dan kesalahan akses: Saat menjalankan aplikasi Spark di AWS Glue, pengaturan sumber daya dan kesalahan akses adalah salah satu masalah yang paling umum namun menantang untuk didiagnosis. Kesalahan ini sering terjadi ketika aplikasi Spark Anda mencoba berinteraksi dengan AWS sumber daya tetapi mengalami masalah izin, sumber daya yang hilang, atau masalah konfigurasi.

  • Masalah driver Spark dan memori pelaksana: Kesalahan terkait memori dalam pekerjaan Apache Spark bisa rumit untuk didiagnosis dan diselesaikan. Kesalahan ini sering muncul ketika persyaratan pemrosesan data Anda melebihi sumber daya memori yang tersedia, baik pada node driver atau node pelaksana.

  • Masalah kapasitas disk percikan: Kesalahan terkait penyimpanan dalam pekerjaan AWS Glue Spark sering muncul selama operasi shuffle, tumpahan data, atau saat berhadapan dengan transformasi data skala besar. Kesalahan ini bisa sangat rumit karena mungkin tidak terwujud sampai pekerjaan Anda berjalan untuk sementara waktu, berpotensi membuang-buang waktu dan sumber daya komputasi yang berharga.

catatan

Sebelum menerapkan perubahan yang disarankan di lingkungan produksi Anda, tinjau perubahan yang disarankan secara menyeluruh. Layanan ini memberikan rekomendasi berdasarkan pola dan praktik terbaik, tetapi kasus penggunaan spesifik Anda mungkin memerlukan pertimbangan tambahan.