Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Dimulai dengan versi gambar SageMaker distribusi1.10
, Amazon SageMaker Studio terintegrasi dengan EMR Tanpa Server. Dalam JupyterLab notebook di SageMaker Studio, ilmuwan data dan insinyur data dapat menemukan dan terhubung ke aplikasi EMR Tanpa Server, kemudian secara interaktif mengeksplorasi, memvisualisasikan, dan menyiapkan beban kerja Apache Spark atau Apache Hive skala besar. Integrasi ini memungkinkan untuk melakukan prapemrosesan data interaktif dalam skala besar dalam persiapan untuk pelatihan dan penerapan model ML.
Secara khusus, versi terbaru dari versi gambar distribusi SageMaker AI1.10
memanfaatkan integrasi antara Apache Livy dan EMR Serverless, memungkinkan koneksi ke titik akhir Apache Livy melalui notebook. sagemaker-studio-analytics-extension
penting
Saat menggunakan Studio, Anda hanya dapat menemukan dan terhubung ke aplikasi EMR Tanpa Server untuk JupyterLab aplikasi yang diluncurkan dari ruang pribadi. Pastikan aplikasi EMR Tanpa Server berada di AWS wilayah yang sama dengan lingkungan Studio Anda.
Prasyarat
Sebelum Anda mulai menjalankan beban kerja interaktif dengan EMR Serverless dari notebook JupyterLab Anda, pastikan Anda memenuhi prasyarat berikut:
-
JupyterLab Ruang Anda harus menggunakan versi gambar SageMaker Distribusi
1.10
atau lebih tinggi. -
Buat aplikasi interaktif EMR Tanpa Server dengan versi Amazon EMR atau lebih tinggi.
6.14.0
Anda dapat membuat aplikasi EMR Tanpa Server dari antarmuka pengguna Studio dengan mengikuti langkah-langkahnya. Buat aplikasi EMR Tanpa Server dari Studiocatatan
Untuk pengaturan yang paling sederhana, Anda dapat membuat aplikasi EMR Tanpa Server di UI Studio tanpa mengubah pengaturan default apa pun untuk opsi Virtual private cloud (VPC). Ini memungkinkan aplikasi dibuat dalam VPC domain Anda tanpa memerlukan konfigurasi jaringan apa pun. Dalam hal ini, Anda dapat melewati langkah pengaturan jaringan berikut.
-
Tinjau persyaratan jaringan dan keamanan diKonfigurasikan akses jaringan untuk kluster EMR Amazon Anda. Secara khusus, pastikan bahwa Anda:
-
Buat koneksi peering VPC antara akun Studio Anda dan akun EMR Tanpa Server Anda.
-
Tambahkan rute ke tabel rute subnet pribadi di kedua akun.
-
Siapkan grup keamanan yang dilampirkan ke domain Studio Anda untuk mengizinkan lalu lintas keluar, dan konfigurasikan grup keamanan VPC tempat Anda berencana menjalankan aplikasi EMR Tanpa Server untuk mengizinkan lalu lintas TCP masuk dari grup keamanan instans Studio.
-
-
Untuk mengakses aplikasi interaktif di EMR Tanpa Server dan menjalankan beban kerja yang dikirimkan dari JupyterLab buku catatan di SageMaker Studio, Anda harus menetapkan izin dan peran tertentu. Lihat Siapkan izin untuk mengaktifkan daftar dan meluncurkan aplikasi Amazon EMR dari Studio SageMaker bagian untuk detail tentang peran dan izin yang diperlukan.