Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Connect ke EMR klaster Amazon dari SageMaker Studio atau Studio Classic
Ilmuwan data dan insinyur data dapat menemukan dan kemudian terhubung ke EMR cluster Amazon langsung dari antarmuka pengguna Studio. Sebelum memulai, pastikan bahwa Anda telah mengonfigurasi izin yang diperlukan seperti yang dijelaskan di Langkah 4: Siapkan izin untuk mengaktifkan daftar dan meluncurkan EMR kluster Amazon dari Studio bagian. Izin ini memberi Studio kemampuan untuk membuat, memulai, melihat, mengakses, dan menghentikan cluster.
Anda dapat menghubungkan EMR klaster Amazon ke JupyterLab notebook baru langsung dari UI Studio, atau memilih untuk memulai koneksi di buku catatan JupyterLab aplikasi yang sedang berjalan.
penting
Anda hanya dapat menemukan dan terhubung ke EMR cluster Amazon untuk JupyterLab dan aplikasi Studio Classic yang diluncurkan dari ruang pribadi. Pastikan EMR klaster Amazon berada di AWS wilayah yang sama dengan lingkungan Studio Anda. JupyterLab Ruang Anda harus menggunakan versi gambar SageMaker Distribusi 1.10
atau lebih tinggi.
Connect ke EMR klaster Amazon menggunakan UI Studio
Untuk menyambung ke klaster menggunakan UI Studio atau Studio Classic, Anda dapat memulai koneksi dari daftar kluster yang diaksesDaftar EMR kluster Amazon dari Studio atau Studio Classic, atau dari buku catatan di SageMaker Studio atau Studio Classic.
Untuk menghubungkan EMR klaster Amazon ke JupyterLab notebook baru dari UI Studio:
-
Di panel sisi kiri Studio UI, pilih simpul Data di menu navigasi kiri. Arahkan ke EMRaplikasi dan cluster Amazon. Ini membuka halaman yang mencantumkan EMR kluster Amazon yang dapat Anda akses dari Studio di tab EMRcluster Amazon.
catatan
Jika Anda atau administrator telah mengonfigurasi izin untuk mengizinkan akses lintas akun ke EMR kluster Amazon, Anda dapat melihat daftar klaster gabungan di semua akun yang telah Anda berikan akses ke Studio.
-
Pilih EMR klaster Amazon yang ingin Anda sambungkan ke buku catatan baru, lalu pilih Lampirkan ke buku catatan. Ini membuka jendela modal yang menampilkan daftar JupyterLab spasi Anda.
-
-
Pilih ruang dari mana Anda ingin meluncurkan JupyterLab aplikasi, dan kemudian pilih Buka notebook. Ini meluncurkan JupyterLab aplikasi dari ruang yang Anda pilih dan membuka notebook baru.
catatan
Pengguna Studio Classic perlu memilih gambar dan kernel. Untuk daftar gambar yang didukung, lihat Gambar dan kernel yang didukung untuk terhubung ke EMR klaster Amazon dari Studio atau Studio Classic atau lihatBawa gambar Anda sendiri.
-
Atau, Anda dapat membuat ruang pribadi baru dengan memilih tombol Buat ruang baru di bagian atas jendela modal. Masukkan nama untuk ruang Anda dan kemudian pilih Buat ruang dan buka buku catatan. Ini menciptakan ruang pribadi dengan jenis instans default dan gambar SageMaker distribusi terbaru yang tersedia, meluncurkan JupyterLab aplikasi, dan membuka buku catatan baru.
-
-
Jika klaster yang Anda pilih tidak menggunakan Kerberos,, atau otentikasi peran runtime LDAP, Studio akan meminta Anda untuk memilih jenis kredensialnya. Pilih dari otentikasi dasar Http atau No credentials, lalu masukkan kredensialnya, jika berlaku.
Jika klaster yang Anda pilih mendukung peran runtime, pilih nama IAM peran yang dapat diasumsikan oleh EMR klaster Amazon Anda untuk menjalankan pekerjaan.
penting
Agar berhasil menghubungkan JupyterLab notebook ke EMR klaster Amazon yang mendukung peran runtime, Anda harus terlebih dahulu mengaitkan daftar peran runtime dengan domain atau profil pengguna, seperti yang diuraikan dalam. Mengonfigurasi peran IAM runtime untuk akses EMR klaster Amazon di Studio Gagal menyelesaikan langkah ini akan mencegah Anda membuat koneksi.
Setelah dipilih, perintah koneksi mengisi sel pertama notebook Anda dan memulai koneksi dengan cluster AmazonEMR.
Setelah koneksi berhasil, sebuah pesan mengkonfirmasi koneksi dan dimulainya aplikasi Spark.
Atau, Anda dapat terhubung ke cluster dari notebook JupyterLab atau Studio Classic.
-
Pilih tombol Cluster di bagian atas notebook Anda. Ini membuka jendela modal yang mencantumkan EMR kluster Amazon dalam
Running
keadaan yang dapat Anda akses. Anda dapat melihat EMR klusterRunning
Amazon di tab EMRcluster Amazon.catatan
Untuk pengguna Studio Classic, Cluster hanya terlihat ketika Anda menggunakan kernel dari Gambar dan kernel yang didukung untuk terhubung ke EMR klaster Amazon dari Studio atau Studio Classic atau dariBawa gambar Anda sendiri. Jika Anda tidak dapat melihat Cluster di bagian atas buku catatan Anda, pastikan administrator Anda telah mengonfigurasi kemampuan untuk dapat ditemukan klaster Anda dan beralih ke kernel yang didukung.
-
Pilih cluster yang ingin Anda sambungkan, lalu pilih Connect.
-
Jika Anda mengonfigurasi EMR klaster Amazon untuk mendukung IAMperan runtime, Anda dapat memilih peran Anda dari menu tarik-turun peran EMR eksekusi Amazon.
penting
Agar berhasil menghubungkan JupyterLab notebook ke EMR klaster Amazon yang mendukung peran runtime, Anda harus terlebih dahulu mengaitkan daftar peran runtime dengan domain atau profil pengguna, seperti yang diuraikan dalam. Mengonfigurasi peran IAM runtime untuk akses EMR klaster Amazon di Studio Gagal menyelesaikan langkah ini akan mencegah Anda membuat koneksi.
Jika tidak, jika cluster yang Anda pilih tidak menggunakan Kerberos,LDAP, atau otentikasi peran runtime, Studio atau Studio Classic meminta Anda untuk memilih jenis kredensialnya. Anda dapat memilih otentikasi HTTP dasar atau No credential.
-
Studio menambahkan dan kemudian menjalankan blok kode ke sel aktif untuk membuat koneksi. Sel ini berisi perintah ajaib koneksi untuk menghubungkan notebook Anda ke aplikasi Anda sesuai dengan jenis otentikasi Anda.
Setelah koneksi berhasil, sebuah pesan mengkonfirmasi koneksi dan dimulainya aplikasi Spark.
Connect ke EMR klaster Amazon menggunakan perintah koneksi
Untuk membuat koneksi ke EMR cluster Amazon, Anda dapat menjalankan perintah koneksi dalam sel notebook.
Saat membuat koneksi, Anda dapat mengautentikasi menggunakan Kerberos, Lightweight Directory Access Protocol (LDAP), atau otentikasi peran runtime IAM. Metode otentikasi yang Anda pilih bergantung pada konfigurasi cluster Anda.
Anda dapat merujuk ke contoh ini Akses Apache Livy menggunakan Network Load Balancer pada kluster Amazon berkemampuan Kerberos untuk menyiapkan EMR klaster Amazon
Jika administrator telah mengaktifkan akses lintas akun, Anda dapat menyambung ke EMR klaster Amazon dari notebook Studio Classic, terlepas dari apakah aplikasi dan klaster Studio Classic berada di AWS akun yang sama atau akun yang berbeda.
Untuk setiap jenis autentikasi berikut, gunakan perintah yang ditentukan untuk menyambung ke klaster Anda dari notebook Studio atau Studio Classic Anda.
-
Kerberos
Tambahkan
--assumable-role-arn
argumen jika Anda memerlukan akses Amazon EMR lintas akun. Tambahkan--verify-certificate
argumen jika Anda terhubung ke cluster Anda denganHTTPS.%load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-id
cluster_id
\ --auth-type Kerberos --language python [--assumable-role-arnEMR_access_role_ARN
] [--verify-certificate/home/user/certificateKey.pem
] -
LDAP
Tambahkan
--assumable-role-arn
argumen jika Anda memerlukan akses Amazon EMR lintas akun. Tambahkan--verify-certificate
argumen jika Anda terhubung ke cluster Anda denganHTTPS.%load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-id
cluster_id
\ --auth-type Basic_Access --language python [--assumable-role-arnEMR_access_role_ARN
] [--verify-certificate/home/user/certificateKey.pem
] -
NoAuth
Tambahkan
--assumable-role-arn
argumen jika Anda memerlukan akses Amazon EMR lintas akun. Tambahkan--verify-certificate
argumen jika Anda terhubung ke cluster Anda denganHTTPS.%load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-id
cluster_id
\ --auth-type None --language python [--assumable-role-arnEMR_access_role_ARN
] [--verify-certificate/home/user/certificateKey.pem
] -
Peran runtime IAM
Tambahkan
--assumable-role-arn
argumen jika Anda memerlukan akses Amazon EMR lintas akun. Tambahkan--verify-certificate
argumen jika Anda terhubung ke cluster Anda denganHTTPS.Untuk informasi selengkapnya tentang menghubungkan ke EMR klaster Amazon menggunakan IAM peran runtime, lihatMengonfigurasi peran IAM runtime untuk akses EMR klaster Amazon di Studio .
%load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-id
cluster_id
\ --auth-type Basic_Access \ --emr-execution-role-arn arn:aws:iam::studio_account_id
:role/emr-execution-role-name
[--assumable-role-arnEMR_access_role_ARN
] [--verify-certificate/home/user/certificateKey.pem
]
Connect ke EMR kluster Amazon HTTPS
Jika Anda telah mengonfigurasi EMR klaster Amazon Anda dengan enkripsi transit diaktifkan dan server Apache Livy untuk HTTPS dan ingin Studio atau Studio Classic berkomunikasi dengan Amazon EMR menggunakanHTTPS, Anda perlu mengonfigurasi Studio atau Studio Classic untuk mengakses kunci sertifikat Anda.
Untuk sertifikat yang ditandatangani sendiri atau ditandatangani oleh Otoritas Sertifikat lokal (CA), Anda dapat melakukannya dalam dua langkah:
-
Unduh PEM file sertifikat Anda ke sistem file lokal Anda menggunakan salah satu opsi berikut:
-
Fungsi unggah file bawaan Jupyter.
-
Sebuah sel notebook.
-
(Hanya untuk pengguna Studio Classic) Skrip konfigurasi siklus hidup (LCC).
Untuk informasi tentang cara menggunakan LCC skrip, lihat Menyesuaikan Instans Notebook Menggunakan Skrip Konfigurasi Siklus Hidup
-
-
Aktifkan validasi sertifikat dengan memberikan jalur ke sertifikat Anda dalam
--verify-certificate
argumen perintah koneksi Anda.%sm_analytics emr connect --cluster-id
cluster_id
\ --verify-certificate/home/user/certificateKey.pem
...
Untuk sertifikat yang diterbitkan CA publik, tetapkan validasi sertifikat dengan menetapkan --verify-certificate
parameter sebagaitrue
.
Atau, Anda dapat menonaktifkan validasi sertifikat dengan menetapkan --verify-certificate
parameter sebagaifalse
.
Anda dapat menemukan daftar perintah koneksi yang tersedia ke EMR cluster Amazon diConnect ke EMR klaster Amazon menggunakan perintah koneksi.