Panduan pengguna - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Panduan pengguna

Bagian ini mencakup cara ilmuwan data dan teknisi data dapat meluncurkan, menemukan, menghubungkan, atau menghentikan EMR klaster Amazon dari Studio atau Studio Classic.

Sebelum pengguna dapat membuat daftar atau meluncurkan cluster, administrator harus telah mengonfigurasi pengaturan yang diperlukan di lingkungan Studio. Untuk informasi tentang cara administrator dapat mengonfigurasi lingkungan Studio agar memungkinkan penyediaan sendiri dan pencantuman klaster AmazonEMR, lihat. Panduan admin

Gambar dan kernel yang didukung untuk terhubung ke EMR klaster Amazon dari Studio atau Studio Classic

Gambar dan kernel berikut disertakan sagemaker-studio-analytics-extension, JupyterLab ekstensi yang terhubung ke cluster Spark EMR (Amazon) jarak jauh melalui SparkMagicperpustakaan menggunakan Apache Livy.

  • Untuk pengguna Studio: SageMaker Distribusi adalah lingkungan Docker untuk ilmu data yang digunakan sebagai gambar default instance JupyterLab notebook. Semua versi SageMakerDistribusi dilengkapi dengan sagemaker-studio-analytics-extension pra-instal.

  • Untuk pengguna Studio Classic: Gambar-gambar berikut sudah diinstal sebelumnya dengansagemaker-studio-analytics-extension:

    • DataScience — Kernel Python 3

    • DataScience 2.0 — Kernel Python 3

    • DataScience 3.0 — Kernel Python 3

    • SparkAnalytics 1.0 — SparkMagic dan PySpark kernel

    • SparkAnalytics 2.0 — SparkMagic dan PySpark kernel

    • SparkMagic — SparkMagic dan PySpark kernel

    • PyTorch 1.8 - Python 3 kernel

    • TensorFlow 2.6 — Kernel Python 3

    • TensorFlow 2.11 — Kernel Python 3

Untuk terhubung ke EMR kluster Amazon menggunakan gambar bawaan lain atau gambar Anda sendiri, ikuti instruksi diBawa gambar Anda sendiri.

Bawa gambar Anda sendiri

Untuk membawa gambar Anda sendiri di Studio atau Studio Classic dan memungkinkan notebook Anda terhubung ke EMR kluster Amazon, instal sagemaker-studio-analytics-extensionekstensi berikut ke kernel Anda. Ini mendukung menghubungkan notebook SageMaker Studio atau Studio Classic ke cluster Spark EMR (Amazon) melalui perpustakaan. SparkMagic

pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension

Selain itu, untuk terhubung ke Amazon EMR dengan otentikasi Kerberos, Anda harus menginstal klien kinit. Tergantung pada OS Anda, perintah untuk menginstal klien kinit dapat bervariasi. Untuk membawa gambar Ubuntu (berbasis Debian), gunakan apt-get install -y -qq krb5-user perintah.

Untuk informasi selengkapnya tentang membawa gambar Anda sendiri di SageMaker Studio atau Studio Classic, lihat Membawa SageMaker gambar Anda sendiri.