Mulai cepat: Buat domain SageMaker kotak pasir untuk meluncurkan EMR kluster Amazon di Studio - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mulai cepat: Buat domain SageMaker kotak pasir untuk meluncurkan EMR kluster Amazon di Studio

Bagian ini memandu Anda melalui pengaturan cepat lingkungan pengujian lengkap di Amazon SageMaker Studio. Anda akan membuat domain Studio baru yang memungkinkan pengguna meluncurkan EMR kluster Amazon baru langsung dari Studio. Langkah-langkahnya memberikan contoh buku catatan yang dapat Anda sambungkan ke EMR klaster Amazon untuk mulai menjalankan Spark beban kerja. Dengan menggunakan notebook ini, Anda akan membangun Retrieval Augmented Generation System (RAG) menggunakan pemrosesan terdistribusi Amazon EMR Spark dan OpenSearch database vektor.

catatan

Untuk memulai, masuk ke Konsol AWS Manajemen menggunakan akun pengguna AWS Identity and Access Management (IAM) dengan izin admin. Untuk informasi tentang cara mendaftar AWS akun dan membuat pengguna dengan akses administratif, lihat SageMaker Prasyarat Amazon.

Langkah 1: Buat SageMaker domain untuk meluncurkan EMR klaster Amazon di Studio

Pada langkah-langkah berikut, Anda menerapkan AWS CloudFormation tumpukan untuk membuat SageMaker domain baru secara otomatis. Tumpukan juga membuat profil pengguna dan mengonfigurasi lingkungan dan izin yang diperlukan. SageMaker Domain dikonfigurasi untuk memungkinkan Anda meluncurkan EMR klaster Amazon secara langsung dari Studio. Untuk contoh ini, EMR cluster Amazon dibuat di AWS akun yang sama SageMaker tanpa otentikasi. Anda dapat menemukan AWS CloudFormation tumpukan tambahan yang mendukung berbagai metode otentikasi seperti Kerberos di repositori getting_started. GitHub

catatan

SageMaker memungkinkan 5 domain Studio per AWS akun dan secara Wilayah AWS default. Pastikan akun Anda memiliki tidak lebih dari 4 domain di wilayah Anda sebelum Anda membuat tumpukan.

Ikuti langkah-langkah berikut untuk menyiapkan SageMaker domain untuk meluncurkan EMR klaster Amazon dari Studio.
  1. Unduh file mentah AWS CloudFormation template ini dari sagemaker-studio-emr GitHub repositori.

  2. Pergi ke AWS CloudFormation konsol: https://console.aws.amazon.com/cloudformation

  3. Pilih Buat tumpukan dan pilih Dengan sumber daya baru (standar) dari menu tarik-turun.

  4. Di Langkah 1:

    1. Di bagian Siapkan templat, pilih Pilih templat yang ada.

    2. Di bagian Tentukan templat, pilih Unggah file templat.

    3. Unggah AWS CloudFormation templat yang diunduh dan pilih Berikutnya.

  5. Pada Langkah 2, masukkan nama Stack dan SageMakerDomainNamekemudian pilih Berikutnya.

  6. Pada Langkah 3, simpan semua nilai default dan pilih Berikutnya.

  7. Pada Langkah 4, centang kotak untuk mengakui pembuatan sumber daya dan pilih Buat tumpukan. Ini membuat domain Studio di akun dan wilayah Anda.

Langkah 2: Luncurkan EMR cluster Amazon baru dari Studio UI

Pada langkah-langkah berikut, Anda membuat EMR klaster Amazon baru dari UI Studio.

  1. Buka SageMaker konsol di https://console.aws.amazon.com/sagemaker/dan pilih Domain di menu sebelah kiri.

  2. Klik nama domain G Anda enerativeAIDomain untuk membuka halaman detail Domain.

  3. Luncurkan Studio dari profil penggunagenai-user.

  4. Di panel navigasi kiri, buka Data lalu Amazon EMR Clusters.

  5. Di halaman EMR cluster Amazon, pilih Buat. Pilih template SageMaker Studio Domain No Auth yang EMR dibuat oleh AWS CloudFormation tumpukan dan kemudian pilih Berikutnya.

  6. Masukkan nama untuk EMR cluster Amazon baru. Opsional memperbarui parameter lain seperti jenis instance core dan master node, idle timeout, atau jumlah node inti.

  7. Pilih Buat sumber daya untuk meluncurkan EMR klaster Amazon baru.

    Setelah membuat EMR cluster Amazon, ikuti status di halaman EMRClusters. Saat status berubahRunning/Waiting, EMR klaster Amazon Anda siap digunakan di Studio.

Langkah 3: Hubungkan JupyterLab notebook ke EMR cluster Amazon

Pada langkah-langkah berikut, Anda menghubungkan notebook JupyterLab ke EMR cluster Amazon yang sedang berjalan. Untuk contoh ini, Anda mengimpor buku catatan yang memungkinkan Anda membangun sistem Retrieval Augmented Generation (RAG) menggunakan pemrosesan terdistribusi Amazon EMR Spark dan OpenSearch database vektor.

  1. Peluncuran JupyterLab

    Dari Studio, luncurkan JupyterLab aplikasi.

  2. Buat ruang pribadi

    Jika Anda belum membuat ruang untuk JupyterLab aplikasi Anda, pilih Buat JupyterLab spasi. Masukkan nama untuk spasi, dan pertahankan ruang sebagai Pribadi. Biarkan semua pengaturan lain pada nilai defaultnya, lalu pilih Buat ruang.

    Jika tidak, jalankan JupyterLab ruang Anda untuk meluncurkan JupyterLab aplikasi.

  3. Terapkan model Anda LLM dan sematkan untuk inferensi
    • Dari menu atas, pilih File, New, dan kemudian Terminal.

    • Di terminal, jalankan perintah berikut.

      wget --no-check-certificate https://raw.githubusercontent.com/aws-samples/sagemaker-studio-foundation-models/main/lab-00-setup/Lab_0_Warm_Up_Deploy_EmbeddingModel_Llama2_on_Nvidia.ipynb mkdir AWSGuides cd AWSGuides wget --no-check-certificate https://raw.githubusercontent.com/aws-samples/sagemaker-studio-foundation-models/main/lab-03-rag/AWSGuides/AmazonSageMakerDeveloperGuide.pdf wget --no-check-certificate https://raw.githubusercontent.com/aws-samples/sagemaker-studio-foundation-models/main/lab-03-rag/AWSGuides/EC2DeveloperGuide.pdf wget --no-check-certificate https://raw.githubusercontent.com/aws-samples/sagemaker-studio-foundation-models/main/lab-03-rag/AWSGuides/S3DeveloperGuide.pdf

      Ini mengambil Lab_0_Warm_Up_Deploy_EmbeddingModel_Llama2_on_Nvidia.ipynb buku catatan ke direktori lokal Anda dan mengunduh tiga PDF file ke AWSGuides folder lokal.

    • Bukalab-00-setup/Lab_0_Warm_Up_Deploy_EmbeddingModel_Llama2_on_Nvidia.ipynb, simpan Python 3 (ipykernel) kernel, dan jalankan setiap sel.

      Awas

      Di bagian Perjanjian Lisensi Llama 2, pastikan untuk menerima Llama2 EULA sebelum Anda melanjutkan.

      Notebook ini menyebarkan dua model, Llama 2 danall-MiniLM-L6-v2 Models, ml.g5.2xlarge untuk inferensi.

      Penyebaran model dan pembuatan titik akhir mungkin memakan waktu.

  4. Buka buku catatan utama Anda

    Masuk JupyterLab, buka terminal Anda dan jalankan perintah berikut.

    cd .. wget --no-check-certificate https://raw.githubusercontent.com/aws-samples/sagemaker-studio-foundation-models/main/lab-03-rag/Lab_3_RAG_on_SageMaker_Studio_using_EMR.ipynb

    Anda akan melihat Lab_3_RAG_on_SageMaker_Studio_using_EMR.ipynb notebook tambahan di panel kiri JupyterLab.

  5. Pilih PySpark kernel

    Buka Lab_3_RAG_on_SageMaker_Studio_using_EMR.ipynb buku catatan Anda dan pastikan Anda menggunakan SparkMagic PySpark kernel. Anda dapat mengganti kernel di kanan atas notebook Anda. Pilih nama kernel saat ini untuk membuka modal pemilihan kernel, lalu pilihSparkMagic PySpark.

  6. Hubungkan notebook Anda ke cluster
    1. Di kanan atas notebook Anda, pilih Cluster. Tindakan ini membuka jendela modal yang mencantumkan semua cluster yang berjalan yang Anda memiliki izin untuk mengakses.

    2. Pilih klaster Anda lalu pilih Connect. Jendela modal pemilihan tipe kredensi baru terbuka.

    3. Pilih No credential dan kemudian Connect.

      Modal yang menunjukkan pilihan EMR kredensi Amazon untuk JupyterLab notebook.
    4. Sel notebook secara otomatis mengisi dan berjalan. Sel notebook memuat sagemaker_studio_analytics_extension.magics ekstensi, yang menyediakan fungsionalitas untuk terhubung ke EMR cluster Amazon. Kemudian menggunakan perintah %sm_analytics ajaib untuk memulai koneksi ke EMR cluster Amazon Anda dan aplikasi Spark.

      catatan

      Pastikan string koneksi ke EMR kluster Amazon Anda memiliki jenis otentikasi yang disetel keNone. Ini diilustrasikan oleh nilai --auth-type None dalam contoh berikut. Anda dapat memodifikasi bidang jika perlu.

      %load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --verify-certificate False --cluster-id your-cluster-id --auth-type None --language python
    5. Setelah Anda berhasil membuat koneksi, pesan keluaran sel koneksi Anda akan menampilkan SparkSession detail Anda termasuk ID klaster, ID YARN aplikasi, dan tautan ke Spark UI untuk memantau Spark pekerjaan Anda.

Anda siap menggunakan Lab_3_RAG_on_SageMaker_Studio_using_EMR.ipynb notebook. Notebook contoh ini menjalankan PySpark beban kerja terdistribusi untuk membangun RAG sistem menggunakan LangChain dan OpenSearch.

Langkah 4: Bersihkan AWS CloudFormation tumpukan Anda

Setelah Anda selesai, pastikan untuk mengakhiri dua titik akhir Anda dan menghapus AWS CloudFormation tumpukan Anda untuk mencegah biaya lanjutan. Menghapus tumpukan membersihkan semua sumber daya yang disediakan oleh tumpukan.

Untuk menghapus AWS CloudFormation tumpukan Anda ketika Anda selesai dengan itu
  1. Pergi ke AWS CloudFormation konsol: https://console.aws.amazon.com/cloudformation

  2. Pilih tumpukan yang ingin Anda hapus. Anda dapat mencarinya dengan nama atau menemukannya di daftar tumpukan.

  3. Klik tombol Delete untuk menyelesaikan penghapusan tumpukan dan kemudian Hapus lagi untuk mengakui bahwa ini akan menghapus semua sumber daya yang dibuat oleh tumpukan.

    Tunggu penghapusan tumpukan selesai. Ini bisa memakan waktu beberapa menit. AWS CloudFormation secara otomatis membersihkan semua sumber daya yang ditentukan dalam template tumpukan.

  4. Verifikasi bahwa semua sumber daya yang dibuat oleh tumpukan telah dihapus. Misalnya, periksa klaster Amazon EMR yang tersisa.

Untuk menghapus API titik akhir untuk model
  1. Pergi ke SageMaker konsol: https://console.aws.amazon.com/sagemaker/.

  2. Di panel navigasi kiri, pilih Inferensi dan kemudian Titik Akhir.

  3. Pilih titik akhir hf-allminil6v2-embedding-ep dan kemudian pilih Hapus di daftar drop-down Tindakan. Ulangi langkah untuk titik akhirmeta-llama2-7b-chat-tg-ep.