Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mulai cepat: Buat domain SageMaker kotak pasir untuk meluncurkan EMR kluster Amazon di Studio
Bagian ini memandu Anda melalui pengaturan cepat lingkungan pengujian lengkap di Amazon SageMaker Studio. Anda akan membuat domain Studio baru yang memungkinkan pengguna meluncurkan EMR kluster Amazon baru langsung dari Studio. Langkah-langkahnya memberikan contoh buku catatan yang dapat Anda sambungkan ke EMR klaster Amazon untuk mulai berjalan Spark beban kerja. Dengan menggunakan notebook ini, Anda akan membangun Retrieval Augmented Generation System (RAG) menggunakan pemrosesan terdistribusi Amazon EMR Spark dan OpenSearch database vektor.
catatan
Untuk memulai, masuk ke Konsol AWS Manajemen menggunakan akun pengguna AWS Identity and Access Management (IAM) dengan izin admin. Untuk informasi tentang cara mendaftar AWS akun dan membuat pengguna dengan akses administratif, lihatLengkapi SageMaker prasyarat Amazon.
Untuk menyiapkan lingkungan pengujian Studio dan mulai menjalankan Spark pekerjaan:
Langkah 1: Buat SageMaker domain untuk meluncurkan EMR klaster Amazon di Studio
Pada langkah-langkah berikut, Anda menerapkan AWS CloudFormation tumpukan untuk membuat SageMaker domain baru secara otomatis. Tumpukan juga membuat profil pengguna dan mengonfigurasi lingkungan dan izin yang diperlukan. SageMaker Domain dikonfigurasi untuk memungkinkan Anda meluncurkan EMR klaster Amazon secara langsung dari Studio. Untuk contoh ini, EMR cluster Amazon dibuat di AWS
akun yang sama SageMaker tanpa otentikasi. Anda dapat menemukan AWS CloudFormation tumpukan tambahan yang mendukung berbagai metode otentikasi seperti Kerberos di repositori getting_started.
catatan
SageMaker memungkinkan 5 domain Studio per AWS akun dan secara Wilayah AWS default. Pastikan akun Anda memiliki tidak lebih dari 4 domain di wilayah Anda sebelum Anda membuat tumpukan.
Ikuti langkah-langkah berikut untuk menyiapkan SageMaker domain untuk meluncurkan EMR klaster Amazon dari Studio.
-
Unduh file mentah AWS CloudFormation template
ini dari sagemaker-studio-emr
GitHub repositori. -
Pergi ke AWS CloudFormation konsol: https://console.aws.amazon.com/cloudformation
-
Pilih Buat tumpukan dan pilih Dengan sumber daya baru (standar) dari menu tarik-turun.
-
Di Langkah 1:
-
Di bagian Siapkan templat, pilih Pilih templat yang ada.
-
Di bagian Tentukan templat, pilih Unggah file templat.
-
Unggah AWS CloudFormation templat yang diunduh dan pilih Berikutnya.
-
-
Pada Langkah 2, masukkan nama Stack dan SageMakerDomainNamekemudian pilih Berikutnya.
-
Pada Langkah 3, simpan semua nilai default dan pilih Berikutnya.
-
Pada Langkah 4, centang kotak untuk mengakui pembuatan sumber daya dan pilih Buat tumpukan. Ini membuat domain Studio di akun dan wilayah Anda.
Langkah 2: Luncurkan EMR cluster Amazon baru dari Studio UI
Pada langkah-langkah berikut, Anda membuat EMR klaster Amazon baru dari UI Studio.
-
Buka SageMaker konsol di https://console.aws.amazon.com/sagemaker/
dan pilih Domain di menu sebelah kiri. -
Klik nama domain G Anda enerativeAIDomain untuk membuka halaman detail Domain.
-
Luncurkan Studio dari profil pengguna
genai-user
. -
Di panel navigasi kiri, buka Data lalu Amazon EMR Clusters.
-
Di halaman EMR cluster Amazon, pilih Buat. Pilih template SageMaker Studio Domain No Auth yang EMR dibuat oleh AWS CloudFormation tumpukan dan kemudian pilih Berikutnya.
-
Masukkan nama untuk EMR cluster Amazon baru. Opsional memperbarui parameter lain seperti jenis instance core dan master node, idle timeout, atau jumlah node inti.
-
Pilih Buat sumber daya untuk meluncurkan EMR klaster Amazon baru.
Setelah membuat EMR cluster Amazon, ikuti status pada halaman EMRClusters. Saat status berubah
Running/Waiting
, EMR klaster Amazon Anda siap digunakan di Studio.
Langkah 3: Hubungkan JupyterLab notebook ke EMR cluster Amazon
Pada langkah-langkah berikut, Anda menghubungkan notebook JupyterLab ke EMR cluster Amazon yang sedang berjalan. Untuk contoh ini, Anda mengimpor buku catatan yang memungkinkan Anda membangun sistem Retrieval Augmented Generation (RAG) menggunakan pemrosesan terdistribusi Amazon EMR Spark dan OpenSearch database vektor.
-
Peluncuran JupyterLab
Dari Studio, luncurkan JupyterLab aplikasi.
-
Buat ruang pribadi
Jika Anda belum membuat ruang untuk JupyterLab aplikasi Anda, pilih Buat JupyterLab spasi. Masukkan nama untuk spasi, dan pertahankan ruang sebagai Pribadi. Biarkan semua pengaturan lain pada nilai defaultnya, lalu pilih Buat ruang.
Jika tidak, jalankan JupyterLab ruang Anda untuk meluncurkan JupyterLab aplikasi.
-
Terapkan model Anda LLM dan sematkan untuk inferensi
-
Dari menu atas, pilih File, New, dan kemudian Terminal.
-
Di terminal, jalankan perintah berikut.
wget --no-check-certificate https://raw.githubusercontent.com/aws-samples/sagemaker-studio-foundation-models/main/lab-00-setup/Lab_0_Warm_Up_Deploy_EmbeddingModel_Llama2_on_Nvidia.ipynb mkdir AWSGuides cd AWSGuides wget --no-check-certificate https://raw.githubusercontent.com/aws-samples/sagemaker-studio-foundation-models/main/lab-03-rag/AWSGuides/AmazonSageMakerDeveloperGuide.pdf wget --no-check-certificate https://raw.githubusercontent.com/aws-samples/sagemaker-studio-foundation-models/main/lab-03-rag/AWSGuides/EC2DeveloperGuide.pdf wget --no-check-certificate https://raw.githubusercontent.com/aws-samples/sagemaker-studio-foundation-models/main/lab-03-rag/AWSGuides/S3DeveloperGuide.pdf
Ini mengambil
Lab_0_Warm_Up_Deploy_EmbeddingModel_Llama2_on_Nvidia.ipynb
buku catatan ke direktori lokal Anda dan mengunduh tiga PDF file keAWSGuides
folder lokal. -
Buka
lab-00-setup/Lab_0_Warm_Up_Deploy_EmbeddingModel_Llama2_on_Nvidia.ipynb
, simpanPython 3 (ipykernel)
kernel, dan jalankan setiap sel.Awas
Di bagian Perjanjian Lisensi Llama 2, pastikan untuk menerima Llama2 EULA sebelum Anda melanjutkan.
Notebook ini menyebarkan dua model,
Llama 2
danall-MiniLM-L6-v2 Models
,ml.g5.2xlarge
untuk inferensi.Penyebaran model dan pembuatan titik akhir mungkin memakan waktu.
-
-
Buka buku catatan utama Anda
Masuk JupyterLab, buka terminal Anda dan jalankan perintah berikut.
cd .. wget --no-check-certificate https://raw.githubusercontent.com/aws-samples/sagemaker-studio-foundation-models/main/lab-03-rag/Lab_3_RAG_on_SageMaker_Studio_using_EMR.ipynb
Anda akan melihat
Lab_3_RAG_on_SageMaker_Studio_using_EMR.ipynb
notebook tambahan di panel kiri JupyterLab. -
Pilih
PySpark
kernelBuka
Lab_3_RAG_on_SageMaker_Studio_using_EMR.ipynb
buku catatan Anda dan pastikan Anda menggunakanSparkMagic PySpark
kernel. Anda dapat mengganti kernel di kanan atas notebook Anda. Pilih nama kernel saat ini untuk membuka modal pemilihan kernel, lalu pilihSparkMagic PySpark
. -
Hubungkan notebook Anda ke cluster
-
Di kanan atas notebook Anda, pilih Cluster. Tindakan ini membuka jendela modal yang mencantumkan semua cluster yang berjalan yang Anda memiliki izin untuk mengakses.
-
Pilih klaster Anda lalu pilih Connect. Jendela modal pemilihan tipe kredensi baru terbuka.
-
Pilih No credential lalu Connect.
-
Sel notebook secara otomatis mengisi dan berjalan. Sel notebook memuat
sagemaker_studio_analytics_extension.magics
ekstensi, yang menyediakan fungsionalitas untuk terhubung ke EMR cluster Amazon. Kemudian menggunakan perintah%sm_analytics
ajaib untuk memulai koneksi ke EMR cluster Amazon Anda dan aplikasi Spark.catatan
Pastikan string koneksi ke EMR kluster Amazon Anda memiliki jenis otentikasi yang disetel ke
None
. Ini diilustrasikan oleh nilai--auth-type None
dalam contoh berikut. Anda dapat memodifikasi bidang jika perlu.%load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --verify-certificate False --cluster-id
your-cluster-id
--auth-typeNone
--language python -
Setelah Anda berhasil membuat koneksi, pesan keluaran sel koneksi Anda akan menampilkan
SparkSession
detail Anda termasuk ID cluster, IDYARN
aplikasi, dan tautan ke Spark UI untuk memantau Spark pekerjaan.
-
Anda siap menggunakan Lab_3_RAG_on_SageMaker_Studio_using_EMR.ipynb
notebook. Notebook contoh ini menjalankan PySpark beban kerja terdistribusi untuk membangun RAG sistem menggunakan LangChain dan OpenSearch.
Langkah 4: Bersihkan AWS CloudFormation tumpukan Anda
Setelah Anda selesai, pastikan untuk mengakhiri dua titik akhir Anda dan menghapus AWS CloudFormation tumpukan Anda untuk mencegah biaya lanjutan. Menghapus tumpukan membersihkan semua sumber daya yang disediakan oleh tumpukan.
Untuk menghapus AWS CloudFormation tumpukan Anda ketika Anda selesai dengan itu
-
Pergi ke AWS CloudFormation konsol: https://console.aws.amazon.com/cloudformation
-
Pilih tumpukan yang ingin Anda hapus. Anda dapat mencarinya dengan nama atau menemukannya di daftar tumpukan.
-
Klik tombol Delete untuk menyelesaikan penghapusan tumpukan dan kemudian Hapus lagi untuk mengakui bahwa ini akan menghapus semua sumber daya yang dibuat oleh tumpukan.
Tunggu penghapusan tumpukan selesai. Ini bisa memakan waktu beberapa menit. AWS CloudFormation secara otomatis membersihkan semua sumber daya yang ditentukan dalam template tumpukan.
-
Verifikasi bahwa semua sumber daya yang dibuat oleh tumpukan telah dihapus. Misalnya, periksa klaster Amazon EMR yang tersisa.
Untuk menghapus API titik akhir untuk model
-
Pergi ke SageMaker konsol: https://console.aws.amazon.com/sagemaker/
. -
Di panel navigasi kiri, pilih Inferensi dan kemudian Titik Akhir.
-
Pilih titik akhir
hf-allminil6v2-embedding-ep
dan kemudian pilih Hapus di daftar drop-down Tindakan. Ulangi langkah untuk titik akhirmeta-llama2-7b-chat-tg-ep
.