Membuat instance SageMaker notebook Amazon - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Membuat instance SageMaker notebook Amazon

penting

Kebijakan IAM khusus yang memungkinkan Amazon SageMaker Studio atau Amazon SageMaker Studio Classic membuat SageMaker sumber daya Amazon juga harus memberikan izin untuk menambahkan tag ke sumber daya tersebut. Izin untuk menambahkan tag ke sumber daya diperlukan karena Studio dan Studio Classic secara otomatis menandai sumber daya apa pun yang mereka buat. Jika kebijakan IAM memungkinkan Studio dan Studio Classic membuat sumber daya tetapi tidak mengizinkan penandaan, kesalahan "AccessDenied" dapat terjadi saat mencoba membuat sumber daya. Untuk informasi selengkapnya, lihat Berikan Izin untuk Sumber Daya Penandaan SageMaker.

AWS Kebijakan Terkelola untuk Amazon SageMakeryang memberikan izin untuk membuat SageMaker sumber daya sudah menyertakan izin untuk menambahkan tag saat membuat sumber daya tersebut.

Instance SageMaker notebook Amazon adalah instance komputasi ML yang menjalankan aplikasi Jupyter Notebook. SageMaker mengelola pembuatan instance dan sumber daya terkait. Gunakan notebook Jupyter dalam instance notebook Anda untuk:

  • menyiapkan dan memproses data

  • tulis kode untuk melatih model

  • menyebarkan model ke hosting SageMaker

  • menguji atau memvalidasi model Anda

Untuk membuat instance notebook, gunakan SageMaker konsol atau CreateNotebookInstanceAPI.

Jenis instans notebook yang Anda pilih bergantung pada cara Anda menggunakan instance notebook Anda. Pastikan instance notebook Anda tidak terikat oleh memori, CPU, atau IO. Untuk memuat kumpulan data ke dalam memori pada instance notebook untuk eksplorasi atau pra-pemrosesan, pilih jenis instans dengan memori RAM yang cukup untuk kumpulan data Anda. Ini membutuhkan instance dengan setidaknya 16 GB memori (.xlarge atau lebih besar). Jika Anda berencana menggunakan notebook untuk pra-pemrosesan intensif komputasi, kami sarankan Anda memilih instance yang dioptimalkan komputasi seperti c4 atau c5.

Praktik terbaik saat menggunakan SageMaker notebook adalah dengan menggunakan instance notebook untuk mengatur layanan lain. AWS Misalnya, Anda dapat menggunakan instance notebook untuk mengelola pemrosesan kumpulan data besar. Untuk melakukan ini, lakukan panggilan ke AWS Glue untuk layanan ETL (ekstrak, transformasi, dan muat) atau Amazon EMR untuk pemetaan dan pengurangan data menggunakan Hadoop. Anda dapat menggunakan AWS layanan sebagai bentuk perhitungan atau penyimpanan sementara untuk data Anda.

Anda dapat menyimpan dan mengambil data pelatihan dan pengujian menggunakan bucket Amazon Simple Storage Service. Anda kemudian dapat menggunakannya SageMaker untuk melatih dan membangun model Anda. Akibatnya, jenis instance notebook Anda tidak akan berpengaruh pada kecepatan pelatihan dan pengujian model Anda.

Setelah menerima permintaan, SageMaker lakukan hal berikut:

  • Membuat antarmuka jaringan —Jika Anda memilih konfigurasi VPC opsional SageMaker , buat antarmuka jaringan di VPC Anda. Ini menggunakan ID subnet yang Anda berikan dalam permintaan untuk menentukan Availability Zone mana untuk membuat subnet. SageMaker mengaitkan grup keamanan yang Anda berikan dalam permintaan dengan subnet. Untuk informasi selengkapnya, lihat Hubungkan Instance Notebook di VPC ke Sumber Daya Eksternal.

  • Meluncurkan instance komputasi SageMaker ML-meluncurkan instance komputasi HTML di VPC. SageMaker SageMaker melakukan tugas konfigurasi yang memungkinkannya mengelola instance notebook Anda. Jika Anda menentukan VPC Anda, SageMaker aktifkan lalu lintas antara VPC Anda dan instance notebook.

  • Menginstal paket dan pustaka Anaconda untuk platform pembelajaran mendalam umum — SageMaker menginstal semua paket Anaconda yang disertakan dalam penginstal. Untuk informasi lebih lanjut, lihat daftar paket Anaconda. SageMaker juga menginstal pustaka pembelajaran TensorFlow mendalam dan Apache MXNet.

  • Melampirkan volume penyimpanan SageMaker ML-melampirkan volume penyimpanan ML ke instans komputasi ML. Anda dapat menggunakan volume sebagai area kerja untuk membersihkan kumpulan data pelatihan atau untuk sementara menyimpan validasi, pengujian, atau data lainnya. Pilih ukuran apa pun antara 5 GB dan 16384 GB, dengan peningkatan 1 GB, untuk volume. Defaultnya adalah 5 GB. Volume penyimpanan ML dienkripsi, sehingga tidak SageMaker dapat menentukan jumlah ruang kosong yang tersedia pada volume. Karena itu, Anda dapat meningkatkan ukuran volume saat memperbarui instance notebook, tetapi Anda tidak dapat mengurangi ukuran volume. Jika Anda ingin mengurangi ukuran volume penyimpanan ML yang digunakan, buat instance notebook baru dengan ukuran yang diinginkan.

    Hanya file dan data yang disimpan dalam /home/ec2-user/SageMaker folder yang bertahan di antara sesi instance notebook. File dan data yang disimpan di luar direktori ini akan ditimpa saat instance notebook berhenti dan dimulai ulang. Setiap direktori /tmp instance notebook menyediakan minimal 10 GB penyimpanan di penyimpanan instance. Penyimpanan instance adalah penyimpanan sementara, tingkat blok yang tidak persisten. Ketika instance dihentikan atau dimulai ulang, SageMaker menghapus isi direktori. Penyimpanan sementara ini adalah bagian dari volume root dari instance notebook.

    Jika jenis instance yang digunakan oleh instance notebook memiliki dukungan NVMe, pelanggan dapat menggunakan volume penyimpanan instans NVMe yang tersedia untuk jenis instance tersebut. Untuk instance dengan volume penyimpanan NVMe, semua volume penyimpanan instans secara otomatis dilampirkan ke instance saat peluncuran. Untuk informasi selengkapnya tentang jenis instans dan volume penyimpanan NVMe terkait, lihat Detail Jenis Instance Amazon Elastic Compute Cloud.

    Untuk membuat volume penyimpanan NVMe terlampir tersedia untuk instance notebook Anda, selesaikan langkah-langkah dalam Membuat volume penyimpanan instans tersedia di instans Anda. Selesaikan langkah-langkah dengan akses root atau dengan menggunakan skrip konfigurasi siklus hidup.

    catatan

    Volume penyimpanan instance NVMe bukan penyimpanan persisten. Penyimpanan ini berumur pendek dengan instance dan harus dikonfigurasi ulang setiap kali instance dengan penyimpanan ini diluncurkan.

  • Contoh salinan notebook Jupyter - Contoh kode Python ini menunjukkan pelatihan model dan latihan hosting menggunakan algoritme dan kumpulan data pelatihan yang berbeda.

Untuk membuat instance SageMaker notebook:
  1. Buka SageMaker konsol di https://console.aws.amazon.com/sagemaker/.

  2. Pilih instance Notebook, lalu pilih Buat instance notebook.

  3. Pada halaman Create notebook instance, berikan informasi berikut:

    1. Untuk nama instance Notebook, ketikkan nama untuk instance notebook Anda.

    2. Untuk jenis instans Notebook, pilih ukuran instans yang sesuai untuk kasus penggunaan Anda. Untuk daftar jenis dan kuota instans yang didukung, lihat Amazon SageMaker Service Quotas.

    3. Untuk Elastic Inference, pilih jenis akselerator inferensi untuk diasosiasikan dengan instance notebook jika Anda berencana untuk melakukan inferensi dari instance notebook. Jika Anda tidak berencana untuk melakukan inferensi dari instance notebook, pilih none. Untuk informasi tentang inferensi elastis, lihatGunakan Amazon SageMaker Elastic Inference (EI) .

    4. Untuk Pengenal Platform, pilih jenis platform untuk membuat instance notebook. Jenis platform ini menentukan Sistem Operasi dan JupyterLab versi yang membuat instance notebook Anda. Untuk informasi tentang jenis pengenal platform, lihatInstans notebook Amazon Linux 2. Untuk informasi tentang versi JupyterLab, lihat JupyterLab pembuatan versi.

    5. (Opsional) Konfigurasi tambahan memungkinkan pengguna tingkat lanjut membuat skrip shell yang dapat dijalankan saat Anda membuat atau memulai instance. Skrip ini, yang disebut skrip konfigurasi siklus hidup, dapat digunakan untuk mengatur lingkungan untuk notebook atau untuk melakukan fungsi lainnya. Untuk informasi, lihat Kustomisasi instance SageMaker notebook menggunakan skrip LCC.

    6. (Opsional) Konfigurasi tambahan juga memungkinkan Anda menentukan ukuran, dalam GB, volume penyimpanan ML yang dilampirkan ke instance notebook. Anda dapat memilih ukuran antara 5 GB dan 16.384 GB, dengan peningkatan 1 GB. Anda dapat menggunakan volume untuk membersihkan dataset pelatihan atau untuk sementara menyimpan validasi atau data lainnya.

    7. (Opsional) Untuk Versi IMDS Minimum, pilih versi dari daftar dropdown. Jika nilai ini diatur ke v1, kedua versi dapat digunakan dengan instance notebook. Jika v2 dipilih, maka hanya IMDSv2 yang dapat digunakan dengan instance notebook. Untuk informasi tentang IMDSv2, lihat Menggunakan IMDSv2.

      catatan

      Mulai 31 Oktober 2022, Versi IMDS minimum default untuk instance SageMaker notebook berubah dari IMDSv1 ke IMDSv2.

      Mulai 1 Februari 2023, IMDSv1 tidak lagi tersedia untuk pembuatan instance notebook baru. Setelah tanggal ini, Anda dapat membuat instance notebook dengan versi IMDS minimum 2.

    8. Untuk peran IAM, pilih peran IAM yang ada di akun Anda dengan izin yang diperlukan untuk mengakses SageMaker sumber daya atau Buat peran baru. Jika Anda memilih Buat peran baru, SageMaker buat peran IAM bernamaAmazonSageMaker-ExecutionRole-YYYYMMDDTHHmmSS. Kebijakan yang AWS AmazonSageMakerFullAccess dikelola melekat pada peran. Peran ini memberikan izin yang memungkinkan instance notebook menelepon SageMaker dan Amazon S3.

    9. Untuk akses Root, untuk memberikan akses root bagi semua pengguna instance notebook, pilih Aktifkan. Untuk menghapus akses root bagi pengguna, pilih Nonaktifkan. Jika Anda memberikan akses root, semua pengguna instance notebook memiliki hak administrator dan dapat mengakses dan mengedit semua file di dalamnya.

    10. (Opsional) Kunci enkripsi memungkinkan Anda mengenkripsi data pada volume penyimpanan ML yang dilampirkan ke instance notebook menggunakan kunci AWS Key Management Service (AWS KMS). Jika Anda berencana untuk menyimpan informasi sensitif pada volume penyimpanan ML, pertimbangkan untuk mengenkripsi informasi.

    11. (Opsional) Network memungkinkan Anda menempatkan instance notebook Anda di dalam Virtual Private Cloud (VPC). VPC memberikan keamanan tambahan dan membatasi akses ke sumber daya di VPC dari sumber di luar VPC. Untuk informasi selengkapnya tentang VPC, lihat Panduan Pengguna Amazon VPC.

      Untuk menambahkan instance notebook Anda ke VPC:

      1. Pilih VPC dan a. SubnetId

      2. Untuk Grup Keamanan, pilih grup keamanan default VPC Anda.

      3. Jika Anda memerlukan instance notebook Anda untuk memiliki akses internet, aktifkan akses internet langsung. Untuk akses internet langsung, pilih Aktifkan. Akses internet dapat membuat instance notebook Anda kurang aman. Untuk informasi selengkapnya, lihat Hubungkan Instance Notebook di VPC ke Sumber Daya Eksternal.

    12. (Opsional) Untuk mengaitkan repositori Git dengan instance notebook, pilih repositori default dan hingga tiga repositori tambahan. Untuk informasi selengkapnya, lihat Kaitkan Repositori Git dengan SageMaker Instans Notebook.

    13. Pilih Buat instans notebook.

      Dalam beberapa menit, Amazon SageMaker meluncurkan instans komputasi ML—dalam hal ini, instance notebook—dan melampirkan volume penyimpanan ML ke dalamnya. Instance notebook memiliki server notebook Jupyter yang telah dikonfigurasi sebelumnya dan satu set perpustakaan Anaconda. Untuk informasi lebih lanjut, lihat CreateNotebookInstanceAPI.

  4. Ketika status instance notebookInService, di konsol, instance notebook siap digunakan. Pilih Buka Jupyter di sebelah nama notebook untuk membuka dasbor Jupyter klasik.

    catatan

    Untuk meningkatkan keamanan instans SageMaker notebook Amazon Anda, semua notebook.region.sagemaker.aws domain regional terdaftar di Daftar Akhiran Publik (PSL) internet. Untuk keamanan lebih lanjut, kami menyarankan Anda menggunakan cookie dengan __Host- awalan untuk mengatur cookie sensitif untuk domain instance SageMaker buku catatan Anda. Ini membantu mempertahankan domain Anda dari upaya pemalsuan permintaan lintas situs (CSRF). Untuk informasi selengkapnya, lihat halaman Set-Cookie di situs web dokumentasi pengembang mozilla.org.

    Anda dapat memilih Buka JupyterLab untuk membuka JupyterLab dasbor. Dasbor menyediakan akses ke instance notebook Anda dan contoh SageMaker buku catatan yang berisi panduan kode lengkap. Panduan ini menunjukkan cara menggunakan SageMaker untuk melakukan tugas pembelajaran mesin yang umum. Untuk informasi selengkapnya, lihat Contoh Notebook. Untuk informasi selengkapnya, lihat Kontrol akses root ke instance SageMaker notebook.

    Untuk informasi lebih lanjut tentang notebook Jupyter, lihat Notebook Jupyter.