Pilihan yang tersedia - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pilihan yang tersedia

Tabel berikut menampilkan semua opsi yang tersedia yang dapat Anda gunakan untuk menyesuaikan pekerjaan notebook, baik Anda menjalankan Job Notebook di Studio, lingkungan Jupyter lokal, atau menggunakan Python SageMaker . SDK Tabel ini mencakup jenis opsi kustom, deskripsi, pedoman tambahan tentang cara menggunakan opsi, nama bidang untuk opsi di Studio (jika tersedia) dan nama parameter untuk langkah pekerjaan notebook di SageMaker Python SDK (jika tersedia).

Untuk beberapa opsi, Anda juga dapat mengatur nilai default kustom sehingga Anda tidak perlu menentukannya setiap kali Anda menyiapkan pekerjaan buku catatan. Untuk Studio, opsi ini adalah Peran, folder Input, folder Output, dan ID KMS Kunci, dan ditentukan dalam tabel berikut. Jika Anda menetapkan default kustom untuk opsi ini, bidang ini akan diisi sebelumnya dalam formulir Buat Job saat Anda membuat pekerjaan buku catatan. Untuk detail tentang cara membuat default kustom di Studio dan lingkungan Jupyter lokal, lihat. Menyiapkan opsi default untuk buku catatan lokal

Ini SageMaker SDK juga memberi Anda opsi untuk mengatur default cerdas sehingga Anda tidak perlu menentukan parameter ini saat Anda membuat file. NotebookJobStep Parameter ini adalah roles3_root_uri,s3_kms_key,volume_kms_key, subnetssecurity_group_ids,,, dan ditentukan dalam tabel berikut. Untuk informasi tentang cara menyetel default cerdas, lihat. Siapkan opsi default

Opsi kustom Deskripsi Pedoman khusus studio Pedoman lingkungan Jupyter lokal SageMaker Pedoman Python SDK
Nama Tugas Nama pekerjaan Anda seperti yang akan muncul di dasbor Pekerjaan Notebook. Nama Field Job. Sama seperti studio. Parameternotebook_job_name. Default ke None.
Citra Gambar kontainer yang digunakan untuk menjalankan notebook secara noninteraktif pada jenis komputasi yang dipilih. Gambar Lapangan. Bidang ini default ke gambar notebook Anda saat ini. Ubah bidang ini dari default ke nilai kustom jika diperlukan. Jika Studio tidak dapat menyimpulkan nilai ini, formulir akan menampilkan kesalahan validasi yang mengharuskan Anda untuk menentukannya. Gambar ini dapat berupa kustom, bring-your-own gambar, atau SageMaker gambar Amazon yang tersedia. Untuk daftar SageMaker gambar yang tersedia yang didukung oleh penjadwal buku catatan, lihat SageMaker Gambar Amazon tersedia untuk digunakan dengan Studio Classic. Gambar Lapangan. Bidang ini memerlukan image Docker yang dapat menjalankan notebook yang disediakan pada ECR URI jenis komputasi yang dipilih. Secara default, ekstensi penjadwal menggunakan SageMaker gambar Docker yang sudah dibuat sebelumnya — dasar Python 2.0. Ini adalah gambar resmi Python 3.8 dari DockerHub dengan boto3,, AWS CLI dan kernel Python 3. Anda juga dapat memberikan apa pun ECR URI yang memenuhi spesifikasi gambar kustom notebook. Untuk detailnya, lihat Spesifikasi SageMaker gambar kustom. Gambar ini harus memiliki semua kernel dan pustaka yang diperlukan untuk menjalankan notebook. Diperlukan. Parameterimage_uri. URIlokasi gambar Docker diECR. Anda dapat menggunakan Gambar SageMaker Distribusi tertentu atau gambar kustom berdasarkan gambar tersebut, atau gambar Anda sendiri yang telah diinstal sebelumnya dengan dependensi pekerjaan notebook yang memenuhi persyaratan tambahan. Untuk detailnya, lihat Kendala gambar untuk pekerjaan notebook Python SageMaker SDK.
Jenis instans Jenis EC2 instance yang digunakan untuk menjalankan pekerjaan notebook. Pekerjaan notebook menggunakan SageMaker Training Job sebagai lapisan komputasi, jadi tipe instance yang ditentukan harus berupa tipe instans yang didukung SageMaker Pelatihan. Jenis Komputasi Bidang. Default ke ml.m5.large. Sama seperti studio. Parameterinstance_type. Default ke ml.m5.large.
Kernel Kernel Jupyter digunakan untuk menjalankan pekerjaan notebook. Kernel Lapangan. Bidang ini default ke kernel notebook Anda saat ini. Ubah bidang ini dari default ke nilai kustom jika diperlukan. Jika Studio tidak dapat menyimpulkan nilai ini, formulir akan menampilkan kesalahan validasi yang mengharuskan Anda untuk menentukannya. Kernel Lapangan. Kernel ini harus ada dalam gambar dan mengikuti spesifikasi kernel Jupyter. Bidang ini default ke kernel Python3 yang ditemukan di gambar dasar Python 2.0. SageMaker Ubah bidang ini menjadi nilai kustom jika diperlukan. Diperlukan. Parameterkernel_name. Kernel ini harus ada dalam gambar dan mengikuti spesifikasi kernel Jupyter. Untuk melihat pengidentifikasi kernel untuk gambar Anda, lihat (LINK).
SageMaker sesi SageMaker Sesi yang mendasari panggilan SageMaker layanan didelegasikan. N/A N/A Parametersagemaker_session. Jika tidak ditentukan, satu dibuat menggunakan rantai konfigurasi default.
Peran ARN Nama Sumber Daya Amazon (ARN) peran yang digunakan dengan pekerjaan notebook. Peran LapanganARN. Bidang ini default ke peran eksekusi Studio. Ubah bidang ini menjadi nilai kustom jika diperlukan.
catatan

Jika Studio tidak dapat menyimpulkan nilai ini, ARN bidang Peran kosong. Dalam hal ini, masukkan yang ingin ARN Anda gunakan.

Peran LapanganARN. Bidang ini default ke peran apa pun yang diawali dengan. SagemakerJupyterScheduler Jika Anda memiliki beberapa peran dengan awalan, ekstensi memilih satu. Ubah bidang ini menjadi nilai kustom jika diperlukan. Untuk bidang ini, Anda dapat mengatur default pengguna Anda sendiri yang telah terisi sebelumnya setiap kali Anda membuat definisi pekerjaan baru. Untuk detailnya, lihat Menyiapkan opsi default untuk buku catatan lokal. Parameterrole. Default ke IAM peran SageMaker default jika berjalan di SageMaker Notebook atau Notebook Studio. SDK SageMaker Kalau tidak, itu melempar a. ValueError Memungkinkan default cerdas.
Notebook masukan Nama notebook yang Anda jadwalkan untuk dijalankan. Diperlukan. File Masukan Bidang. Sama seperti studio. Diperlukan .Parameterinput_notebook.
Folder masukan Folder yang berisi input Anda. Input pekerjaan, termasuk notebook input dan skrip start-up atau inisialisasi opsional apa pun, dimasukkan ke dalam folder ini. Folder Masukan Bidang. Jika Anda tidak menyediakan folder, penjadwal akan membuat bucket Amazon S3 default untuk input Anda. Sama seperti studio. Untuk bidang ini, Anda dapat mengatur default pengguna Anda sendiri yang telah terisi sebelumnya setiap kali Anda membuat definisi pekerjaan baru. Untuk detailnya, lihat Menyiapkan opsi default untuk buku catatan lokal. N/A. Folder input ditempatkan di dalam lokasi yang ditentukan oleh parameters3_root_uri.
Folder keluaran Folder yang berisi output Anda. Output pekerjaan, termasuk notebook keluaran dan log, dimasukkan ke dalam folder ini. Folder Keluaran Bidang. Jika Anda tidak menentukan folder, penjadwal akan membuat bucket Amazon S3 default untuk output Anda. Sama seperti studio. Untuk bidang ini, Anda dapat mengatur default pengguna Anda sendiri yang telah terisi sebelumnya setiap kali Anda membuat definisi pekerjaan baru. Untuk detailnya, lihat Menyiapkan opsi default untuk buku catatan lokal. N/A. Folder output ditempatkan di dalam lokasi yang ditentukan oleh parameters3_root_uri.
Parameter Kamus variabel dan nilai untuk diteruskan ke pekerjaan notebook Anda. Parameter Bidang. Anda perlu membuat parameter notebook Anda untuk menerima parameter. Sama seperti studio. Parameterparameters. Anda perlu membuat parameter notebook Anda untuk menerima parameter.
Dependensi tambahan (file atau folder) Daftar dependensi file atau folder yang diunggah oleh pekerjaan notebook ke folder bertahap s3. Tidak didukung. Tidak didukung. Parameteradditional_dependencies. Pekerjaan notebook mengunggah dependensi ini ke folder bertahap S3 sehingga dapat dikonsumsi selama eksekusi.
Akar S3 URI Folder yang berisi input Anda. Input pekerjaan, termasuk notebook input dan skrip start-up atau inisialisasi opsional apa pun, dimasukkan ke dalam folder ini. N/A. Gunakan Folder Input dan folder Output. Sama seperti studio. Parameters3_root_uri. Default ke bucket S3 default. Memungkinkan default cerdas.
Variabel-variabel lingkungan Setiap variabel lingkungan yang ada yang ingin Anda timpa, atau variabel lingkungan baru yang ingin Anda perkenalkan dan gunakan di buku catatan Anda. Variabel Lingkungan Lapangan. Sama seperti studio. Parameterenvironment_variables. Default ke None.
Tanda Daftar tag yang dilampirkan pada pekerjaan. N/A N/A Parametertags. Default ke None. Tag Anda mengontrol cara UI Studio menangkap dan menampilkan pekerjaan yang dibuat oleh pipeline. Untuk detailnya, lihat Melihat pekerjaan notebook Anda di dasbor Studio UI.
Skrip start-up Skrip yang dimuat sebelumnya di menu startup notebook yang dapat Anda pilih untuk dijalankan sebelum menjalankan notebook. Skrip Start-up bidang. Pilih skrip Lifecycle Configuration (LCC) yang berjalan pada gambar saat start-up.
catatan

Skrip start-up berjalan di shell di luar lingkungan Studio. Oleh karena itu, skrip ini tidak dapat bergantung pada penyimpanan lokal Studio, variabel lingkungan, atau metadata aplikasi (in/opt/ml/metadata). Juga, jika Anda menggunakan skrip start-up dan skrip inisialisasi, skrip start-up berjalan terlebih dahulu.

Tidak didukung. Tidak didukung.
Skrip inisialisasi Jalur ke skrip lokal yang dapat Anda jalankan saat notebook Anda dimulai. Skrip Inisialisasi Bidang. Masukkan jalur EFS file tempat skrip lokal atau skrip Konfigurasi Siklus Hidup (LCC) berada. Jika Anda menggunakan skrip start-up dan skrip inisialisasi, skrip start-up berjalan terlebih dahulu.
catatan

Skrip inisialisasi bersumber dari shell yang sama dengan pekerjaan notebook. Ini tidak berlaku untuk skrip start-up yang dijelaskan sebelumnya. Juga, jika Anda menggunakan skrip start-up dan skrip inisialisasi, skrip start-up berjalan terlebih dahulu.

Skrip Inisialisasi Bidang. Masukkan jalur file lokal tempat skrip lokal atau skrip Konfigurasi Siklus Hidup (LCC) berada. Parameterinitialization_script. Default ke None.
Upaya coba lagi maksimal Berapa kali Studio mencoba menjalankan kembali pekerjaan yang gagal. Upaya coba lagi Field Max. Default ke 1. Sama seperti studio. Parametermax_retry_attempts. Default ke 1.
Waktu lari maks (dalam detik) Panjang waktu maksimum, dalam hitungan detik, pekerjaan notebook dapat dijalankan sebelum dihentikan. Jika Anda mengonfigurasi upaya Max run time dan Max retry, waktu berjalan berlaku untuk setiap percobaan ulang. Jika pekerjaan tidak selesai saat ini, statusnya diatur keFailed. Field Max run time (dalam detik). Default ke 172800 seconds (2 days). Sama seperti studio. Parametermax_runtime_in_seconds. Default ke 172800 seconds (2 days).
Coba lagi kebijakan Daftar kebijakan coba lagi, yang mengatur tindakan yang harus diambil jika terjadi kegagalan. Tidak didukung. Tidak didukung. Parameterretry_policies. Default ke None.
Tambah Step atau StepCollection dependensi Daftar Step atau StepCollection nama atau contoh di mana pekerjaan tergantung. Tidak didukung. Tidak didukung. Parameterdepends_on. Default ke None. Gunakan ini untuk menentukan dependensi eksplisit di antara langkah-langkah dalam grafik pipeline Anda.
Ukuran volume Ukuran dalam GB volume penyimpanan untuk menyimpan data input dan output selama pelatihan. Tidak didukung. Tidak didukung. Parametervolume_size. Default ke 30GB.
Enkripsi lalu lintas antar kontainer Bendera yang menentukan apakah lalu lintas antar wadah pelatihan dienkripsi untuk pekerjaan pelatihan. N/A. Diaktifkan secara default. N/A. Diaktifkan secara default. Parameterencrypt_inter_container_traffic. Default ke True.
Konfigurasikan enkripsi pekerjaan Indikator bahwa Anda ingin mengenkripsi output pekerjaan notebook, volume instans pekerjaan, atau keduanya. Bidang Konfigurasi enkripsi pekerjaan. Centang kotak ini untuk memilih enkripsi. Jika dibiarkan tidak dicentang, output pekerjaan dienkripsi dengan KMS kunci default akun dan volume instance pekerjaan tidak dienkripsi. Sama seperti studio. Tidak didukung.
KMSKunci enkripsi keluaran KMSKunci untuk digunakan jika Anda ingin menyesuaikan kunci enkripsi yang digunakan untuk output pekerjaan notebook Anda. Bidang ini hanya berlaku jika Anda memeriksa Konfigurasi enkripsi pekerjaan. KMSKunci enkripsi Output Bidang. Jika Anda tidak menentukan bidang ini, output pekerjaan notebook Anda dienkripsi dengan SSE - KMS menggunakan kunci Amazon S3 default. KMS Selain itu, jika Anda membuat bucket Amazon S3 sendiri dan menggunakan enkripsi, metode enkripsi Anda akan dipertahankan. Sama seperti studio. Untuk bidang ini, Anda dapat mengatur default pengguna Anda sendiri yang telah terisi sebelumnya setiap kali Anda membuat definisi pekerjaan baru. Untuk detailnya, lihat Menyiapkan opsi default untuk buku catatan lokal. Parameters3_kms_key. Default ke None. Memungkinkan default cerdas.
KMSKunci enkripsi volume instance Job KMSKunci untuk digunakan jika Anda ingin mengenkripsi volume instance pekerjaan Anda. Bidang ini hanya berlaku jika Anda memeriksa Konfigurasi enkripsi pekerjaan. KMSKunci enkripsi volume instance Field Job. KMSKunci enkripsi volume instance Field Job. Untuk bidang ini, Anda dapat mengatur default pengguna Anda sendiri yang telah terisi sebelumnya setiap kali Anda membuat definisi pekerjaan baru. Untuk detailnya, lihat Menyiapkan opsi default untuk buku catatan lokal. Parametervolume_kms_key. Default ke None. Memungkinkan default cerdas.
Gunakan Virtual Private Cloud untuk menjalankan pekerjaan ini (untuk VPC pengguna) Indikator bahwa Anda ingin menjalankan pekerjaan ini di Virtual Private Cloud (VPC). Untuk keamanan yang lebih baik, disarankan agar Anda menggunakan pribadiVPC. Bidang Gunakan Virtual Private Cloud untuk menjalankan pekerjaan ini. Centang kotak ini jika Anda ingin menggunakanVPC. Minimal, buat VPC titik akhir berikut untuk memungkinkan pekerjaan notebook Anda terhubung secara pribadi ke sumber daya tersebut AWS :
Jika Anda memilih untuk menggunakanVPC, Anda perlu menentukan setidaknya satu subnet pribadi dan setidaknya satu grup keamanan dalam opsi berikut. Jika Anda tidak menggunakan subnet pribadi apa pun, Anda perlu mempertimbangkan opsi konfigurasi lainnya. Untuk detailnya, lihat VPCSubnet publik yang tidak didukung diKendala dan pertimbangan.
Sama seperti studio. N/A
Subnet (untuk VPC pengguna) Subnet Anda. Bidang ini harus berisi setidaknya satu dan paling banyak lima, dan semua subnet yang Anda berikan harus bersifat pribadi. Untuk detailnya, lihat VPCSubnet publik yang tidak didukung diKendala dan pertimbangan. Subnet Bidang. Bidang ini default ke subnet yang terkait dengan domain Studio, tetapi Anda dapat mengubah bidang ini jika diperlukan. Subnet Bidang. Penjadwal tidak dapat mendeteksi subnet Anda, jadi Anda harus memasukkan subnet apa pun yang Anda konfigurasikan untuk subnet Anda. VPC Parametersubnets. Default ke None. Memungkinkan default cerdas.
Grup keamanan (untuk VPC pengguna) Grup keamanan Anda. Bidang ini harus berisi setidaknya satu dan paling banyak 15. Untuk detailnya, lihat VPCSubnet publik yang tidak didukung diKendala dan pertimbangan. Kelompok Keamanan Lapangan. Bidang ini default ke grup keamanan yang terkait dengan domainVPC, tetapi Anda dapat mengubah bidang ini jika diperlukan. Kelompok Keamanan Lapangan. Penjadwal tidak dapat mendeteksi grup keamanan Anda, jadi Anda harus memasukkan grup keamanan apa pun yang Anda konfigurasikan untuk AndaVPC. Parametersecurity_group_ids. Default ke None. Memungkinkan default cerdas.
Nama Nama langkah pekerjaan notebook. N/A N/A Parametername. Jika tidak ditentukan, itu berasal dari nama file notebook.
Nama tampilan Nama pekerjaan Anda seperti yang akan muncul dalam daftar eksekusi pipeline Anda. N/A N/A Parameterdisplay_name. Default ke None.
Deskripsi Deskripsi pekerjaan Anda. N/A N/A Parameterdescription.