Ikhtisar model khusus di Neptune - Amazon Neptune

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Ikhtisar model khusus di Neptune

Kapan menggunakan model khusus di Neptune

Model bawaan Neptune ML's menangani semua tugas standar yang didukung oleh Neptune ML. tetapi mungkin ada kasus di mana Anda ingin memiliki kontrol yang lebih terperinci atas model untuk tugas tertentu, atau perlu menyesuaikan proses pelatihan model. Sebagai contoh,

  • Pengkodean fitur untuk fitur teks model teks yang sangat besar perlu dijalankan pada GPU.

  • Anda ingin menggunakan model Graph Neural Network (GNN) kustom Anda sendiri yang dikembangkan di Deep Graph Library (DGL).

  • Anda ingin menggunakan model tabular atau model ansambel untuk klasifikasi node dan regresi.

Alur kerja untuk mengembangkan dan menggunakan model kustom di Neptune

Dukungan model khusus di Neptune MLdirancang untuk diintegrasikan secara mulus ke dalam alur kerja Neptune ML yang ada. Ia bekerja dengan menjalankan kode kustom di modul sumber Anda pada infrastruktur Neptune ML's untuk melatih model. Sama seperti halnya mode bawaan, Neptune MLsecara otomatis meluncurkan pekerjaan SageMaker HyperParameter penyetelan dan memilih model terbaik sesuai dengan metrik evaluasi. Kemudian menggunakan implementasi yang disediakan dalam modul sumber Anda untuk menghasilkan artefak model untuk penyebaran.

Ekspor data, konfigurasi pelatihan, dan preprocessing data sama untuk model kustom seperti untuk model bawaan.

Setelah preprocessing data adalah ketika Anda dapat berulang dan interaktif mengembangkan dan menguji implementasi model kustom Anda menggunakan Python. Ketika model Anda siap produksi, Anda dapat mengunggah modul Python yang dihasilkan ke Amazon S3 seperti ini:

aws s3 cp --recursive (source path to module) s3://(bucket name)/(destination path for your module)

Kemudian, Anda dapat menggunakan default normal atau alur kerja data tambahan untuk menyebarkan model ke produksi, dengan beberapa perbedaan.

Untuk pelatihan model menggunakan model khusus, Anda harus menyediakan objekcustomModelTrainingParameters JSON ke API pelatihan model Neptune MLuntuk memastikan bahwa kode kustom Anda digunakan. Bidang dalamcustomModelTrainingParameters objek adalah sebagai berikut:

  • sourceS3DirectoryPath— (Diperlukan) Jalur ke lokasi Amazon S3 tempat modul Python yang mengimplementasikan model Anda berada. Ini harus mengarah ke lokasi Amazon S3 yang valid yang berisi, minimal, skrip pelatihan, skrip transformasi, danmodel-hpo-configuration.json file.

  • trainingEntryPointScript- (Opsional) Nama titik masuk dalam modul skrip Anda yang melakukan pelatihan model dan mengambil hyperparameter sebagai argumen baris perintah, termasuk hyperparameter tetap.

    Default: training.py.

  • transformEntryPointScript- (Opsional) Nama titik masuk dalam modul skrip Anda yang harus dijalankan setelah model terbaik dari pencarian hyperparameter telah diidentifikasi, untuk menghitung artefak model yang diperlukan untuk penerapan model. Seharusnya bisa berjalan tanpa argumen baris perintah.

    Default: transform.py.

Misalnya:

curl \ -X POST https://(your Neptune endpoint)/ml/modeltraining -H 'Content-Type: application/json' \ -d '{ "id" : "(a unique model-training job ID)", "dataProcessingJobId" : "(the data-processing job-id of a completed job)", "trainModelS3Location" : "s3://(your Amazon S3 bucket)/neptune-model-graph-autotrainer" "modelName": "custom", "customModelTrainingParameters" : { "sourceS3DirectoryPath": "s3://(your Amazon S3 bucket)/(path to your Python module)", "trainingEntryPointScript": "(your training script entry-point name in the Python module)", "transformEntryPointScript": "(your transform script entry-point name in the Python module)" } }'

Demikian pula, untuk mengaktifkan transformasi model kustom, Anda harus menyediakan objekcustomModelTransformParameters JSON ke API transformasi model Neptune ML, dengan nilai bidang yang kompatibel dengan parameter model yang disimpan dari pekerjaan pelatihan. customModelTransformParametersObjek berisi bidang-bidang ini:

  • sourceS3DirectoryPath— (Diperlukan) Jalur ke lokasi Amazon S3 tempat modul Python yang mengimplementasikan model Anda berada. Ini harus mengarah ke lokasi Amazon S3 yang valid yang berisi, minimal, skrip pelatihan, skrip transformasi, danmodel-hpo-configuration.json file.

  • transformEntryPointScript- (Opsional) Nama titik masuk dalam modul skrip Anda yang harus dijalankan setelah model terbaik dari pencarian hyperparameter telah diidentifikasi, untuk menghitung artefak model yang diperlukan untuk penerapan model. Seharusnya bisa berjalan tanpa argumen baris perintah.

    Default: transform.py.

Misalnya:

curl \ -X POST https://(your Neptune endpoint)/ml/modeltransform -H 'Content-Type: application/json' \ -d '{ "id" : "(a unique model-training job ID)", "trainingJobName" : "(name of a completed SageMaker training job)", "modelTransformOutputS3Location" : "s3://(your Amazon S3 bucket)/neptune-model-transform/" "customModelTransformParameters" : { "sourceS3DirectoryPath": "s3://(your Amazon S3 bucket)/(path to your Python module)", "transformEntryPointScript": "(your transform script entry-point name in the Python module)" } }'