Contoh penggunaan parameter di dalam additionalParams untuk menyetel konfigurasi model-pelatihan - Amazon Neptune

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Contoh penggunaan parameter di dalam additionalParams untuk menyetel konfigurasi model-pelatihan

Contoh berikut menunjukkan bagaimana memanfaatkan fitur "additionalParams" dalam grafik properti dan model RDF data untuk mengonfigurasi berbagai aspek proses pelatihan model untuk aplikasi Neptunus Neptunus. Contohnya mencakup berbagai fungsi, termasuk menentukan tingkat pemisahan default untuk data pelatihan/validasi/pengujian, mendefinisikan klasifikasi node, regresi, dan tugas prediksi tautan, serta mengonfigurasi berbagai jenis fitur seperti bucket numerik, penyematan teks, datetime, dan data kategoris. Konfigurasi terperinci ini memungkinkan Anda untuk menyesuaikan pipeline pembelajaran mesin dengan data spesifik dan persyaratan pemodelan Anda, membuka potensi penuh dari kemampuan Neptunus ML.

Contoh grafik properti menggunakan additionalParams

Menentukan tingkat pemisahan default untuk konfigurasi pelatihan model

Dalam contoh berikut, split_rate parameter menetapkan tingkat pemisahan default untuk pelatihan model. Jika tidak ada tingkat pemisahan default yang ditentukan, pelatihan menggunakan nilai [0,9, 0,1, 0,0]. Anda dapat mengganti nilai default pada basis per-target dengan menentukan untuk setiap target. split_rate

Dalam contoh berikut, default split_rate bidang menunjukkan bahwa tingkat perpecahan [0.7,0.1,0.2] harus digunakan kecuali diganti berdasarkan per target:

"additionalParams": { "neptune_ml": { "version": "v2.0", "split_rate": [0.7,0.1,0.2], "targets": [ (...) ], "features": [ (...) ] } }

Menentukan tugas klasifikasi simpul untuk konfigurasi pelatihan model

Untuk menunjukkan properti node mana yang berisi contoh berlabel untuk tujuan pelatihan, tambahkan elemen klasifikasi node ke targets array, menggunakan"type" : "classification". Tambahkan split_rate bidang jika Anda ingin mengganti tingkat pemisahan default.

Dalam contoh berikut, node target menunjukkan bahwa genre properti dari setiap Movie node harus diperlakukan sebagai label kelas node. split_rateNilai mengesampingkan tingkat pemisahan default:

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "node": "Movie", "property": "genre", "type": "classification", "split_rate": [0.7,0.1,0.2] } ], "features": [ (...) ] } }

Menentukan tugas klasifikasi node multi-kelas untuk konfigurasi pelatihan model

Untuk menunjukkan properti node mana yang berisi beberapa contoh berlabel untuk tujuan pelatihan, tambahkan elemen klasifikasi node ke array target, gunakan"type" : "classification", dan separator untuk menentukan karakter yang dapat digunakan untuk membagi nilai properti target menjadi beberapa nilai kategoris. Tambahkan split_rate bidang jika Anda ingin mengganti tingkat pemisahan default.

Dalam contoh berikut, node target menunjukkan bahwa genre properti dari setiap Movie node harus diperlakukan sebagai label kelas node. separatorBidang menunjukkan bahwa setiap properti genre berisi beberapa nilai yang dipisahkan titik koma:

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "node": "Movie", "property": "genre", "type": "classification", "separator": ";" } ], "features": [ (...) ] } }

Menentukan tugas regresi simpul untuk konfigurasi pelatihan model

Untuk menunjukkan properti node mana yang berisi regresi berlabel untuk tujuan pelatihan, tambahkan elemen regresi simpul ke array target, menggunakan. "type" : "regression" Tambahkan bidang split_rate jika Anda ingin mengganti tingkat pemisahan default.

Target node berikut in imenunjukkan bahwa properti rating masing-masing simpul Movie harus diperlakukan sebagai label regresi simpul :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "node": "Movie", "property": "rating", "type" : "regression", "split_rate": [0.7,0.1,0.2] } ], "features": [ ... ] } }

Menentukan tugas klasifikasi tepi untuk konfigurasi pelatihan model

Untuk menunjukkan properti edge mana yang berisi contoh berlabel untuk tujuan pelatihan, tambahkan elemen tepi ke targets array, menggunakan"type" : "regression". Tambahkan bidang split_rate jika Anda ingin mengganti tingkat pemisahan default.

edgeTarget berikut menunjukkan bahwa metAtLocation properti setiap knows tepi harus diperlakukan sebagai label kelas tepi:

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "edge": ["Person", "knows", "Person"], "property": "metAtLocation", "type": "classification" } ], "features": [ (...) ] } }

Menentukan tugas klasifikasi tepi multi-kelas untuk konfigurasi pelatihan model

Untuk menunjukkan properti edge mana yang berisi beberapa contoh berlabel untuk tujuan pelatihan, tambahkan elemen tepi ke targets array, menggunakan"type" : "classification", dan separator bidang untuk menentukan karakter yang digunakan untuk membagi nilai properti target menjadi beberapa nilai kategoris. Tambahkan split_rate bidang jika Anda ingin mengganti tingkat pemisahan default.

edgeTarget berikut menunjukkan bahwa sentiment properti setiap repliedTo tepi harus diperlakukan sebagai label kelas tepi. Bidang pemisah menunjukkan bahwa setiap properti sentimen berisi nilai yang dipisahkan koma multile:

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "edge": ["Person", "repliedTo", "Message"], "property": "sentiment", "type": "classification", "separator": "," } ], "features": [ (...) ] } }

Menentukan regresi edge untuk konfigurasi model-training

Untuk menunjukkan properti edge mana yang berisi contoh regresi berlabel untuk tujuan pelatihan, tambahkan edge elemen ke targets array, menggunakan. "type" : "regression" Tambahkan split_rate bidang jika Anda ingin mengganti tingkat pemisahan default.

edgeTarget berikut menunjukkan bahwa rating properti setiap reviewed tepi harus diperlakukan sebagai regresi tepi:

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "edge": ["Person", "reviewed", "Movie"], "property": "rating", "type" : "regression" } ], "features": [ (...) ] } }

Untuk menunjukkan tepi mana yang harus digunakan untuk tujuan pelatihan prediksi tautan, tambahkan elemen tepi ke larik target menggunakan"type" : "link_prediction". Tambahkan split_rate bidang jika Anda ingin mengganti tingkat pemisahan default.

edgeTarget berikut menunjukkan bahwa cites tepi harus digunakan untuk prediksi tautan:

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "edge": ["Article", "cites", "Article"], "type" : "link_prediction" } ], "features": [ (...) ] } }

Menentukan fitur bucket numerik

Anda dapat menentukan fitur data numerik untuk properti node dengan menambahkan "type": "bucket_numerical" ke features array.

Fitur node berikut ini menunjukkan bahwa properti age masing-masing node Person harus diperlakukan sebagai fitur bucket numerik:

"additionalParams": { "neptune_ml": { "targets": [ ... ], "features": [ { "node": "Person", "property": "age", "type": "bucket_numerical", "range": [1, 100], "bucket_cnt": 5, "slide_window_size": 3, "imputer": "median" } ] } }

Menentukan fitur Word2Vec

Anda dapat menentukan Word2Vec fitur untuk properti node dengan menambahkan "type": "text_word2vec" ke features array.

Fitur node berikut ini menunjukkan bahwa properti description masing-masing node Movieharus diperlakukan sebagai fitur Word2Vec:

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ ... ], "features": [ { "node": "Movie", "property": "description", "type": "text_word2vec", "language": "en_core_web_lg" } ] } }

Menentukan fitur FastText

Anda dapat menentukan FastText fitur untuk properti node dengan menambahkan "type": "text_fasttext" ke features array. languageBidang diperlukan, dan harus menentukan salah satu kode bahasa berikut:

  • en(Bahasa Inggris)

  • zh(Bahasa Mandarin)

  • hi(Hindi)

  • es(Spanyol)

  • fr(Perancis)

Perhatikan bahwa text_fasttext pengkodean tidak dapat menangani lebih dari satu bahasa pada satu waktu dalam suatu fitur.

nodeFitur berikut menunjukkan bahwa description properti Prancis dari setiap Movie node harus diperlakukan sebagai FastText fitur:

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ ... ], "features": [ { "node": "Movie", "property": "description", "type": "text_fasttext", "language": "fr", "max_length": 1024 } ] } }

Menentukan fitur Sentence BERT

Anda dapat menentukan Sentence BERT fitur untuk properti node dengan menambahkan "type": "text_sbert" ke features array. Anda tidak perlu menentukan bahasa, karena metode ini secara otomatis mengkodekan fitur teks menggunakan model bahasa multibahasa.

Fitur node berikut ini menunjukkan bahwa properti description masing-masing node Movieharus diperlakukan sebagai fitur Sentence BERT:

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ ... ], "features": [ { "node": "Movie", "property": "description", "type": "text_sbert128", } ] } }

Menentukan fitur TF-IDF

Anda dapat menentukan TF-IDF fitur untuk properti node dengan menambahkan "type": "text_tfidf" ke features array.

Fitur node berikut ini menunjukkan bahwa properti bio masing-masing node Personharus diperlakukan sebagai fitur TF-IDF:

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ ... ], "features": [ { "node": "Movie", "property": "bio", "type": "text_tfidf", "ngram_range": [1, 2], "min_df": 5, "max_features": 1000 } ] } }

Menentukan fitur datetime

Proses ekspor secara otomatis menyimpulkan datetime fitur untuk properti tanggal. Namun, jika Anda ingin membatasi datetime_parts penggunaan untuk datetime fitur, atau mengganti spesifikasi fitur sehingga properti yang biasanya diperlakukan sebagai fitur secara eksplisit diperlakukan sebagai auto datetime fitur, Anda dapat melakukannya dengan menambahkan a "type": "datetime" ke array fitur.

Fitur node berikut ini menunjukkan bahwa properti createdAt masing-masing node Postharus diperlakukan sebagai fitur datetime:

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ ... ], "features": [ { "node": "Post", "property": "createdAt", "type": "datetime", "datetime_parts": ["month", "weekday", "hour"] } ] } }

Menentukan fitur category

Proses ekspor secara otomatis menyimpulkan auto fitur untuk properti string dan properti numerik yang berisi nilai kelipatan. Untuk properti numerik yang berisi nilai tunggal, ini menyimpulkan fitur. numerical Untuk properti tanggal, ia menyimpulkan datetime fitur.

Jika Anda ingin mengganti spesifikasi fitur sehingga properti diperlakukan sebagai fitur kategoris, tambahkan "type": "category" ke array fitur. Jika properti berisi beberapa nilai, sertakan separator bidang. Sebagai contoh:

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ ... ], "features": [ { "node": "Post", "property": "tag", "type": "category", "separator": "|" } ] } }

Menentukan fitur numerical

Proses ekspor secara otomatis menyimpulkan auto fitur untuk properti string dan properti numerik yang berisi nilai kelipatan. Untuk properti numerik yang berisi nilai tunggal, ini menyimpulkan fitur. numerical Untuk properti tanggal, ia menyimpulkan datetime fitur.

Jika Anda ingin mengganti spesifikasi fitur sehingga properti diperlakukan sebagai numerical fitur, tambahkan "type": "numerical" ke array fitur. Jika properti berisi beberapa nilai, sertakan separator bidang. Sebagai contoh:

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ ... ], "features": [ { "node": "Recording", "property": "duration", "type": "numerical", "separator": "," } ] } }

Menentukan fitur auto

Proses ekspor secara otomatis menyimpulkan auto fitur untuk properti string dan properti numerik yang berisi nilai kelipatan. Untuk properti numerik yang berisi nilai tunggal, ini menyimpulkan fitur. numerical Untuk properti tanggal, ia menyimpulkan datetime fitur.

Jika Anda ingin mengganti spesifikasi fitur sehingga properti diperlakukan sebagai auto fitur, tambahkan "type": "auto" ke array fitur. Jika properti berisi beberapa nilai, sertakan separator bidang. Sebagai contoh:

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ ... ], "features": [ { "node": "User", "property": "role", "type": "auto", "separator": "," } ] } }

RDFcontoh menggunakan additionalParams

Menentukan tingkat pemisahan default untuk konfigurasi pelatihan model

Dalam contoh berikut, split_rate parameter menetapkan tingkat pemisahan default untuk pelatihan model. Jika tidak ada tingkat pemisahan default yang ditentukan, pelatihan menggunakan nilai [0,9, 0,1, 0,0]. Anda dapat mengganti nilai default pada basis per-target dengan menentukan untuk setiap target. split_rate

Dalam contoh berikut, default split_rate bidang menunjukkan bahwa tingkat perpecahan [0.7,0.1,0.2] harus digunakan kecuali diganti berdasarkan per target:

"additionalParams": { "neptune_ml": { "version": "v2.0", "split_rate": [0.7,0.1,0.2], "targets": [ (...) ] } }

Menentukan tugas klasifikasi simpul untuk konfigurasi pelatihan model

Untuk menunjukkan properti node mana yang berisi contoh berlabel untuk tujuan pelatihan, tambahkan elemen klasifikasi node ke targets array, menggunakan"type" : "classification". Tambahkan bidang node untuk menunjukkan jenis node dari node target. Tambahkan predicate bidang untuk menentukan data literal mana yang digunakan sebagai fitur simpul target dari simpul target. Tambahkan split_rate bidang jika Anda ingin mengganti tingkat pemisahan default.

Dalam contoh berikut, node target menunjukkan bahwa genre properti dari setiap Movie node harus diperlakukan sebagai label kelas node. split_rateNilai mengesampingkan tingkat pemisahan default:

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "node": "http://aws.amazon.com/neptune/csv2rdf/class/Movie", "predicate": "http://aws.amazon.com/neptune/csv2rdf/datatypeProperty/genre", "type": "classification", "split_rate": [0.7,0.1,0.2] } ] } }

Menentukan tugas regresi simpul untuk konfigurasi pelatihan model

Untuk menunjukkan properti node mana yang berisi regresi berlabel untuk tujuan pelatihan, tambahkan elemen regresi simpul ke array target, menggunakan. "type" : "regression" Tambahkan node bidang untuk menunjukkan jenis node dari node target. Tambahkan predicate bidang untuk menentukan data literal mana yang digunakan sebagai fitur simpul target dari simpul target. Tambahkan split_rate bidang jika Anda ingin mengganti tingkat pemisahan default.

Target node berikut in imenunjukkan bahwa properti rating masing-masing simpul Movie harus diperlakukan sebagai label regresi simpul :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "node": "http://aws.amazon.com/neptune/csv2rdf/class/Movie", "predicate": "http://aws.amazon.com/neptune/csv2rdf/datatypeProperty/rating", "type": "regression", "split_rate": [0.7,0.1,0.2] } ] } }

Untuk menunjukkan tepi mana yang harus digunakan untuk tujuan pelatihan prediksi tautan, tambahkan elemen tepi ke larik target menggunakan"type" : "link_prediction". Tambahkansubject, predicate dan object bidang untuk menentukan jenis tepi. Tambahkan split_rate bidang jika Anda ingin mengganti tingkat pemisahan default.

edgeTarget berikut menunjukkan bahwa directed tepi yang Directors terhubung Movies harus digunakan untuk prediksi tautan:

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "subject": "http://aws.amazon.com/neptune/csv2rdf/class/Director", "predicate": "http://aws.amazon.com/neptune/csv2rdf/datatypeProperty/directed", "object": "http://aws.amazon.com/neptune/csv2rdf/class/Movie", "type" : "link_prediction" } ] } }

Untuk menunjukkan bahwa semua tepi harus digunakan untuk tujuan pelatihan prediksi tautan, tambahkan edge elemen ke array target menggunakan"type" : "link_prediction". Jangan menambahkansubject,predicate, atau object bidang. Tambahkan split_rate bidang jika Anda ingin mengganti tingkat pemisahan default.

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "type" : "link_prediction" } ] } }