Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Contoh penggunaan parameter di dalam additionalParams untuk menyetel konfigurasi model-pelatihan
Contoh berikut menunjukkan bagaimana memanfaatkan fitur "additionalParams" dalam grafik properti dan model RDF data untuk mengonfigurasi berbagai aspek proses pelatihan model untuk aplikasi Neptunus Neptunus. Contohnya mencakup berbagai fungsi, termasuk menentukan tingkat pemisahan default untuk data pelatihan/validasi/pengujian, mendefinisikan klasifikasi node, regresi, dan tugas prediksi tautan, serta mengonfigurasi berbagai jenis fitur seperti bucket numerik, penyematan teks, datetime, dan data kategoris. Konfigurasi terperinci ini memungkinkan Anda untuk menyesuaikan pipeline pembelajaran mesin dengan data spesifik dan persyaratan pemodelan Anda, membuka potensi penuh dari kemampuan Neptunus ML.
Daftar Isi
- Contoh grafik properti menggunakan additionalParams
- Menentukan tingkat pemisahan default untuk konfigurasi pelatihan model
- Menentukan tugas klasifikasi simpul untuk konfigurasi pelatihan model
- Menentukan tugas klasifikasi node multi-kelas untuk konfigurasi pelatihan model
- Menentukan tugas regresi simpul untuk konfigurasi pelatihan model
- Menentukan tugas klasifikasi tepi untuk konfigurasi pelatihan model
- Menentukan tugas klasifikasi tepi multi-kelas untuk konfigurasi pelatihan model
- Menentukan regresi edge untuk konfigurasi model-training
- Menentukan tugas prediksi tautan untuk konfigurasi pelatihan model
- Menentukan fitur bucket numerik
- Menentukan fitur Word2Vec
- Menentukan fitur FastText
- Menentukan fitur Sentence BERT
- Menentukan fitur TF-IDF
- Menentukan fitur datetime
- Menentukan fitur category
- Menentukan fitur numerical
- Menentukan fitur auto
- RDFcontoh menggunakan additionalParams
- Menentukan tingkat pemisahan default untuk konfigurasi pelatihan model
- Menentukan tugas klasifikasi simpul untuk konfigurasi pelatihan model
- Menentukan tugas regresi simpul untuk konfigurasi pelatihan model
- Menentukan tugas prediksi tautan untuk tepi tertentu
- Menentukan tugas prediksi tautan untuk semua sisi
Contoh grafik properti menggunakan additionalParams
Menentukan tingkat pemisahan default untuk konfigurasi pelatihan model
Dalam contoh berikut, split_rate
parameter menetapkan tingkat pemisahan default untuk pelatihan model. Jika tidak ada tingkat pemisahan default yang ditentukan, pelatihan menggunakan nilai [0,9, 0,1, 0,0]. Anda dapat mengganti nilai default pada basis per-target dengan menentukan untuk setiap target. split_rate
Dalam contoh berikut, default split_rate
bidang menunjukkan bahwa tingkat perpecahan [0.7,0.1,0.2]
harus digunakan kecuali diganti berdasarkan per target:
"additionalParams": { "neptune_ml": { "version": "v2.0", "split_rate": [0.7,0.1,0.2], "targets": [
(...)
], "features": [(...)
] } }
Menentukan tugas klasifikasi simpul untuk konfigurasi pelatihan model
Untuk menunjukkan properti node mana yang berisi contoh berlabel untuk tujuan pelatihan, tambahkan elemen klasifikasi node ke targets
array, menggunakan"type" :
"classification"
. Tambahkan split_rate
bidang jika Anda ingin mengganti tingkat pemisahan default.
Dalam contoh berikut, node
target menunjukkan bahwa genre
properti dari setiap Movie
node harus diperlakukan sebagai label kelas node. split_rate
Nilai mengesampingkan tingkat pemisahan default:
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "node": "Movie", "property": "genre", "type": "classification", "split_rate": [0.7,0.1,0.2] } ], "features": [
(...)
] } }
Menentukan tugas klasifikasi node multi-kelas untuk konfigurasi pelatihan model
Untuk menunjukkan properti node mana yang berisi beberapa contoh berlabel untuk tujuan pelatihan, tambahkan elemen klasifikasi node ke array target, gunakan"type" :
"classification"
, dan separator
untuk menentukan karakter yang dapat digunakan untuk membagi nilai properti target menjadi beberapa nilai kategoris. Tambahkan split_rate
bidang jika Anda ingin mengganti tingkat pemisahan default.
Dalam contoh berikut, node
target menunjukkan bahwa genre
properti dari setiap Movie
node harus diperlakukan sebagai label kelas node. separator
Bidang menunjukkan bahwa setiap properti genre berisi beberapa nilai yang dipisahkan titik koma:
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "node": "Movie", "property": "genre", "type": "classification", "separator": ";" } ], "features": [
(...)
] } }
Menentukan tugas regresi simpul untuk konfigurasi pelatihan model
Untuk menunjukkan properti node mana yang berisi regresi berlabel untuk tujuan pelatihan, tambahkan elemen regresi simpul ke array target, menggunakan. "type" : "regression"
Tambahkan bidang split_rate jika Anda ingin mengganti tingkat pemisahan default.
Target node
berikut in imenunjukkan bahwa properti rating
masing-masing simpul Movie
harus diperlakukan sebagai label regresi simpul :
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "node": "Movie", "property": "rating", "type" : "regression", "split_rate": [0.7,0.1,0.2] } ], "features": [
...
] } }
Menentukan tugas klasifikasi tepi untuk konfigurasi pelatihan model
Untuk menunjukkan properti edge mana yang berisi contoh berlabel untuk tujuan pelatihan, tambahkan elemen tepi ke targets
array, menggunakan"type" : "regression"
. Tambahkan bidang split_rate jika Anda ingin mengganti tingkat pemisahan default.
edge
Target berikut menunjukkan bahwa metAtLocation
properti setiap knows
tepi harus diperlakukan sebagai label kelas tepi:
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "edge": ["Person", "knows", "Person"], "property": "metAtLocation", "type": "classification" } ], "features": [
(...)
] } }
Menentukan tugas klasifikasi tepi multi-kelas untuk konfigurasi pelatihan model
Untuk menunjukkan properti edge mana yang berisi beberapa contoh berlabel untuk tujuan pelatihan, tambahkan elemen tepi ke targets
array, menggunakan"type" : "classification"
, dan separator
bidang untuk menentukan karakter yang digunakan untuk membagi nilai properti target menjadi beberapa nilai kategoris. Tambahkan split_rate
bidang jika Anda ingin mengganti tingkat pemisahan default.
edge
Target berikut menunjukkan bahwa sentiment
properti setiap repliedTo
tepi harus diperlakukan sebagai label kelas tepi. Bidang pemisah menunjukkan bahwa setiap properti sentimen berisi nilai yang dipisahkan koma multile:
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "edge": ["Person", "repliedTo", "Message"], "property": "sentiment", "type": "classification", "separator": "," } ], "features": [
(...)
] } }
Menentukan regresi edge untuk konfigurasi model-training
Untuk menunjukkan properti edge mana yang berisi contoh regresi berlabel untuk tujuan pelatihan, tambahkan edge
elemen ke targets
array, menggunakan. "type" : "regression"
Tambahkan split_rate
bidang jika Anda ingin mengganti tingkat pemisahan default.
edge
Target berikut menunjukkan bahwa rating
properti setiap reviewed
tepi harus diperlakukan sebagai regresi tepi:
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "edge": ["Person", "reviewed", "Movie"], "property": "rating", "type" : "regression" } ], "features": [
(...)
] } }
Menentukan tugas prediksi tautan untuk konfigurasi pelatihan model
Untuk menunjukkan tepi mana yang harus digunakan untuk tujuan pelatihan prediksi tautan, tambahkan elemen tepi ke larik target menggunakan"type" : "link_prediction"
. Tambahkan split_rate
bidang jika Anda ingin mengganti tingkat pemisahan default.
edge
Target berikut menunjukkan bahwa cites
tepi harus digunakan untuk prediksi tautan:
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "edge": ["Article", "cites", "Article"], "type" : "link_prediction" } ], "features": [
(...)
] } }
Menentukan fitur bucket numerik
Anda dapat menentukan fitur data numerik untuk properti node dengan menambahkan "type": "bucket_numerical"
ke features
array.
Fitur node
berikut ini menunjukkan bahwa properti age
masing-masing node Person
harus diperlakukan sebagai fitur bucket numerik:
"additionalParams": { "neptune_ml": { "targets": [
...
], "features": [ { "node": "Person", "property": "age", "type": "bucket_numerical", "range": [1, 100], "bucket_cnt": 5, "slide_window_size": 3, "imputer": "median" } ] } }
Menentukan fitur Word2Vec
Anda dapat menentukan Word2Vec
fitur untuk properti node dengan menambahkan "type": "text_word2vec"
ke features
array.
Fitur node
berikut ini menunjukkan bahwa properti description
masing-masing node Movie
harus diperlakukan sebagai fitur Word2Vec
:
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [
...
], "features": [ { "node": "Movie", "property": "description", "type": "text_word2vec", "language": "en_core_web_lg" } ] } }
Menentukan fitur FastText
Anda dapat menentukan FastText
fitur untuk properti node dengan menambahkan "type": "text_fasttext"
ke features
array. language
Bidang diperlukan, dan harus menentukan salah satu kode bahasa berikut:
en
(Bahasa Inggris)zh
(Bahasa Mandarin)hi
(Hindi)es
(Spanyol)fr
(Perancis)
Perhatikan bahwa text_fasttext
pengkodean tidak dapat menangani lebih dari satu bahasa pada satu waktu dalam suatu fitur.
node
Fitur berikut menunjukkan bahwa description
properti Prancis dari setiap Movie
node harus diperlakukan sebagai FastText
fitur:
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [
...
], "features": [ { "node": "Movie", "property": "description", "type": "text_fasttext", "language": "fr", "max_length": 1024 } ] } }
Menentukan fitur Sentence BERT
Anda dapat menentukan Sentence BERT
fitur untuk properti node dengan menambahkan "type": "text_sbert"
ke features
array. Anda tidak perlu menentukan bahasa, karena metode ini secara otomatis mengkodekan fitur teks menggunakan model bahasa multibahasa.
Fitur node
berikut ini menunjukkan bahwa properti description
masing-masing node Movie
harus diperlakukan sebagai fitur Sentence BERT
:
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [
...
], "features": [ { "node": "Movie", "property": "description", "type": "text_sbert128", } ] } }
Menentukan fitur TF-IDF
Anda dapat menentukan TF-IDF
fitur untuk properti node dengan menambahkan "type": "text_tfidf"
ke features
array.
Fitur node
berikut ini menunjukkan bahwa properti bio
masing-masing node Person
harus diperlakukan sebagai fitur TF-IDF
:
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [
...
], "features": [ { "node": "Movie", "property": "bio", "type": "text_tfidf", "ngram_range": [1, 2], "min_df": 5, "max_features": 1000 } ] } }
Menentukan fitur datetime
Proses ekspor secara otomatis menyimpulkan datetime
fitur untuk properti tanggal. Namun, jika Anda ingin membatasi datetime_parts
penggunaan untuk datetime
fitur, atau mengganti spesifikasi fitur sehingga properti yang biasanya diperlakukan sebagai fitur secara eksplisit diperlakukan sebagai auto
datetime
fitur, Anda dapat melakukannya dengan menambahkan a "type": "datetime"
ke array fitur.
Fitur node
berikut ini menunjukkan bahwa properti createdAt
masing-masing node Post
harus diperlakukan sebagai fitur datetime
:
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [
...
], "features": [ { "node": "Post", "property": "createdAt", "type": "datetime", "datetime_parts": ["month", "weekday", "hour"] } ] } }
Menentukan fitur category
Proses ekspor secara otomatis menyimpulkan auto
fitur untuk properti string dan properti numerik yang berisi nilai kelipatan. Untuk properti numerik yang berisi nilai tunggal, ini menyimpulkan fitur. numerical
Untuk properti tanggal, ia menyimpulkan datetime
fitur.
Jika Anda ingin mengganti spesifikasi fitur sehingga properti diperlakukan sebagai fitur kategoris, tambahkan "type": "category"
ke array fitur. Jika properti berisi beberapa nilai, sertakan separator
bidang. Sebagai contoh:
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [
...
], "features": [ { "node": "Post", "property": "tag", "type": "category", "separator": "|" } ] } }
Menentukan fitur numerical
Proses ekspor secara otomatis menyimpulkan auto
fitur untuk properti string dan properti numerik yang berisi nilai kelipatan. Untuk properti numerik yang berisi nilai tunggal, ini menyimpulkan fitur. numerical
Untuk properti tanggal, ia menyimpulkan datetime
fitur.
Jika Anda ingin mengganti spesifikasi fitur sehingga properti diperlakukan sebagai numerical
fitur, tambahkan "type": "numerical"
ke array fitur. Jika properti berisi beberapa nilai, sertakan separator
bidang. Sebagai contoh:
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [
...
], "features": [ { "node": "Recording", "property": "duration", "type": "numerical", "separator": "," } ] } }
Menentukan fitur auto
Proses ekspor secara otomatis menyimpulkan auto
fitur untuk properti string dan properti numerik yang berisi nilai kelipatan. Untuk properti numerik yang berisi nilai tunggal, ini menyimpulkan fitur. numerical
Untuk properti tanggal, ia menyimpulkan datetime
fitur.
Jika Anda ingin mengganti spesifikasi fitur sehingga properti diperlakukan sebagai auto
fitur, tambahkan "type": "auto"
ke array fitur. Jika properti berisi beberapa nilai, sertakan separator
bidang. Sebagai contoh:
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [
...
], "features": [ { "node": "User", "property": "role", "type": "auto", "separator": "," } ] } }
RDFcontoh menggunakan additionalParams
Menentukan tingkat pemisahan default untuk konfigurasi pelatihan model
Dalam contoh berikut, split_rate
parameter menetapkan tingkat pemisahan default untuk pelatihan model. Jika tidak ada tingkat pemisahan default yang ditentukan, pelatihan menggunakan nilai [0,9, 0,1, 0,0]. Anda dapat mengganti nilai default pada basis per-target dengan menentukan untuk setiap target. split_rate
Dalam contoh berikut, default split_rate
bidang menunjukkan bahwa tingkat perpecahan [0.7,0.1,0.2]
harus digunakan kecuali diganti berdasarkan per target:
"additionalParams": { "neptune_ml": { "version": "v2.0", "split_rate": [0.7,0.1,0.2], "targets": [
(...)
] } }
Menentukan tugas klasifikasi simpul untuk konfigurasi pelatihan model
Untuk menunjukkan properti node mana yang berisi contoh berlabel untuk tujuan pelatihan, tambahkan elemen klasifikasi node ke targets
array, menggunakan"type" :
"classification"
. Tambahkan bidang node untuk menunjukkan jenis node dari node target. Tambahkan predicate
bidang untuk menentukan data literal mana yang digunakan sebagai fitur simpul target dari simpul target. Tambahkan split_rate
bidang jika Anda ingin mengganti tingkat pemisahan default.
Dalam contoh berikut, node
target menunjukkan bahwa genre
properti dari setiap Movie
node harus diperlakukan sebagai label kelas node. split_rate
Nilai mengesampingkan tingkat pemisahan default:
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "node": "http://aws.amazon.com/neptune/csv2rdf/class/Movie", "predicate": "http://aws.amazon.com/neptune/csv2rdf/datatypeProperty/genre", "type": "classification", "split_rate": [0.7,0.1,0.2] } ] } }
Menentukan tugas regresi simpul untuk konfigurasi pelatihan model
Untuk menunjukkan properti node mana yang berisi regresi berlabel untuk tujuan pelatihan, tambahkan elemen regresi simpul ke array target, menggunakan. "type" : "regression"
Tambahkan node
bidang untuk menunjukkan jenis node dari node target. Tambahkan predicate
bidang untuk menentukan data literal mana yang digunakan sebagai fitur simpul target dari simpul target. Tambahkan split_rate
bidang jika Anda ingin mengganti tingkat pemisahan default.
Target node
berikut in imenunjukkan bahwa properti rating
masing-masing simpul Movie
harus diperlakukan sebagai label regresi simpul :
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "node": "http://aws.amazon.com/neptune/csv2rdf/class/Movie", "predicate": "http://aws.amazon.com/neptune/csv2rdf/datatypeProperty/rating", "type": "regression", "split_rate": [0.7,0.1,0.2] } ] } }
Menentukan tugas prediksi tautan untuk tepi tertentu
Untuk menunjukkan tepi mana yang harus digunakan untuk tujuan pelatihan prediksi tautan, tambahkan elemen tepi ke larik target menggunakan"type" : "link_prediction"
. Tambahkansubject
, predicate
dan object
bidang untuk menentukan jenis tepi. Tambahkan split_rate
bidang jika Anda ingin mengganti tingkat pemisahan default.
edge
Target berikut menunjukkan bahwa directed
tepi yang Directors
terhubung Movies
harus digunakan untuk prediksi tautan:
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "subject": "http://aws.amazon.com/neptune/csv2rdf/class/Director", "predicate": "http://aws.amazon.com/neptune/csv2rdf/datatypeProperty/directed", "object": "http://aws.amazon.com/neptune/csv2rdf/class/Movie", "type" : "link_prediction" } ] } }
Menentukan tugas prediksi tautan untuk semua sisi
Untuk menunjukkan bahwa semua tepi harus digunakan untuk tujuan pelatihan prediksi tautan, tambahkan edge
elemen ke array target menggunakan"type" :
"link_prediction"
. Jangan menambahkansubject
,predicate
, atau object
bidang. Tambahkan split_rate
bidang jika Anda ingin mengganti tingkat pemisahan default.
"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "type" : "link_prediction" } ] } }