Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Amazon Neptunus ML untuk pembelajaran mesin pada grafik
Sering ada informasi berharga dalam set data terhubung yang besar yang sulit untuk diekstrak menggunakan kueri berdasarkan intuisi manusia saja. Teknik machine learning (ML) dapat membantu menemukan korelasi tersembunyi dalam grafik dengan miliaran hubungan. Korelasi ini sangat membantu untuk merekomendasikan produk, memprediksi kelayakan kredit, mengidentifikasi penipuan, dan banyak hal lainnya.
Fitur Neptune ML memungkinkan untuk membangun dan melatih model machine learning yang berguna pada grafik besar dalam hitungan jam, bukan minggu. Untuk mencapai hal ini, Neptunus ML menggunakan teknologi jaringan saraf grafik (GNN) yang didukung oleh SageMaker Amazon
catatan
Grafik vertex diidentifikasi dalam model Neptune ML sebagai “simpul”. Sebagai contoh, klasifikasi vertex menggunakan model machine learning klasifikasi simpul, dan regresi vertex menggunakan model regresi simpul.
Apa yang bisa dilakukan Neptune ML
Neptunus mendukung inferensi transduktif, yang mengembalikan prediksi yang telah dihitung sebelumnya pada saat pelatihan, berdasarkan data grafik Anda pada waktu itu, dan inferensi induktif, yang mengembalikan menerapkan pemrosesan data dan evaluasi model secara real time, berdasarkan data saat ini. Lihat Perbedaan antara inferensi induktif dan transduktif.
Neptunus ML dapat melatih model pembelajaran mesin untuk mendukung lima kategori inferensi yang berbeda:
Jenis tugas inferensi saat ini didukung oleh Neptune ML
-
Klasifikasi simpul — memprediksi fitur kategoris dari properti simpul.
Misalnya, film yang diberikan The Shawshank Redemption, Neptune ML dapat memprediksi properti
genre
-nya sebagaistory
dari satu set kandidat[story, crime, action, fantasy, drama, family, ...]
.Ada dua jenis tugas klasifikasi simpul:
Klasifikasi kelas tunggal: Dalam tugas semacam ini, setiap simpul memiliki hanya satu fitur target. Sebagai contoh, properti,
Place_of_birth
dariAlan Turing
memiliki nilaiUK
.Klasifikasi kelas ganda: Dalam tugas semacam ini, setiap simpul memiliki lebih dari satu fitur target. Sebagai contoh, properti
genre
dari film The Godfather memiliki nilaicrime
danstory
.
-
Regresi simpul — memprediksi properti numerik dari sebuah simpul.
Misalnya, film yang diberikan Avengers: Endgame, Neptune ML dapat memprediksi bahwa propertinya
popularity
memiliki nilai5.0
. -
Klasifikasi tepi — memprediksi fitur kategoris properti tepi.
Ada dua jenis tugas klasifikasi tepi:
Klasifikasi kelas tunggal: Dalam tugas semacam ini, setiap tepi hanya memiliki satu fitur target. Misalnya, tepi peringkat antara pengguna dan film mungkin memiliki properti,
liked
, dengan nilai “Ya” atau “Tidak”.Klasifikasi multi-kelas: Dalam tugas semacam ini, setiap tepi dapat memiliki lebih dari satu fitur target. Misalnya, peringkat antara pengguna dan film mungkin memiliki beberapa nilai untuk tag properti seperti “Lucu”, “Heartwarming”, “Chilling”, dan sebagainya.
-
Regresi tepi — memprediksi properti numerik tepi.
Misalnya, tepi peringkat antara pengguna dan film mungkin memiliki properti numerik
score
, di mana Neptunus ML dapat memprediksi nilai yang diberikan pengguna dan film. -
Prediksi tautan — memprediksi node tujuan yang paling mungkin untuk node sumber tertentu dan tepi keluar, atau node sumber yang paling mungkin untuk node tujuan tertentu dan tepi masuk.
Misalnya, dengan grafik pengetahuan penyakit obat, diberikan
Aspirin
sebagai simpul sumber, dantreats
sebagai tepi keluar, Neptunus ML dapat memprediksi node tujuan yang paling relevan sebagai,, dan seterusnya.heart disease
fever
Atau, dengan grafik pengetahuan Wikimedia, diberikan
President-of
sebagai edge atau relasi danUnited-States
sebagai simpul tujuan, Neptune ML dapat memprediksi kepala yang paling relevan sebagaiGeorge Washington
,Abraham Lincoln
,Franklin D. Roosevelt
, dan sebagainya.
catatan
Klasifikasi node dan klasifikasi Edge hanya mendukung nilai string. Itu berarti bahwa nilai properti numerik seperti 0
atau tidak 1
didukung, meskipun string setara "0"
dan adalah. "1"
Demikian pula, nilai properti Boolean true
dan false
tidak berfungsi, tetapi "true"
dan "false"
lakukan.
Dengan Neptune ML, Anda dapat menggunakan model machine learning yang termasuk dalam dua kategori umum:
Jenis model machine learning saat ini didukung oleh Neptune ML
Model Graph Neural Network (GNN) — Ini termasuk Relational Graph Convolutional Networks (
R-). GCNs Model GNN berfungsi untuk ketiga-tiga jenis tugas di atas. Model Knowledge-Graph Embedding (KGE) – Ini termasuk model
TransE
,DistMult
, danRotatE
. Mereka hanya sesuai untuk prediksi link.
Model yang ditentukan pengguna - Neptunus ML juga memungkinkan Anda menyediakan implementasi model kustom Anda sendiri untuk semua jenis tugas yang tercantum di atas. Anda dapat menggunakan toolkit Neptunus ML