Amazon Neptunus ML untuk pembelajaran mesin pada grafik

Sering ada informasi berharga dalam set data terhubung yang besar yang sulit untuk diekstrak menggunakan kueri berdasarkan intuisi manusia saja. Teknik machine learning (ML) dapat membantu menemukan korelasi tersembunyi dalam grafik dengan miliaran hubungan. Korelasi ini sangat membantu untuk merekomendasikan produk, memprediksi kelayakan kredit, mengidentifikasi penipuan, dan banyak hal lainnya.

Fitur Neptune ML memungkinkan untuk membangun dan melatih model machine learning yang berguna pada grafik besar dalam hitungan jam, bukan minggu. Untuk mencapai hal ini, Neptunus ML menggunakan teknologi jaringan saraf grafik (GNN) yang didukung oleh SageMaker Amazon AI dan Deep Graph Library (DGL) (yang merupakan sumber terbuka). Jaringan saraf grafik adalah bidang yang muncul dalam kecerdasan buatan (lihat, misalnya, Survei Komprehensif tentang Jaringan Saraf Grafik). Untuk tutorial langsung tentang penggunaan GNNs dengan DGL, lihat Mempelajari jaringan saraf grafik dengan Deep Graph Library.

catatan

Grafik vertex diidentifikasi dalam model Neptune ML sebagai “simpul”. Sebagai contoh, klasifikasi vertex menggunakan model machine learning klasifikasi simpul, dan regresi vertex menggunakan model regresi simpul.

Apa yang bisa dilakukan Neptune ML

Neptunus mendukung inferensi transduktif, yang mengembalikan prediksi yang telah dihitung sebelumnya pada saat pelatihan, berdasarkan data grafik Anda pada waktu itu, dan inferensi induktif, yang mengembalikan menerapkan pemrosesan data dan evaluasi model secara real time, berdasarkan data saat ini. Lihat Perbedaan antara inferensi induktif dan transduktif.

Neptunus ML dapat melatih model pembelajaran mesin untuk mendukung lima kategori inferensi yang berbeda:

Jenis tugas inferensi saat ini didukung oleh Neptune ML

Klasifikasi simpul — memprediksi fitur kategoris dari properti simpul.

Misalnya, film yang diberikan The Shawshank Redemption, Neptune ML dapat memprediksi properti genre-nya sebagai story dari satu set kandidat [story, crime, action, fantasy, drama, family, ...].

Ada dua jenis tugas klasifikasi simpul:
- Klasifikasi kelas tunggal: Dalam tugas semacam ini, setiap simpul memiliki hanya satu fitur target. Sebagai contoh, properti, Place_of_birth dari Alan Turing memiliki nilai UK.
- Klasifikasi kelas ganda: Dalam tugas semacam ini, setiap simpul memiliki lebih dari satu fitur target. Sebagai contoh, properti genre dari film The Godfather memiliki nilai crimedan story.
Regresi simpul — memprediksi properti numerik dari sebuah simpul.

Misalnya, film yang diberikan Avengers: Endgame, Neptune ML dapat memprediksi bahwa propertinya popularity memiliki nilai 5.0.
Klasifikasi tepi — memprediksi fitur kategoris properti tepi.

Ada dua jenis tugas klasifikasi tepi:
- Klasifikasi kelas tunggal: Dalam tugas semacam ini, setiap tepi hanya memiliki satu fitur target. Misalnya, tepi peringkat antara pengguna dan film mungkin memiliki properti,liked, dengan nilai “Ya” atau “Tidak”.
- Klasifikasi multi-kelas: Dalam tugas semacam ini, setiap tepi dapat memiliki lebih dari satu fitur target. Misalnya, peringkat antara pengguna dan film mungkin memiliki beberapa nilai untuk tag properti seperti “Lucu”, “Heartwarming”, “Chilling”, dan sebagainya.
Regresi tepi — memprediksi properti numerik tepi.

Misalnya, tepi peringkat antara pengguna dan film mungkin memiliki properti numerikscore, di mana Neptunus ML dapat memprediksi nilai yang diberikan pengguna dan film.
Prediksi tautan — memprediksi node tujuan yang paling mungkin untuk node sumber tertentu dan tepi keluar, atau node sumber yang paling mungkin untuk node tujuan tertentu dan tepi masuk.

Misalnya, dengan grafik pengetahuan penyakit obat, diberikan Aspirin sebagai simpul sumber, dan treats sebagai tepi keluar, Neptunus ML dapat memprediksi node tujuan yang paling relevan sebagai,, dan seterusnya. heart disease fever

Atau, dengan grafik pengetahuan Wikimedia, diberikan President-of sebagai edge atau relasi dan United-States sebagai simpul tujuan, Neptune ML dapat memprediksi kepala yang paling relevan sebagai George Washington, Abraham Lincoln, Franklin D. Roosevelt, dan sebagainya.

catatan

Klasifikasi node dan klasifikasi Edge hanya mendukung nilai string. Itu berarti bahwa nilai properti numerik seperti 0 atau tidak 1 didukung, meskipun string setara "0" dan adalah. "1" Demikian pula, nilai properti Boolean true dan false tidak berfungsi, tetapi "true" dan "false" lakukan.

Dengan Neptune ML, Anda dapat menggunakan model machine learning yang termasuk dalam dua kategori umum:

Jenis model machine learning saat ini didukung oleh Neptune ML

Model Graph Neural Network (GNN) — Ini termasuk Relational Graph Convolutional Networks (R-). GCNs Model GNN berfungsi untuk ketiga-tiga jenis tugas di atas.
Model Knowledge-Graph Embedding (KGE) – Ini termasuk model TransE, DistMult, dan RotatE. Mereka hanya sesuai untuk prediksi link.

Model yang ditentukan pengguna - Neptunus ML juga memungkinkan Anda menyediakan implementasi model kustom Anda sendiri untuk semua jenis tugas yang tercantum di atas. Anda dapat menggunakan toolkit Neptunus ML untuk mengembangkan dan menguji implementasi model kustom berbasis python Anda sebelum menggunakan API pelatihan Neptunus Neptunus dengan model Anda. Lihat Model khusus di Neptunus ML detail tentang cara menyusun dan mengatur implementasi Anda sehingga kompatibel dengan infrastruktur pelatihan Neptunus ML.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Contoh fungsi Lambda

Pengaturan Neptunus Neptunus