翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
グラフ上の機械学習のための Amazon Neptune ML
多くの場合、大きな接続データセットには、人間の直感だけに基づくクエリを使用して抽出するのが難しい貴重な情報があります。機械学習 (ML) 手法は、数十億もの関係を持つグラフの隠れた相関を見つけるのに役立ちます。これらの相関関係は、製品の推奨、信用力の予測、詐欺の特定、その他多くの事柄に役立ちます。
Neptune ML 機能を使用すると、数週間ではなく数時間で、大きなグラフで便利な機械学習モデルを構築し、トレーニングすることができます。これを実現するために、Neptune ML は Amazon SageMaker AI
注記
グラフの頂点は、Neptune ML モデルでは「ノード」として識別されます。たとえば、頂点分類ではノード分類機械学習モデルを使用し、頂点回帰はノード回帰モデルを使用します。
Neptune MLができること
Neptune は、トレーニング時に事前に計算された予測をその時点のグラフデータに基づいて返すトランスダクティブ推論と、現在のデータに基づいて適用データ処理とモデル評価をリアルタイムで返す帰納的推論の両方をサポートしています。「帰納的推論とトランスダクティブ推論の違い」を参照してください。
Neptune ML は、次の 5 つの異なるカテゴリの推論をサポートするように機械学習モデルをトレーニングできます。
Neptune ML で現在サポートされている推論タスクのタイプ
-
ノード分類 — 頂点プロパティのカテゴリカル特徴を予測します。
たとえば、ショーシャンクの空にという映画について、Neptune ML はその
genre
プロパティを[story, crime, action, fantasy, drama, family, ...]
の候補集合からstory
として予測できます。ノード分類タスクには 2 つのタイプがあります。
単一クラス分類: この種のタスクでは、各ノードにはターゲットフィーチャが 1 つしかありません。たとえば、プロパティ、
Alan Turing
のPlace_of_birth
にはUK
値があります。複数クラス分類: この種のタスクでは、各ノードにはターゲットフィーチャが 1 つしかありません。たとえば、映画ゴッドファーザーのプロパティ
genre
にはcrime
およびstory
の値があります。
-
ノード回帰 — 頂点の数値プロパティを予測します。
たとえば、映画[アベンジャーズ/エンドゲーム]では、Neptune MLはそのプロパティ
popularity
は5.0
の値を有すると予測できます。 -
ノード分類 — 頂点プロパティのカテゴリカル特徴を予測します。
ノード分類タスクには 2 つのタイプがあります。
単一クラス分類: この種のタスクでは、各ノードにはターゲットフィーチャが 1 つしかありません。たとえば、ユーザーと映画の間の評価エッジには、「はい」または「いいえ」のいずれかの値を持つ、プロパティ
liked
が含まれる場合があります。複数クラス分類: この種のタスクでは、各ノードにはターゲットフィーチャが 1 つしかありません。たとえば、ユーザーと映画の間の評価には、「面白い」、「心温まる」、「リラックスできる」などのプロパティタグに対する複数の値が含まれる場合があります。
-
エッジ回帰 — エッジの数値プロパティを予測します。
たとえば、ユーザーと映画の間の評価エッジには、数値プロパティ
score
が含まれる場合があります。このためにNeptune MLは、ユーザーと映画を特定する値を予測できます。 -
リンク予測 — 特定のソースノードと発信エッジの最も可能性の高いデスティネーションノード、または特定のデスティネーションノードと着信エッジの最も可能性の高いソースノードを予測します。
例えば、薬物疾患の知識グラフでは、ソースノードとして
Aspirin
、出力エッジとしてtreats
があり、Neptune ML は最も関連性の高い宛先ノードをheart disease
、fever
、などと予測できます。または、ウィキメディアのナレッジグラフで与えられたエッジ
President-of
またはデスティネーションノードとしてリレーションおよびUnited-States
の場合、Neptune MLは、最も関連性の高いヘッドをGeorge Washington
、Abraham Lincoln
、Franklin D. Roosevelt
、などのように予測できます。
注記
ノード分類とエッジ分類は文字列値のみをサポートします。つまり、0
や 1
などの数値プロパティ値はサポートされませんが、該当する文字列 "0"
および "1"
はサポートされます。同様に、ブールのプロパティ値 true
および false
は機能しませんが、"true"
および "false"
は機能します。
Neptune ML では、次の 2 つの一般的なカテゴリに分類される機械学習モデルを使用できます。
Neptune ML で現在サポートされている機械学習モデルの種類
グラフニューラルネットワーク (GNN) モデル – これにはリレーショナルグラフ畳み込みネットワーク (R-GCNs) が含まれます
。 GNNモデルは上記の 3 種類のタスクすべてで機能します。 ナレッジグラフ埋め込み (KGE) モデル – 、
TransE
DistMult
、RotatE
モデルが含まれます。リンク予測のみに機能します。
ユーザー定義のモデル — Neptune ML では、上記のすべてのタイプのタスクに対して独自のカスタムモデル実装を提供することもできます。Neptune ML ツールキット