neptune_ml オブジェクトの targets フィールド - Amazon Neptune

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

neptune_ml オブジェクトの targets フィールド

JSON トレーニングデータエクスポート設定の targetsフィールドには、トレーニングタスクを指定するターゲットオブジェクトの配列と、このタスクをトレーニングするための機械学習クラスラベルが含まれています。ターゲットオブジェクトの内容は、プロパティグラフデータまたはRDFデータのどちらでトレーニングしているかによって異なります。

プロパティグラフノードの分類と回帰タスクでは、配列内のターゲットオブジェクトは次のようになります。

{ "node": "(node property-graph label)", "property": "(property name)", "type" : "(used to specify classification or regression)", "split_rate": [0.8,0.2,0.0], "separator": "," }

プロパティグラフのエッジ分類、回帰、またはリンク予測タスクでは、次のようになります。

{ "edge": "(edge property-graph label)", "property": "(property name)", "type" : "(used to specify classification, regression or link_prediction)", "split_rate": [0.8,0.2,0.0], "separator": "," }

RDF 分類タスクと回帰タスクの場合、配列内のターゲットオブジェクトは次のようになります。

{ "node": "(node type of an RDF node)", "predicate": "(predicate IRI)", "type" : "(used to specify classification or regression)", "split_rate": [0.8,0.2,0.0] }

RDF リンク予測タスクの場合、配列内のターゲットオブジェクトは次のようになります。

{ "subject": "(source node type of an edge)", "predicate": "(relation type of an edge)", "object": "(destination node type of an edge)", "type" : "link_prediction", "split_rate": [0.8,0.2,0.0] }

ターゲットオブジェクトには、次のフィールドを含めることができます。

プロパティグラフターゲットオブジェクトのフィールド

ターゲットオブジェクトの node (頂点) フィールド

ターゲットノード (頂点) のプロパティグラフラベル。ターゲットオブジェクトには、node 要素または edge 要素を含めますが、両方ではありません。

ある node は次のように、単一の値を取ることができます。

"node": "Movie"

または、マルチラベル頂点の場合、次のように値の配列をとることができます。

"node": ["Content", "Movie"]

プロパティグラフターゲットオブジェクトの edge フィールド

ターゲットエッジを、開始ノードラベル、独自のラベル、および終了ノードラベルで指定します。ターゲットオブジェクトには、edge 要素または node 要素を含めますが、両方ではありません。

edge フィールドの値は、次のように、開始ノードのプロパティグラフラベル (複数可)、エッジ自体のプロパティグラフラベル、および終了ノードのプロパティグラフラベル (複数可) を表す 3 つの文字列のJSON配列です。

"edge": ["Person_A", "knows", "Person_B"]

開始ノードや終了ノードに複数のラベルがある場合は、次のように配列で囲みます。

"edge": [ ["Admin", Person_A"], "knows", ["Admin", "Person_B"] ]

プロパティグラフターゲットオブジェクトの property フィールド

ターゲットの頂点またはエッジのプロパティを次のように指定します。

"property" : "rating"

このフィールドは、ターゲットタスクがリンク予測の場合を除き、必須です。

プロパティグラフターゲットオブジェクトの type フィールド

次のように、node または edge で実行されるターゲットタスクのタイプを示します。

"type" : "regression"

ノードでサポートされているタスクタイプは次のとおりです。

  • classification

  • regression

エッジでサポートされているタスクタイプは次のとおりです。

  • classification

  • regression

  • link_prediction

このフィールドは必須です。

プロパティグラフターゲットオブジェクトの split_rate フィールド

(オプション) トレーニング、検証、テストの各段階でそれぞれ使用するノードまたはエッジの比率の推定。これらの比率は、0 から 1 までの 3 つの数値のJSON配列で表され、合計は 1 になります。

"split_rate": [0.7, 0.1, 0.2]

オプションの split_rateフィールドを指定しない場合、デフォルトの推定値は[0.9, 0.1, 0.0]分類タスクと回帰タスク用、リンク予測タスク[0.9,0.05, 0.05]用です。

プロパティグラフターゲットオブジェクトの separator フィールド

(オプション) 分類タスクで使用します。

separator フィールドは、文字列に複数のカテゴリ値を格納する場合に、ターゲットプロパティ値を複数のカテゴリ値に分割するために使用する文字を指定します。例:

"separator": "|"

separator フィールドの存在は、そのタスクがマルチターゲット分類タスクであることを示します。

RDF ターゲットオブジェクトのフィールド

RDF ターゲットオブジェクトの nodeフィールド

ターゲットノードのノードタイプを定義します。ノード分類タスクまたはノード回帰タスクで使用されます。のノードのノードタイプRDFは、次のように定義されます。

node_id, <http://www.w3.org/1999/02/22-rdf-syntax-ns#type>, node_type

RDF node は、次のような単一の値しか取得できません。

"node": "http://aws.amazon.com/neptune/csv2rdf/class/Movie"

RDF ターゲットオブジェクトの subjectフィールド

リンク予測タスクの場合、subject はターゲットエッジの始点ノードタイプを定義します。

"subject": "http://aws.amazon.com/neptune/csv2rdf/class/Director"
注記

リンク予測タスクの場合、subjectpredicate および object とともに使用する必要があります。これら 3 つのいずれかが指定されていない場合、すべてのエッジがトレーニングターゲットとして扱われます。

RDF ターゲットオブジェクトの predicateフィールド

ノード分類およびノード回帰タスクの場合、predicate はターゲットノードのターゲットノード特徴として使用されるリテラルデータを定義します。

"predicate": "http://aws.amazon.com/neptune/csv2rdf/datatypeProperty/genre"
注記

ターゲットノードにターゲットノードの特徴を定義する述語が 1 つしかない場合は、predicate フィールドは省略できます。

リンク予測タスクの場合、predicate はターゲットエッジの関連タイプを定義します。

"predicate": "http://aws.amazon.com/neptune/csv2rdf/datatypeProperty/direct"
注記

リンク予測タスクの場合、predicatesubject および object とともに使用する必要があります。これら 3 つのいずれかが指定されていない場合、すべてのエッジがトレーニングターゲットとして扱われます。

RDF ターゲットオブジェクトの objectフィールド

リンク予測タスクの場合、object はターゲットエッジの終点ノードタイプを定義します。

"object": "http://aws.amazon.com/neptune/csv2rdf/class/Movie"
注記

リンク予測タスクの場合、objectsubject および predicate とともに使用する必要があります。これら 3 つのいずれかが指定されていない場合、すべてのエッジがトレーニングターゲットとして扱われます。

RDF ターゲットオブジェクトの typeフィールド

次のように、実行するターゲットタスクのタイプを示します。

"type" : "regression"

データのサポートされているタスクタイプRDFは次のとおりです。

  • link_prediction

  • classification

  • regression

このフィールドは必須です。

プロパティグラフターゲットオブジェクトの split_rate フィールド

(オプション) トレーニング、検証、テストの各段階でそれぞれ使用するノードまたはエッジの比率の推定。これらの比率は、0 から 1 までの 3 つの数値のJSON配列で表され、合計は 1 になります。

"split_rate": [0.7, 0.1, 0.2]

オプション split_rate フィールドを指定しない場合、デフォルトの推定値は [0.9, 0.1, 0.0] です。