neptune_ml 객체의 targets 필드 - Amazon Neptune

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

neptune_ml 객체의 targets 필드

JSON교육 데이터 내보내기 구성의 targets 필드에는 교육 작업을 지정하는 대상 개체 배열과 이 작업을 학습하기 위한 기계 학습 클래스 레이블이 포함됩니다. 대상 개체의 내용은 훈련 대상이 속성 그래프 데이터인지 데이터인지에 따라 달라집니다. RDF

속성 그래프 노드 분류 및 회귀 작업의 경우 배열의 대상 객체는 다음과 같을 수 있습니다.

{ "node": "(node property-graph label)", "property": "(property name)", "type" : "(used to specify classification or regression)", "split_rate": [0.8,0.2,0.0], "separator": "," }

속성 그래프 엣지 분류, 회귀 또는 연결 예측 작업의 경우 다음과 같을 수 있습니다.

{ "edge": "(edge property-graph label)", "property": "(property name)", "type" : "(used to specify classification, regression or link_prediction)", "split_rate": [0.8,0.2,0.0], "separator": "," }

RDF분류 및 회귀 작업의 경우 배열의 대상 객체는 다음과 같이 표시될 수 있습니다.

{ "node": "(node type of an RDF node)", "predicate": "(predicate IRI)", "type" : "(used to specify classification or regression)", "split_rate": [0.8,0.2,0.0] }

RDF링크 예측 작업의 경우 배열의 대상 개체는 다음과 같이 보일 수 있습니다.

{ "subject": "(source node type of an edge)", "predicate": "(relation type of an edge)", "object": "(destination node type of an edge)", "type" : "link_prediction", "split_rate": [0.8,0.2,0.0] }

대상 객체에는 다음과 같은 필드가 포함될 수 있습니다.

속성 그래프 대상 객체의 필드

대상 객체의 node(버텍스) 필드

대상 노드(버텍스)의 속성 그래프 레이블. 대상 객체는 node 요소 또는 edge 요소를 포함해야 하지만, 둘 다 포함해서는 안 됩니다.

node는 다음과 같이 단일 값을 취할 수 있습니다.

"node": "Movie"

또는 레이블이 여러 개인 버텍스의 경우 다음과 같이 값 배열을 사용할 수 있습니다.

"node": ["Content", "Movie"]

속성 그래프 대상 객체의 edge 필드

시작 노드 레이블, 자체 레이블, 끝 노드 레이블로 대상 엣지를 지정합니다. 대상 객체는 edge 요소 또는 node 요소를 포함해야 하지만, 둘 다 포함해서는 안 됩니다.

edge필드 값은 다음과 같이 시작 노드의 속성 그래프 레이블, 가장자리 자체의 속성 그래프 레이블, 최종 노드의 속성 그래프 레이블을 나타내는 세 개의 문자열로 JSON 구성된 배열입니다.

"edge": ["Person_A", "knows", "Person_B"]

시작 노드 및/또는 끝 노드에 레이블이 여러 개 있는 경우 다음과 같이 레이블을 배열로 묶습니다.

"edge": [ ["Admin", Person_A"], "knows", ["Admin", "Person_B"] ]

속성 그래프 대상 객체의 property 필드

다음과 같이 대상 버텍스 또는 엣지의 속성을 지정합니다.

"property" : "rating"

이 필드는 필수 필드입니다. 단, 대상 작업이 연결 예측인 경우는 예외입니다.

속성 그래프 대상 객체의 type 필드

node 또는 edge에서 수행할 대상 작업의 유형을 다음과 같이 나타냅니다.

"type" : "regression"

노드에 지원되는 작업 유형은 다음과 같습니다.

  • classification

  • regression

엣지에 지원되는 작업 유형은 다음과 같습니다.

  • classification

  • regression

  • link_prediction

이 필드는 필수 항목입니다.

속성 그래프 대상 객체의 split_rate 필드

(선택 사항) 훈련 단계, 검증 단계, 테스트 단계에서 각각 사용할 노드 또는 엣지의 비율 추정치입니다. 이 비율은 0과 1 사이의 숫자 3개를 더하면 1이 되는 JSON 배열로 표현됩니다.

"split_rate": [0.7, 0.1, 0.2]

선택 split_rate 필드를 제공하지 않는 경우 기본 추정값은 [0.9, 0.1, 0.0] 분류 및 회귀 작업과 연결 예측 작업에 사용됩니다. [0.9,0.05, 0.05]

속성 그래프 대상 객체의 separator 필드

(선택 사항) 분류 작업과 함께 사용됩니다.

separator 필드는 문자열에 여러 범주 값을 저장하는 데 사용 시 대상 속성값을 여러 범주 값으로 분할하는 데 사용되는 문자를 지정합니다. 예:

"separator": "|"

separator 필드가 있으면 해당 작업이 다중 대상 분류 작업임을 나타냅니다.

대상 개체의 RDF 필드

RDF대상 개체의 node 필드

대상 노드의 노드 유형을 정의합니다. 노드 분류 작업 또는 노드 회귀 작업에 사용됩니다. 에 있는 노드의 노드 유형은 다음과 같이 RDF 정의됩니다.

node_id, <http://www.w3.org/1999/02/22-rdf-syntax-ns#type>, node_type

An은 RDF node 다음과 같이 단일 값만 사용할 수 있습니다.

"node": "http://aws.amazon.com/neptune/csv2rdf/class/Movie"

RDF대상 개체의 subject 필드

연결 예측 작업의 경우 subject에서는 대상 엣지의 소스 노드 유형을 정의합니다.

"subject": "http://aws.amazon.com/neptune/csv2rdf/class/Director"
참고

연결 예측 작업의 경우 subjectpredicateobject와 함께 사용해야 합니다. 이 3가지 중 하나라도 제공되지 않으면 모든 엣지가 훈련 대상으로 취급됩니다.

RDF대상 개체의 predicate 필드

노드 분류 및 노드 회귀 작업의 경우 predicate에서는 대상 노드의 대상 노드 기능으로 사용되는 리터럴 데이터를 정의합니다.

"predicate": "http://aws.amazon.com/neptune/csv2rdf/datatypeProperty/genre"
참고

대상 노드에 대상 노드 기능을 정의하는 조건자가 하나뿐인 경우 predicate 필드를 생략할 수 있습니다.

연결 예측 작업의 경우 predicate에서는 대상 엣지의 관계 유형을 정의합니다.

"predicate": "http://aws.amazon.com/neptune/csv2rdf/datatypeProperty/direct"
참고

연결 예측 작업의 경우 predicatesubjectobject와 함께 사용해야 합니다. 이 3가지 중 하나라도 제공되지 않으면 모든 엣지가 훈련 대상으로 취급됩니다.

RDF대상 개체의 object 필드

연결 예측 작업의 경우 object에서는 대상 엣지의 대상 노드 유형을 정의합니다.

"object": "http://aws.amazon.com/neptune/csv2rdf/class/Movie"
참고

연결 예측 작업의 경우 objectsubjectpredicate와 함께 사용해야 합니다. 이 3가지 중 하나라도 제공되지 않으면 모든 엣지가 훈련 대상으로 취급됩니다.

RDF대상 개체의 type 필드

수행할 대상 작업의 유형을 다음과 같이 나타냅니다.

"type" : "regression"

RDF데이터에 지원되는 작업 유형은 다음과 같습니다.

  • link_prediction

  • classification

  • regression

이 필드는 필수 항목입니다.

속성 그래프 대상 객체의 split_rate 필드

(선택 사항) 훈련 단계, 검증 단계, 테스트 단계에서 각각 사용할 노드 또는 엣지의 비율 추정치입니다. 이러한 비율은 0과 1 사이의 숫자 3개를 더하면 1이 되는 JSON 배열로 표현됩니다.

"split_rate": [0.7, 0.1, 0.2]

옵션 split_rate 필드를 제공하지 않는 경우 기본 예상 값은 [0.9, 0.1, 0.0]입니다.