Neptune 내보내기 프로세스를 제어하는 데 사용되는 파라미터 - Amazon Neptune

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Neptune 내보내기 프로세스를 제어하는 데 사용되는 파라미터

Neptune-Export 서비스를 사용하든 neptune-export 명령줄 유틸리티를 사용하든 관계없이, 내보내기를 제어하는 데 사용하는 파라미터는 거의 동일합니다. 여기에는 명령줄에서 neptune-export 또는 Neptune-Export 엔드포인트에 전달된 JSON 객체가 포함되어 있습니다.

내보내기 프로세스에 전달된 객체에는 최대 5개의 최상위 필드가 있습니다.

-d '{ "command" : "(either export-pg or export-rdf)", "outputS3Path" : "s3:/(your Amazon S3 bucket)/(path to the folder for exported data)", "jobsize" : "(for Neptune-Export service only)", "params" : { (a JSON object that contains export-process parameters) }, "additionalParams": { (a JSON object that contains parameters for training configuration) } }'
목차

command 파라미터

command 최상위 파라미터는 속성 그래프 데이터를 내보낼지 아니면 RDF 데이터를 내보낼지 결정합니다. command 파라미터를 생략하면 내보내기 프로세스에서 기본적으로 속성 그래프 데이터를 내보냅니다.

  • export-pg   –   속성 그래프 데이터를 내보냅니다.

  • export-rdf   –   RDF 데이터를 내보냅니다.

outputS3Path 파라미터

outputS3Path 최상위 파라미터는 필수이며, 내보낸 파일을 게시할 수 있는 Amazon S3 위치의 URI를 포함해야 합니다.

"outputS3Path" : "s3://(your Amazon S3 bucket)/(path to output folder)"

값은 s3://로 시작하고, 그 뒤에 유효한 버킷 이름과 필요에 따라 버킷 내 폴더 경로가 와야 합니다.

jobSize 파라미터

jobSize 최상위 파라미터는 Neptune-Export 서비스에서만 사용되며, neptune-export 명령줄 유틸리티에서는 사용되지 않고 선택 사항입니다. 이 파라미터를 사용하면 시작하는 내보내기 작업의 크기를 특성화할 수 있으므로, 작업에 사용되는 컴퓨팅 리소스의 양과 최대 동시성 수준을 결정하는 데 도움이 됩니다.

"jobsize" : "(one of four size descriptors)"

4가지 유효한 크기 설명자는 다음과 같습니다.

  • small   –   최대 동시성: 8. 최대 10GB의 스토리지 볼륨에 적합합니다.

  • medium   –   최대 동시성: 32. 최대 100GB의 스토리지 볼륨에 적합합니다.

  • large   –   최대 동시성: 64. 100GB 초과, 1TB 미만의 스토리지 볼륨에 적합합니다.

  • xlarge   –   최대 동시성: 96. 1TB 이상의 스토리지 볼륨에 적합합니다.

기본적으로 Neptune-Export 서비스에서 시작된 내보내기는 small 작업으로 실행됩니다.

내보내기 성능은 jobSize 설정뿐 아니라 내보내는 데이터베이스 인스턴스 수, 각 인스턴스의 크기, 작업의 효과적인 동시성 수준에 따라서도 달라집니다.

속성 그래프 내보내기의 경우 cloneClusterReplica개수 파라미터를 사용하여 데이터베이스 인스턴스 수를 구성하고, 동시성 파라미터를 사용하여 작업의 효과적인 동시성 수준을 구성할 수 있습니다.

params 객체

params 최상위 파라미터는 params 최상위 JSON 객체에서 파라미터 필드 내보내기에 설명된 대로 내보내기 프로세스 자체를 제어하는 데 사용하는 파라미터가 포함된 JSON 객체입니다. params 객체의 일부 필드는 속성 그래프 내보내기에만 사용되고 일부는 RDF로 내보내는 데 사용됩니다.

additionalParams 객체

additionalParams 최상위 파라미터는 데이터를 내보낸 후 데이터에 적용되는 작업을 제어하는 데 사용할 수 있는 파라미터를 포함하는 JSON 객체입니다. 현재 additionalParamsNeptune ML의 훈련 데이터를 내보내는 데만 사용됩니다.