Amazon Neptune 대량 로더를 사용하여 데이터 수집

Amazon Neptune은 외부 파일에서 Neptune DB 클러스터로 직접 데이터를 로드하는 Loader 명령을 제공합니다. 다수의 INSERT 문, addV 및 addE 단계 또는 기타 API 호출을 실행하는 대신 이 명령을 사용할 수 있습니다.

Neptune 로더 명령은 더 빠르고 오버헤드가 적으며 대규모 데이터 세트에 최적화되어 있습니다. 또한 SPARQL에서 사용하는 Gremlin 데이터와 리소스 기술 프레임워크(RDF) 데이터를 모두 지원합니다.

다음 그림은 로드 프로세스 개요를 보여줍니다.

다음은 로딩 프로세스의 단계입니다.

데이터 파일을 Amazon Simple Storage Service(S3) 버킷에 복사합니다.
버킷에 대한 읽기 및 목록 액세스 권한이 있는 IAM 역할을 생성합니다.
Amazon S3 VPC 엔드포인트 생성
HTTP를 통해 Neptune DB 인스턴스로 요청을 전송하여 Neptune 로더를 시작합니다.
Neptune DB 인스턴스가 IAM 역할을 맡아 버킷의 데이터를 로드합니다.

참고

Amazon S3 SSE-S3 또는 SSE-KMS 모드를 사용하여 암호화된 경우 Amazon S3에서 암호화된 데이터를 로드할 수 있습니다. 단, 대량 로드에 사용하는 역할에 Amazon S3 객체에 대한 액세스 권한이 있어야 합니다(SSE-KMS의 경우에는 kms:decrypt). 그런 다음 Neptune은 사용자의 보안 인증 정보를 모방하고 사용자 대신 s3:getObject 호출을 실행할 수 있습니다.

단, Neptune은 현재 SSE-C 모드로 암호화된 데이터의 로딩을 지원하지 않습니다.

다음 섹션에서는 데이터를 준비하여 Neptune으로 로드하는 방법을 설명합니다.

주제

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

데이터 로딩

IAM 역할 및 Amazon S3 액세스