使用 Amazon Neptune 批量加载程序摄取数据

Amazon Neptune 提供将数据从外部文件直接加载到 Neptune 数据库集群中的 Loader 命令。可使用此命令代替执行大量 INSERT 语句、addV 和 addE 步骤或其它 API 调用。

Neptune 加载程序命令更快、开销更低，已针对大型数据集进行优化，并且支持 Gremlin 数据和 SPARQL 使用的 RDF（资源描述框架）数据。

以下关系图概述了加载过程：

下面是加载过程的步骤：

将数据文件复制到 Amazon Simple Storage Service (Amazon S3) 桶。
创建对此存储桶具有读取和列出访问权限的 IAM 角色。
创建 Amazon S3 VPC 端点。
通过经由 HTTP 将请求发送到 Neptune 数据库实例来启动 Neptune 加载程序。
Neptune 数据库实例代入 IAM 角色以从桶加载数据。

注意

如果加密数据是使用 Amazon S3 SSE-S3 或SSE-KMS模式加密的，则可以从 Amazon S3 加载这些数据，前提是您用于批量加载的角色可以访问 Amazon S3 对象，如果是 SSE-KMS，也可以访问kms:decrypt。然后，Neptune 可以模拟您的凭证并代表您发出 s3:getObject 调用。

但是，Neptune 当前不支持加载使用 SSE-C 模式加密的数据。

以下各节提供有关准备数据并将数据加载到 Neptune 中的说明。

主题

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

加载数据

IAM 角色和 Amazon S3 访问权限