使用 Amazon Neptune 批量加载器摄取数据 - Amazon Neptune

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Amazon Neptune 批量加载器摄取数据

Amazon Neptune 提供将数据从外部文件直接加载到 Neptune 数据库集群中的 Loader 命令。您可以使用此命令来代替执行大量INSERT语句addVaddE步骤或其他API调用。

Neptune Loader 命令速度更快,开销更少,针对大型数据集进行了优化,同时支持 Gremlin 数据和所使用的RDF(资源描述框架)数据。SPARQL

以下关系图概述了加载过程:

显示将数据加载到 Neptune 中所涉及基本步骤的关系图。

下面是加载过程的步骤:

  1. 将数据文件复制到 Amazon Simple Storage Service (Amazon S3) 桶。

  2. 创建对存储桶具有读取和列出访问权限的IAM角色。

  3. 创建 Amazon S3 VPC 终端节点。

  4. 通过向 Neptune 数据库实例发送请求,启动 Nep HTTP tune 加载器。

  5. Neptune 数据库实例IAM扮演从存储桶加载数据的角色。

注意

如果加密数据是使用 Amazon S3 SSE-S3SSE-KMS模式加密的,则可以从 Amazon S3 加载这些数据,前提是您用于批量加载的角色可以访问 Amazon S3 对象,如果是 SSE-KMS,则可以访问kms:decrypt。然后,Neptune 可以模拟您的凭证并代表您发出 s3:getObject 调用。

但是,Neptune 当前不支持加载使用 SSE-C 模式加密的数据。

以下各节提供有关准备数据并将数据加载到 Neptune 中的说明。