本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 Amazon Neptune 批量加载器摄取数据
Amazon Neptune 提供将数据从外部文件直接加载到 Neptune 数据库集群中的 Loader
命令。您可以使用此命令来代替执行大量INSERT
语句addV
、addE
步骤或其他API调用。
Neptune Loader 命令速度更快,开销更少,针对大型数据集进行了优化,同时支持 Gremlin 数据和所使用的RDF(资源描述框架)数据。SPARQL
以下关系图概述了加载过程:
下面是加载过程的步骤:
将数据文件复制到 Amazon Simple Storage Service (Amazon S3) 桶。
创建对存储桶具有读取和列出访问权限的IAM角色。
创建 Amazon S3 VPC 终端节点。
通过向 Neptune 数据库实例发送请求,启动 Nep HTTP tune 加载器。
Neptune 数据库实例IAM扮演从存储桶加载数据的角色。
注意
如果加密数据是使用 Amazon S3 SSE-S3
或SSE-KMS
模式加密的,则可以从 Amazon S3 加载这些数据,前提是您用于批量加载的角色可以访问 Amazon S3 对象,如果是 SSE-KMS,则可以访问kms:decrypt
。然后,Neptune 可以模拟您的凭证并代表您发出 s3:getObject
调用。
但是,Neptune 当前不支持加载使用 SSE-C
模式加密的数据。
以下各节提供有关准备数据并将数据加载到 Neptune 中的说明。