本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Amazon Neptune 导出流程使用 AWS Batch 来预调配导出 Neptune 数据所需的计算和存储资源。运行导出时,您可以使用logs
字段中的链接访问导出任务的 CloudWatch 日志。
但是,执行导出的 AWS Batch 作业的 CloudWatch 日志仅在 AWS Batch 作业运行时可用。如果 Neptune 导出报告导出处于待处理状态,则不会有日志链接可供您访问 CloudWatch 日志。如果导出任务保持pending
状态的时间超过几分钟,则配置底层 AWS Batch 资源可能会出现问题。
当导出任务离开待处理状态时,您可以按如下方式检查其状态:
检查 AWS Batch 作业的状态
打开 AWS Batch 控制台,网址为https://console.aws.amazon.com/batch/
。 选择 neptune-export 任务队列。
查找名称与您开始导出时由 Neptune 导出返回的
jobName
相匹配的任务。

如果任务保持卡在 RUNNABLE
状态,则可能是因为网络或安全问题使容器实例无法加入底层的 Amazon Elastic Container Service (Amazon ECS) 集群。请参阅本支持文章
您可以检查的另一件事是自动扩缩是否存在问题:
查看计算环境的 Amazon EC2 自动缩放 AWS Batch 组
打开 Amazon EC2 控制台,网址为https://console.aws.amazon.com/ec2/
。 为 neptune-export 计算环境选择自动扩缩组。
打开活动选项卡,并查看活动历史记录中是否存在未成功的事件。

Neptune 导出常见错误
org.eclipse.rdf4j.query.QueryEvaluationException: Tag mismatch!
如果 export-rdf
任务经常失败并引发 Tag mismatch!
QueryEvaluationException
,则 Neptune 实例的大小对于 Neptune 导出使用的大型、长时间运行的查询来说太小了。
您可以通过纵向扩展到更大的 Neptune 实例或将任务配置为从大型克隆集群中导出来避免出现此错误,如下所示:
'{
"command": "export-rdf",
"outputS3Path": "s3://(your Amazon S3 bucket)
/neptune-export",
"params": {
"endpoint": "(your Neptune endpoint DNS name)
",
"cloneCluster": True,
"cloneClusterInstanceType" : "r5.24xlarge"
}
}'