本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
对 Neptune 导出过程进行故障排除
Amazon Neptune 导出流程使用 AWS Batch 来预调配导出 Neptune 数据所需的计算和存储资源。运行导出操作时,您可以使用 logs
字段中的链接访问导出任务的 CloudWatch 日志。
但是,执行导出的 AWS Batch 任务的 CloudWatch 日志仅在 AWS Batch 任务运行时才可用。如果 Neptune 导出报告导出处于待处理状态,则不会有日志链接可供您访问 CloudWatch 日志。如果导出任务保持 pending
状态的时间超过几分钟,则预调配底层 AWS Batch 资源可能会出现问题。
当导出任务离开待处理状态时,您可以按如下方式检查其状态:
检查 AWS Batch 任务的状态
打开 AWS Batch 控制台,地址:https://console.aws.amazon.com/batch/
。 选择 neptune-export 任务队列。
查找名称与您开始导出时由 Neptune 导出返回的
jobName
相匹配的任务。
如果任务保持卡在 RUNNABLE
状态,则可能是因为网络或安全问题使容器实例无法加入底层的 Amazon Elastic Container Service (Amazon ECS) 集群。请参阅本支持文章
您可以检查的另一件事是自动扩缩是否存在问题:
查看 AWS Batch 计算环境的 Amazon EC2 自动扩缩组
通过以下网址打开 Amazon EC2 控制台:https://console.aws.amazon.com/ec2/
。 为 neptune-export 计算环境选择自动扩缩组。
打开活动选项卡,并查看活动历史记录中是否存在未成功的事件。
Neptune 导出常见错误
org.eclipse.rdf4j.query.QueryEvaluationException: Tag mismatch!
如果 export-rdf
任务经常失败并引发 Tag mismatch!
QueryEvaluationException
,则 Neptune 实例的大小对于 Neptune 导出使用的大型、长时间运行的查询来说太小了。
您可以通过纵向扩展到更大的 Neptune 实例或将任务配置为从大型克隆集群中导出来避免出现此错误,如下所示:
'{ "command": "export-rdf", "outputS3Path": "s3://
(your Amazon S3 bucket)
/neptune-export", "params": { "endpoint": "(your Neptune endpoint DNS name)
", "cloneCluster": True, "cloneClusterInstanceType" : "r5.24xlarge" } }'