亚马逊 Neptune Engine 版本 1.3.2.0 (2024-06-10) - Amazon Neptune

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

亚马逊 Neptune Engine 版本 1.3.2.0 (2024-06-10)

自 2024 年 6 月 10 日起,引擎版本 1.3.2.0 已全面部署。请注意,新版本在每个区域的发布需要几天的时间。

注意

引擎版本 1.3.0.0 为自定义参数组和自定义集群参数组引入了一种新格式。因此,如果您要从 1.3.0.0 之前的引擎版本升级到引擎版本 1.3.0.0 或更高版本,则必须使用参数组系列 neptune1.3 重新创建所有现有的自定义参数组和自定义集群参数组。早期版本使用参数组系列 neptune1neptune1.2,而这些参数组不适用于版本 1.3.0.0 及更高版本。请参阅Amazon Neptune 参数组了解更多信息。

警告

引擎版本 1.3.2.0 引入了一些您应该注意的潜在问题。有关缓解版本 1.3.2.0 中的问题更多信息,请参阅以下部分。

此引擎版本中的改进

常规改进
  • 支持 1.3 TLS 版,包括密码套件 TLS _ AES _128_ _ SHA256 和 _ _256 GCM _ _。TLS AES GCM SHA384TLS1.3 是一个选项—— TLS 1.2 仍然是最低限度。

Gremlin 改进
  • TinkerPop 3.7.x 升级

  • StrictTimeoutValidation(仅当通过 labmode StrictTimeoutValidation 通过包含启用时StrictTimeoutValidation=enabled):当StrictTimeoutValidation参数的值为时enabled,指定为请求选项或查询提示的每个查询的超时值不能超过参数组中全局设置的值。在这种情况下,Neptune 会扔一个。InvalidParameterException当值为时,可以在/status端点的响应中确认此设置disabled,而在 Neptune 版本 1.3.2.0 中,此参数的默认值为。Disabled

openCypher 改进
  • 与之前的引擎版本相比,Amazon Neptune 引擎版本 1.3.2.0 的 openCypher 查询性能提高了 9 倍,吞吐量提高了 10 倍。

  • 低延迟查询和吞吐量性能改进:低延迟 openCypher 查询的整体性能改进。新版本还提高了此类查询的吞吐量。当使用参数化查询时,这些改进更为显著。

  • 对查询计划缓存的支持:将查询提交给 Neptune 时,查询字符串会被解析、优化并转换为查询计划,然后由引擎执行。应用程序通常以常见的查询模式为后盾,这些模式使用不同的值进行实例化。查询计划缓存可以通过缓存查询计划来减少总体延迟,从而避免对此类重复模式进行解析和优化。

  • DISTINCT聚合查询的性能改进。

  • 涉及可空变量的联接的性能改进。

  • 涉及不等于 id(节点/关系)谓词的查询的性能改进。

  • 扩展了对日期时间功能的支持(仅DatetimeMillisecond通过包含DatetimeMillisecond=enabled在实验室模式下启用。有关更多信息,请参阅 Neptune openCypher 实现中的时间支持(Neptune Analytics 和 Neptune 数据库 1.3.2.0 及更高版本)

此引擎版本中修复的缺陷

常规改进
  • 更新了验证对 Graphlytics 存储桶的访问权限时出现的 Neptuneml 错误消息。

Gremlin 修复
  • 修复了DFE查询翻译中缺少标签信息的问题,适用于非路径贡献步骤包含标签的情况。例如:

    g.withSideEffect('Neptune#useDFE', true). V(). has('name', 'marko'). has("name", TextP.regex("mark.*")).as("p1"). not(out().has("name", P.within("peter"))). out().as('p2'). dedup('p1', 'p2')
  • 修复了DFE查询转换中的一个NullPointerException错误,该错误发生在查询分成两个DFE片段执行时,第一个片段被优化为无法满足的节点。例如:

    g.withSideEffect('Neptune#useDFE', true). V(). has('name', 'doesNotExists'). has("name", TextP.regex("mark.*")). inject(1). V(). out(). has('name', 'vadas')
  • 修复了当查询中包含 by () 调制器且其输入为 Map InternalFailureException ValueTraversal 时,Neptune 可能会抛出一个错误。例如:

    g.V(). hasLabel("person"). project("age", "name").by("age").by("name"). order().by("age")
openCypher 修复
  • 改进了UNWIND操作(例如将值列表扩展为单个值),以帮助防止出现内存不足 (OOM) 的情况。例如:

    MATCH (n)-->(m) WITH collect(m) AS list UNWIND list AS m RETURN m, list
  • 修复了通过注入 id 的多个MERGE操作时的自定义 ID 优化问题UNWIND。例如:

    UNWIND [{nid: 'nid1', mid: 'mid1'}, {nid: 'nid2', mid: 'mid2'}] as ids MERGE (n:N {`~id`: ids.nid}) MERGE (m:M {`~id`: ids.mid})
  • 修复了在规划具有属性访问权限的复杂查询和具有双向关系的多跳时内存爆炸的问题。例如:

    MATCH (person1:person)-[:likes]->(res)-[:partOf]->(group)-[:knows]-(:entity {name: 'foo'}), (person1)-[:knows]->(person2)-[:likes]-(res2), (comment)-[:presentIn]->(:Group {name: 'barGroup'}), (person1)-[:commented]->(comment2:comment)-[:partOf]->(post:Post), (comment2)-[:presentIn]->(:Group {name: 'fooGroup'}), (comment)-[:contains]->(info:Details)-[:CommentType]->(:CommentType {name: 'Positive'}), (comment2)-[:contains]->(info2:Details)-[:CommentType]->(:CommentType {name: 'Positive'}) WHERE datetime('2020-01-01T00:00') <= person1.addedAfter <= datetime('2023-01-01T23:59') AND comment.approvedBy = comment2.approvedBy MATCH (comment)-[:contains]->(info3:Details)-[:CommentType]->(:CommentType {name: 'Neutral'}) RETURN person1, group.name, info1.value, post.ranking, info3.value
  • 修复了按变量分组为 null 的聚合查询。例如:

    MATCH (n) RETURN null AS group, sum(n.num) AS result
SPARQL修复
  • 修复了SPARQL解析器以缩短大型查询(例如INSERTDATA包含许多三元组和大标记)的解析时间。

缓解版本 1.3.2.0 中的问题

  • 对于版本 1.3.2.0,当在内部WITH子句中使用skiplimit并进行参数化时,我们检测到查询计划缓存中存在问题。例如:

    MATCH (n:Person) WHERE n.age > $age WITH n skip $skip LIMIT $limit RETURN n.name, n.age parameters={"age": 21, "skip": 2, "limit": 3}

    在这种情况下,第一个计划中的 skip 和 limit 的参数值也将应用于后续查询,从而导致意想不到的结果。

    缓解方法

    为防止出现此问题,请在提交包含参数化跳过和/或限制子句的查询QUERY:PLANCACHE "disabled"时添加查询提示。或者,您可以将值硬编码到查询中。

    选项 1:使用查询提示禁用计划缓存:

    Using QUERY:PLANCACHE "disabled" MATCH (n:Person) WHERE n.age > $age WITH n skip $skip LIMIT $limit RETURN n.name, n.age parameters={"age": 21, "skip": 2, "limit": 3}

    选项 2:使用硬编码值进行跳过和限制:

    MATCH (n:Person) WHERE n.age > $age WITH n skip 2 LIMIT 3 RETURN n.name, n.age parameters={"age": 21}
  • 使用查询计划缓存时,使用数字筛选器值的查询可能会返回错误的结果。为避免此问题,请使用查询提示QUERY:PLANCACHE "disabled"跳过查询计划缓存。例如,使用:

    USING QUERY:PLANCACHE "disabled" MATCH (n:person) WHERE n.yearOfBirth > $year RETURN n parameters={"year":1950}
  • 多次使用相同参数名称的查询可能会因错误而失败Parameter name should not be a number and/or contain _internal_ or _modified_user_ string within it. These are reserved for planCache. Otherwise, rerun with HTTP parameter planCache=disabled。在这种情况下,要么像上面那样跳过查询计划缓存,要么复制参数,如下例所示:

    MATCH (n:movie) WHERE n.runtime>=$minutes RETURN n UNION MATCH (n:show) WHERE n.duration>=$minutes RETURN n parameters={"minutes":130}

    使用提示QUERY:PLANCACHE "disabled"或修改参数:

    MATCH (n:movie) WHERE n.runtime>=$rt_min RETURN n UNION MATCH (n:show) WHERE n.duration>=$dur_min RETURN n parameters={"rt_min":130, "dur_min":130}
  • 如果查询是UNION或UNIONALL查询,则使用 Bolt 协议执行的查询可能会产生不正确的结果。为避免出现此问题,请考虑使用HTTP端点执行特定的查询。或者,在使用 Bolt 协议时,分别执行并集的每个部分。

此版本支持的查询语言版本

在将数据库集群升级到版本 1.3.2.0 之前,请确保您的项目与以下查询语言版本兼容:

  • 支持的 Gremlin 最早版本:3.7.1

  • 支持的 Gremlin 最新版本:3.7.1

  • openCypher 版本:Neptune-9.0.20190305-1.0

  • SPARQL版本:1.1

引擎版本 1.3.2.0 的升级路径

您可以从引擎版本 1.2.0.0 或更高版本升级到此版本。

升级到此版本

如果数据库集群运行的引擎版本有此版本的升级路径,则可以立即对其进行升级。您可以使用控制台上的数据库集群操作或使用,升级任何符合条件的集群SDK。以下CLI命令将立即升级符合条件的集群:

对于 Linux、OS X 或 Unix:

aws neptune modify-db-cluster \ --db-cluster-identifier (your-neptune-cluster) \ --engine-version 1.3.2.0 \ --allow-major-version-upgrade \ --apply-immediately

对于 Windows:

aws neptune modify-db-cluster ^ --db-cluster-identifier (your-neptune-cluster) ^ --engine-version 1.3.2.0 ^ --allow-major-version-upgrade ^ --apply-immediately

您可以指定 --no-apply-immediately,而不是 --apply-immediately。要执行主要版本升级, allow-major-version-upgrade参数是必需的。另外,请务必包括引擎版本,否则您的引擎可能会升级到其它版本。

如果集群使用自定义集群参数组,请确保包含以下参数以指定此参数组:

--db-cluster-parameter-group-name (name of the custom DB cluster parameter group)

同样,如果集群中的任何实例使用自定义数据库参数组,请确保包含此参数以指定此参数组:

--db-instance-parameter-group-name (name of the custom instance parameter group)

升级前始终先测试

发布新的主要或次要 Neptune 引擎版本时,请务必先在该版本上测试您的 Neptune 应用程序,然后再升级到该版本。即使是次要版本升级,也可能引入会影响代码的新特征或行为。

首先,将当前版本的发行说明页面与目标版本的发行说明页面进行比较,以查看查询语言版本是否会发生变化或是否会发生其它重大更改。

在升级生产数据库集群之前测试新版本的最佳方法是克隆生产集群,以便克隆运行新的引擎版本。然后,您可以在不影响生产数据库集群的情况下在克隆上运行查询。

请在升级之前始终创建手动快照

在执行升级之前,我们强烈建议您始终创建数据库集群的手动快照。拥有自动快照只能提供短期保护,而手动快照在您显式删除它之前仍然可用。

在某些情况下,作为升级过程的一部分,Neptune 会为您创建手动快照,但您不应依赖此快照,无论如何都应创建自己的手动快照。

当您确定不需要将数据库集群恢复到其升级前的状态时,可以显式删除自己创建的手动快照以及 Neptune 可能已创建的手动快照。如果 Neptune 创建手动快照,则其名称将以 preupgrade 开头,后跟数据库集群的名称、源引擎版本、目标引擎版本和日期。

注意

如果您在待处理操作正在进行时尝试升级,则可能会遇到如下错误:

We're sorry, your request to modify DB cluster (cluster identifier) has failed. Cannot modify engine version because instance (instance identifier) is running on an old configuration. Apply any pending maintenance actions on the instance before proceeding with the upgrade.

如果遇到此错误,请等待待处理操作完成,或者立即触发维护时段,让之前的升级完成。

有关升级引擎版本的更多信息,请参阅维护 Amazon Neptune 数据库集群。如果您有任何疑问或疑虑, AWS 可通过社区论坛和AWS 高级支持与支持团队联系