本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 Amazon EMR 替换运行状况不佳的节点
亚马逊 EMR 定期使用 Apache Hadoop 中的NodeManager 运行状况检查器服务
您可以选择 Amazon EMR 是应终止运行状况不佳的节点,还是将其保留在集群中。如果关闭运行状况不佳的节点替换,运行状况不佳的节点将保留在拒绝列表中,并继续计入集群容量。您仍然可以连接到 Amazon EC2 核心实例进行配置和恢复,因此您可以调整集群大小以增加容量。请注意,即使开启了终止保护,Amazon EMR 也会替换运行状况不佳的节点。
如果开启运行状况不佳的节点替换,Amazon EMR 将终止运行状况不佳的核心节点,并根据实例组中的实例数或实例集的目标容量预置新实例。如果多个或所有核心节点运行状况不佳的时间超过 45 分钟,Amazon EMR 将正常替换这些节点。
重要
为避免在 Amazon EMR 正常替换运行状况不佳的核心实例时永久丢失 HDFS 数据,建议您始终备份数据。
Amazon EMR CloudWatch 会针对不健康的节点替换发布亚马逊事件,因此您可以跟踪运行状况不佳的核心实例的情况。有关更多信息,请参阅运行状况不佳的节点替换事件。
默认节点替换和终止保护设置
运行状况不佳的节点替换适用于所有 Amazon EMR 发行版,但默认设置取决于您选择的发行版标签。您可以在创建新集群时配置运行状况不佳的节点替换,或随时进入集群配置,更改任意设置。
如果创建的单节点集群或高可用性集群运行 Amazon EMR 7.0 或更低版本,运行状况不佳的节点替换的默认设置取决于终止保护:
启用终止保护会禁用运行状况不佳的节点替换。
禁用终止保护会启用运行状况不佳的节点替换。
启动集群时配置运行状况不佳的节点替换
在使用控制台、或 API 启动集群时,您可以启用或禁用运行状况不佳的 AWS CLI节点替换。
默认的运行状况不佳的节点替换设置取决于您启动集群的方式:
-
Amazon EMR 控制台:运行状况不佳的节点替换默认处于启用状态。
-
AWS CLI
aws emr create-cluster
— 除非您指定--no-unhealthy-node-replacement
,否则默认情况下会启用不健康的节点替换。 -
Amazon EMR RunJobFlow API 命令 — 除非您将
UnhealthyNodeReplacement
布尔值设置为或,否则默认情况下会启用不健康的节点替换。True
False
在正在运行的集群中配置运行状况不佳的节点替换
您可以使用控制台、或 API 为正在运行的集群开启或关闭不健康的 AWS CLI节点替换。