集群关系图:
说明: 为了更加通俗的说明,笔者将两台运行 resourcemanager 进程的主机名抽象为 RM1 和 RM2,笔者更倾向 RM1 上的运行的是 active 状态的 resourcemanager 进程,RM2 上的运行的是 standby 状态的 resourcemanager 进程,而实际操作中,master5 就是这个 RM1 ,master52 就是这个 RM2。
抽象主机名实际操作主机名初始状态理想稳定状态ha-id
RM1master5activeactiverm1RM2master52standbystandbyrm2
其中关于 ha-id 是在 yarn-site.xml 配置文件中设置的。
hadoop也为管理员提供了 CLI 的方式管理 RM HA,但在没有启用 HA 的情况下,也就是在 yarn-site.xml 配置文件中没有设置 yarn.resourcemanager.ha.enabled 为 true 时 (默认为false,不启用),下面的命令是不可用的。
获得当前 RM 的 active 和 standby 状态
yarn rmadmin
-getServiceState rm1
yarn rmadmin
-getServiceState rm2
原文引用:https://blog.csdn.net/u011414200/article/details/50336735