HBaseRegionServerMonitor 是检测 hbase regionServer 挂掉并自动重启,可依样画葫芦检测
hdfs、spark 等大数据组件。
AutoRoleMonitor 是升级版,会自动检测 CDH 集群下所有的服务,有哪些服务挂了,并根据
大数据组件的依赖关系进行检测大数据组件异常并自动恢复。
全部代码亲测可用!!!
获取服务状态
为了监控集群中各个服务的运行状态,可以通过调用/clusters/{clusterName}/services API 接
口来实现。该接口会返回集群中所有服务的状态信息,包括服务名称、状态码等。
获取角色状态
对于每个服务,还可以进一步获取其内部各个角色的状态信息。这有助于定位问题,及时解
决潜在的风险。
/clusters/{clusterName}/services/{serviceName}/roles
/clusters/{clusterName}/services/{serviceName}/roleTypes
curl -u admin:admin -X GET 'http://cm_host:7180/api/v31/clusters/cluster/services/hdfs/roles'
启停角色服务
Post 请求:/clusters/{clusterName}/services/{serviceName}/roleCommands/start
Post 请求:/clusters/{clusterName}/services/{serviceName}/roleCommands/stop
提交 post 请求时,需要在请求体中添加这些 role 的名字,这些名字可以先通过或取角色状
态的 API 获得
详细文档参考 https://blog.csdn.net/linweidong/article/details/139595390