没有合适的资源?快使用搜索试试~ 我知道了~
Ambari 操作指南 .docx
需积分: 50 39 下载量 168 浏览量
2020-08-21
17:30:48
上传
评论 1
收藏 136KB DOCX 举报
温馨提示
试读
64页
Apache Ambari 从集群节点和服务收集了大量的信息,并把它们表现为容易使用的,集中化的接口:Ambari Web
资源推荐
资源详情
资源评论
作用:
是用在商业主机网络集群上的大规模、分布式的数据存储和处理基础架构。监控和
管理如此复杂的分布式系统是不简单的。为了管理这种复杂性,
从集群节点和服务收集了大量的信息,并把它们表现为容易使用的,集中化
的接口:
功能:
显示诸如服务特定的摘要、图表以及警报信息
创建和管理 集群并执行基本的操作任务,例如启动和停止服务,向集群
中添加主机,以及更新服务配置
执行集群管理任务,例如启用 安全以及执行 升级
使用:
一、Dashboard(仪表盘)
使用集群仪表盘来监控 集群。通过单机 主窗口顶端的 访
问集群仪表盘。显示仪表盘页作为主页。使用仪表盘来查看集群的操作状态。
左侧显示集群当前运行的 服务列表。仪表盘包括 以
及 选项卡;默认显示 选项卡。
! 在 页面上,有多个小程序"#$表现 集群服务的操作状态信息。
多数小程序显示一个度量值"$例如,%表示为一个负载图表和一个百
分数指示。
%:
&&:&&'()*+"')$堆内存使用的百分数。
%:分布式文件系统"%$已使用的百分比,包括 %和 ,%
&&-:#.-百分比
&/(:运转中的 &的数量,由 &&报告
&&0:潜在 0队列平均水平 "1(02**+ $
&&3:&&正常运行时间计算值"*3+*+3$
40&:
0*5以使用的 0*')堆内存百分比
&/(:运转中的 &数量,由 0*报告
0*3:0**3
40& :可用的 40&内存百分数"*(*+(++$
6:
65已使用的 &&')对内存百分数
6(/:6(上的平均负载
013:转换中的 6数量
63:6*3
:
*(/(:运转中的 *(的数量,由 &*(报告
+*,:
*5集群范围的内存使用,包括缓存的"$,交换的"#$使用的
"*$以及共享的"$
&#*5集群范围的网络利用,包括输入和输出"+*,,*$
7
5集群范围的 信息,包括系统的,用户的及 #-"+*
*#-$
+*/5集群范围负载信息,包括节点总数, 总数,运行的进程数量,以及
,/
!7:评价指标可视化
如前所 述, # 主页左侧 被切 分 出 一个 状 态 摘要 面板 ,并 在顶 部有
和 选项卡,默认显示 选项卡。
当要查看整个集群利用情况的图形表示时,单击 选项卡,使用简单的颜色代码,
称为 提供这类信息。
集群中每个主机表示为一个带颜色的块。将鼠标悬停在主机的颜色块上可以看到该主机更
多的信息,在另一窗口上显示有关主机上安装的 组件的度量值。
在块中显示的颜色表示在一组选定的 单元中的使用率。如果任何确定使用率的必要
的数据不可用,这个块显示为 (+!通过修改
默认的最大值解决这个问题,使用 +菜单
!8 :配置历史
二、Service
7!操作状态
左侧的服务摘要列表列出了当前监控的所有 组件服务。图标的形状,
颜色,以及每个条目左侧的动作指明了每个条目的操作状态:
实心绿 "+$9++*
闪烁绿"+$93*
实心红 "+$9+#
闪烁红 "+$9
7!7 链接到服务 "/($
%/和 6/#列出 组件用于链接到更多的 信息,可用的线
程栈,日志,以及纯组件 !例如,可以为 %链接到
&& &&和 &。
单击 下拉列表从每个服务可用的链接列表中选择。包括如下服务
的度量的附加链接:
%:
&&:/&&
&&/:/&&+
&&'::/&&':(+
1:/&&
6:
6:/6
6/:/6+
;<:/;<3
6'::/6':(+
**:/*<3
1:/6
8
三、Hosts
作为集群系统管理员或集群操作员,需要知道每部主机的操作状态。也需要知道哪部主机
有问题需要处理。可以使用 页面来管理多个 #+=
"$ 组 件 , 例 如 运 行 在 整 个 集 群 上 & && & 和
0(!举例来说,可以重启所有的 &组件,可选地控制滚动重启任务 。
可以过滤进行管理的主机组件选取,基于操作状态,主机健康状况,以及定
义的主机分组。
3.1 理解主机状态 (Understanding Host Status)
可以在 页面查看集群上单个主机的状态。主机以 <*++ 2*+
"%>&$的形式列出,并附有一个带有颜色的图标指示出
主机的操作状态。
?红色三角形 :该主机上至少有一个 组件挂掉了,鼠标悬停图标上查看一个工
具提示列出受影响的组件。
?橘色 :该主机上至少有一个 +(组件挂掉了,鼠标悬停图标上查看一个工具提
示列出受影响的组件。
?黄色 5(没有从该主机上收到心跳包超过 8分钟。
?绿色 :正常运行状态。
?:黑色 @医药箱@图标指出一部主机处于维护模式。
?+:红色方框带有一个数字指明该主机上的警报数量。
红 色 图 标 覆 盖 橘 色图 标 , 橘 色 图 标 覆 盖黄 色 图 标 。 换 句 话 说 , 一部 主机 有
宕机附有一个红色图标,即便它可能也有 +(和连接问题。主机处
于维护模式或遇到警报,图标出现在主机名右侧。
3.2 查找主机页面 (Searching the Hosts Page)
可以查找完全主机列表,通过主机名,组件属性,以及组件操作状态过滤查找。也可以通
过关键字查找,简单地在搜索框内输入一个单词。
主机搜索工具在主机列表上方
A单击搜索框
出现可用的搜索类型,包括:
通过主机属性搜索 :通过 *以及其他属性
(:通过给定一个服务,查找运行此服务组件主机
:查找运行某组件处于给定状态的主机,例如
等等。
#:在搜索框输入任何单词描述要查找的内容,这成为一个文本过滤器。
B单击搜索类型
出现一个可用选项的列表,取决于在第一步中的选择
例如,如果选择单击了 (当前服务出现
C单击一个选项
匹配当前搜索条件的列表显示到 页面
D
E单击下一选项再次调整搜索
3.3 执行主机级别的动作 (Performing Host-Level Ac"ons)
利用 3控件对集群主机执行动作。可以执行的动作 "3$由一个一上的操作
"3$组成,可能在多个主机上,也称为批量操作"*+3$!
3控件由三个顺序的菜单精确定义" *$的工作流组成:一个主机菜单,
一个基于主机选择的对象菜单,基于对象选择的动作菜单。
例如,如果要重启集群中任何存在 0(主机的 0(服务组件:
A在 页面,选择或查找运行 0(到主机:
B利用 3控件,单击 %F0(F0
C单击 -来启动选定的操作
E可选地,监控后台操作,诊断或处理重启操作故障
3.4 管理主机上的组件 (Managing Components on a Host)
管理特定主机上运行的组件,在 页面列出的 %>&中单击一个,那个主机的页面出
现,单击 * 选项卡显示组件面板列出该主机安装的所有组件
要管理一部主机上所有的组件,可以利用显示窗口右上角的 3控件来对所选主
机上安装的所有组件 +或 *
另一方面,可以管理单个组件,利用在组件面板内显示在每个单独组件旁边的下拉菜单。
每个组件的菜单标示了组件当前的操作状态。打开菜单,显示可用的管理选项,基于标示
的状态。例如,可以 %的 &组件执行 动作
3.5 退役一个 Master 或 Slave (Decommissioning a Master or Slave)
退役是支持从集群中移除组件和它们的主机的过程。在移除主机或从服务上移除主机之前
必须退役运行在该主机上的 或 +(服务。退役有助于保护数据丢失或服务损坏。
退役对于下列组件类型可用:&、 &、0(
退役执行下列任务:
对于 &:安全地复制 %数据到集群中其他的 &
对于 &:停止接受新作业的请求并停止组件
对于 0(:打开 并停止组件
3.6 退役和删除组件
3.6.1 退役一个组件 (Decommission a Component)
A利用 ,浏览到 页面
B找到并单击组件驻留的主机 %>&
C使用 3控件,单击 +F&F
过程中 显示退役中"$状态
退役过程完成时,退役状态变为已退役 "$
3.6.2 删除一个组件 (Delete a Component)
A利用 ,浏览到 页面
B找到并单击组件驻留的主机 %>&
C在 中找到一个要退役的组件
E如果该组件的状态是 停止它
一个退役的 +(组件可以在已退役状态重启
G从组件下拉菜单中单击 +
删除一个 +(组件,如一个 &不会自动通知 组件,如 &&从它的
排除列表中移除那个 +(组件。添加一个已删除的组件回到集群表现出如下问题,从
的视角观察,添加进来的 +(保持在退役状态。重启 组件可排除故障
H
I让 识别并监控余下的组件,重启服务。
3.7 从集群删除一个主机 (Dele"ng a Host from a Cluster)
删除一个主机从集群中移除该主机
先决条件:在删除一部主机之前,必须完成如下前提:
?停止该主机上运行的所有组件
?退役运行在该主机上的所有 &
?迁移该主机上所有的 组件,例如 &&或 0*
?关闭主机的维护模式"$
步骤:
A利用 ,浏览到 页面找到并单击要删除的主机 %>&
B在 ,+页面,单击 3
C单击 +
3.8 设置维护模式 (Se+ng Maintenance Mode)
在一个 ,集群上,当要专注于执行硬件或软件维护,修改配置设置,处理
故障,退役,或移除集群节点时,设置维护模式可以阻止警报,并
去掉在特定服务,组件,以及主机上的批操作"*+3$。
显示设置一个服务的维护模式,隐含地设置了运行此服务的组件和主机的维护模式。如果
维护模式阻止了要执行在服务,组件,或主机上的批操作,可以在
维护模式中显式地启动和停止服务、组件、或主机。
下面几节提供了一个案例,如何在有三个节点,管理集群上使用维护模式。描述如
何显式地打开"*$%服务的维护模式,主机,以及隐式地
打开服务、组件,以及主机的维护模式。
3.8.1 设置服务维护模式 (Set Maintenance Mode for a Servicee)
A在 (页面,选择 %
B选择 (3然后选择 1*-
C-确认
注意,在 (* &&和 &&组件的 打开
3.8.2 设置主机维护模式 (Set Maintenance Mode for a Host)
使用 3控件设置主机维护模式
步骤:
A页,选择主机 %>&
B选择 3然后选择 1*-!
C-确认
注意,主机上所有的组件打开维护模式
使用 3控件设置主机维护模式
步骤:
A页,选择主机 %>&
B在 3F+F选择 1*-!
C-确认
3.8.3 何时设置维护模式 (When to Set Maintenance Mode)
设置维护模式的四个一般场景为:执行维护,测试配置修改,测底删除一个服务,处理警
报。
■ 要在一部主机上执行硬件或操作系统维护
执行维护时,要能够做如下操作:
剩余63页未读,继续阅读
资源评论
LaiYoung1022
- 粉丝: 65
- 资源: 10
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功