没有合适的资源?快使用搜索试试~ 我知道了~
基于LINUX的Oracle 10G RAC管理维护学习手记.pdf
需积分: 9 2 下载量 156 浏览量
2012-09-27
16:01:07
上传
评论
收藏 481KB PDF 举报
温馨提示
试读
20页
基于LINUX的Oracle 10G RAC管理维护学习手记
资源推荐
资源详情
资源评论
1
一 RAC 相关以及基础知识
1.CRS 简介
从 Oracle 10G 开始,oracle 引进一套完整的集群管理解决方案—-Cluster-Ready
Services,它包括集群连通性.消息和锁.负载管理等框架.从而使得 RAC 可以脱离第三方集群
件,当然,CRS 与第三方集群件可以共同使用.
(1).CRS 进程
CRS 主要由三部分组成,三部分都作为守护进程出现
<1>CRSD:资源可用性维护的主要引擎.它用来执行高可用性恢复及管理操作,诸如维
护 OCR 及管理应用资源,它保存着集群的信息状态和 OCR 的配置,此进程以 root 权限运行.
<2>EVMD:事件管理守护进程.此进程还负责启动 racgevt 进程以管理 FAN 服务器端调
用,此进程以 root 权限运
行
<3>OCSSD:集群同步服务进程.管理集群节点的成员资格,它以 fatal 方式启动,因此
进程发生故障将导致集群重启,以防止数据坏死.同时,CSS 还维护集群内的基本锁功能,以
及负责监控 voting disk 的脑裂故障。它以 Oracle 权限运行
此外,还有一个进程 OPRCD,他是集群中的进程监视程序,仅当平台上的 CRS 不使用
厂商群件时候才出现,且无论运行了多少实例,每个节点只会存在一组后台进程.
来看一下这几个守护进程:
rac1-> cat /etc/inittab
…………………………… .
# Run xdm in runlevel 5
x:5:respawn:/etc/X11/prefdm –nodaemon
h1:35:respawn:/etc/init.d/init.evmd run >/dev/null 2>&1 </dev/null
h2:35:respawn:/etc/init.d/init.cssd fatal >/dev/null
2>&1</dev/null h3:35:respawn:/etc/init.d/init.crsd run>/dev/null 2>&1
</dev/null
(2).Virtual IP Address
Oracle 10G RAC 下,有 3 个重要的 IP.
① Public IP ② Private IP ③ Vitual IP
Public IP 为数据库所在主机的公共网络 IP,PrivateIP 被用来私有高速互联,而 Oracle
较前版本,增加了一个虚拟 IP,用来节点发生故障时候更快的故障转移,oracle 利用每个节
点的 lisnter 侦听 VIP,一旦发生故障,VIP 将进行实际的故障切换,从而在其他的可用的节
点上保持联机,从而降低客户应用程序意识到节点故障所需要的时间。
VIP 与 Public IP 必须在同一个网段内。
(3).OCR,Voting disk
OCR(oracle 集群注册表)和 Voting disk(表决磁盘)是 CRS 下的两个重要组件,它们必
须放在共享磁盘上,以保证每个节点都能对其访问。
2
OCR 包含了针对集群的一些配置信息,诸如:集群数据库中的节点列表.CRS 应用程序.资
源文件以及事件管理器的授权信息。他负责对集群内的资源追踪,从而获知资源正在哪里运行,
应该可以在哪里运行。
Voting disk 用来解决 split-brain 故障:如果节点丢失了与集群中其他节点的网络连接,
这些冲突由表决磁盘中的信息来解决
2.ASM 相关
ASM (Automated Storage Management) 是 Oracle10G 引入的一种文件类型,他
提供了直接的 I/O 读写,是 RAC 体系下一套不错的对数据文件存储规划的方案.ASM 可以自
动管理磁盘组,并提供数据冗余和优化.后面章节会就 ASM 的管理以及 ASM 下的 RAC 管理,
单独讲解.
3.RAC 存储/网络需求
图 1.3 RAC 体系架构
(1).存储需求
共享存储器是 RAC 的重要组件之一。它要求集群内的节点可以同时读写物理磁盘。目
前,支持共享存储的文件类型也比较多,像 Oracle 自身提供的 ASM,OCFS2 以及三方提供
的群集文件系统,都是可以选择的类型。
表 1.1.1 显示了 RAC 体系架构下各部分所支持的存储类型 (暂不考虑三方集群文件系统,就
ASM/raw device/OCFS2 和普通文件系统来说)
表 1.1.1 RAC 各部分所支持的存储类型
3
类别
支持的存储类型
存储位置
备注
Cluster 软件
OCFS2,普通文件系统
共享磁盘/本地磁盘
OCR,Voting disk
OCFS2,raw device
共享磁盘
数据库软件
OCFS2,普通文件系统
共享磁盘/本地磁盘
数据库文件
OCFS2,raw device,ASM
共享磁盘
归档日志文件
OCFS2,ASM,普通文件系统
共享磁盘/本地磁盘
备份/恢复文件
OCFS2,ASM,普通文件系统
共享磁盘/本地磁盘
闪回日志文件
OCFS2,ASM
共享磁盘
(2).网络需求
每个节点主机上至少需要 2 张物理网卡,以便分配公有 IP 和私有 IP 地址。对于私有 IP
连接,每个集群节点通过专用高速网络连接到所有其他节点,目的在于集群上的节点和实例交
换信息状态(锁信息,全局缓存信息等)。通过高速互联,Cache Fusion 得以实现。
在实际环境中,高速互联至少需要配置 GB 级的以太网,而且,最好不要使用交叉直连。
较好的解决方案是节点间配置专用交换机,这样避免因为集群上一个节点宕掉而影响另外节点
的正常工作。
4.其他
(1).后台进程
4
图 1.4.1 Backgroud Process in RAC 10g
由于要维护多个实例同时访问资源所必需的锁定,因此,同 single instance 相比,RAC
下增加了额外的一些进程。专门针对 RAC 的进程有如下几种:
1. LMS(Global Cache Service) 全局缓存服务进程
LMS 负责为缓存融合请求在实例间传递块。当一致性请求的时候,LMS 首先回滚块,创
建块的读一致性映像(CR),然后将该一致性版本通过高速互联传递到处理此请求的远程实
例中的前台进程上,LMS 进程保证了在同一时刻只允许一个实例去更新数据块。
LMS 进程的数量由初始化参数 GCS_SERVER_PROCESSES 控制。Oracle 最大支持 36
个 LMS 进程(0–9 and a–z),该初始化参数默认值为 2。
2. LMD (Global Enqueue Service Daemon) 全局队列服务守护进程
LMD 负责管理全局队列和全局资源访问,并更新相应队列的状态,此外还负责远程节点
资源的请求与死锁的检测。LMD 与 LMS 进程互交工作,共同维护 GRD。
3. LMON (Global Enqueue Service Monitor) 全局队列服务监控器进程
LMON 是全局队列服务的监控器,他负责检查集群内实例的死亡情况并发起重新配置,当
实例加入或者离开集群的时候,它负责重新配置锁和资源。
4. LCK(Lock process) 锁进程
LCK 管理那些不是缓存融合的请求,例如 library cahe, row cache.由于 LMS 进程提供
了主要的锁管理功能,因此每个节点实例上只有一个 LCK 进程。
DIAG (The Diagnostic Daemon)诊断守护进程
DIAG 负责监控实例的健康状况并捕获进程失败的信息,并将失败信息写入用于失败分析,
该进程自动启动且不需要人为调整,若失败则自动重新启动。
(2).缓存融合/缓存一致性
CacheFusion 是 RAC 工作原理的一个中心环节.他的本质就是通过互联网络在集群内各
节点的 SGA 之间进行块传递,从而避免了首先将块推送到磁盘,然后再重新读入其他实例的
剩余19页未读,继续阅读
资源评论
liusteven
- 粉丝: 2
- 资源: 2
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功