1、安装系统并做简要设置(一些系统参数,不再演示,还有设置IP地址),这个没啥好说的,常做的事情,通常我们在装完系统后安装以下这些软件包,以方便将来可能的数据库、集群双机等软件的安装(解决依赖)
X11.dt
X11.compat
X11.vfb
Bos.adt
Bos.compat
Bos.content_list
Bos.data
Bos.dosutil
Bos.perf.gtools
Bos.clvm
Rsct.basic
Rsct.compat.basic
Rsct.compat.clients
装完这些包后为系统打补丁。试验中我使用的系统是用5305的光盘直接装的,为了简单我没打补丁:-)
All filesets for 5300-05_AIX_ML were found.
系统版本一致。
2、安装HACMP软件并打上最新补丁
HACMP软件上次我就装好了,里面除了tivoli管理软件不必装其他的包都选上。
HACMP包都装好了,装完HACMP5.3后请务必打上最新的补丁,除去将来可能会遇到的BUG
补丁包在这下载:
http://www14.software.ibm.com/webapp/set2/sas/f/hacmp/home.html
具体安装我就不演示了
3、配置/etc/hosts
IP地址我上次已经设置好了,现在不方便更改,以免断掉连不上,我现在在被窝里用VPN连到公司里给你做教程,IP地址如下
p630
en0: flags=5e080863,c0<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,CHECKSUM_OFFLOAD(ACTIVE),PSEG,LARGESEND,CHAIN>
inet 192.168.0.63 netmask 0xffffff00 broadcast 192.168.0.255
en1: flags=4e080863,80<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,PSEG,CHAIN>
inet 192.168.1.63 netmask 0xffffff00 broadcast 192.168.1.255
ent3你看到的10网段我们这次试验时用不到,en1用来做boot ip,也是我现在能通信的iP,ent0用来做standby ip
b80
en1: flags=4e080863,80<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,PSEG,CHAIN>
inet 192.168.1.80 netmask 0xffffff00 broadcast 192.168.1.255
en3: flags=4e080863,80<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,PSEG,CHAIN>
inet 192.168.0.80 netmask 0xffffff00 broadcast 192.168.0.255
en0和en3不用
网卡和IP之所以没有完全按照顺序设,是因为en0的集成网卡普遍都有点问题,虽然能通信但是丢包,传输速度极慢,所以以前设置时我就没有使用集成网卡。这两台机器比较老了呵呵
有人敲门,教程暂停
OK,我们继续
我把以前的配置信息都删掉了,删除前备份了一下下:-)
现在我们重新写一次
写好了保存,局域网貌似有人在搞下载,速度突然慢了点
192.168.1.63 p630_boot p630
192.168.0.63 p630_stb
192.168.1.87 p630_svc
192.168.1.80 b80_boot b80
192.168.0.80 b80_stb
192.168.1.88 b80_svc
这里服务IP和boot ip设置在了同网段,所以待会我们设置网络时要使用replacement方式,双机启动后替换IP,IP alias 也可以,不过。。。没啥原因就是我临时想用replacement方式 o(∩_∩)o...哈哈
hosts还是要先配
4、设置.rhosts
先配置信任关系吧,这样拷贝文件更方便些
好了,可以不输入密码切换机器了
5、创建VG
我们上次创建的磁盘还没创建VG,现在做
随便选一台机器做。
Activate volume group AUTOMATICALLY yes
这个要改成NO
Volume Group MAJOR NUMBER []
刚才忘掉设置这个了,这个两台机器要设置成一样,虽然即使不一样不影响双机运行,但是检查ha时的警告看起来很丑
现在先不管它,一会我们重新export importvg时再设置成一样的
晕,创建vg时输错了,忘记加“vg”这两个字母,不管了,,,,
刚才就感觉这个vg长得有点怪,侏儒。
p630上只能输入比49更大的数值,我们就输入49吧
貌似是上次删除VG后未重启,系统里还保留有以前appvg的信息
我们暂时换个名字,就用app得了
晕,容我先排查排查错误,检查了下发现以前删除磁盘时太草率,删除前未exportvg,造成hdisk1 hdisk2删除后相关vg信息依然报存在odm中,再次exportvg后重启p630才得以顺利import刚建的新vg。
现在重启完成,我们重新importvg。
刚才这个值最小只能是49,删除老的vg信息后变成47了,我们就使用47吧
AUTO ON: no 自动激活选项也关掉
好了VG建好了,我们只是测试暂时就不建文件系统了。
开始配置HA
随便选一台主机,配置步骤我不再你解释你看录像吧
添加cluster 和node
很顺利无故障
添加service ip
将两个主机两个service iplab全部添加进去
添加application server
添加应用,我们假设将来两台主机分别跑一个应用并互备,p630跑applicathion,b80跑oracle,因此我们需要添加两个应用服务器和两个资源组。
[root@p630 /]#cat /tmp/appstart.sh
echo "----------------------------" >>/tmp/hacmp.status
echo >>/tmp/hacmp.status
date >>/tmp/hacmp.status
echo "Application starting ..." >>/tmp/hacmp.status
echo >>/tmp/hacmp.status
echo "----------------------------" >>/tmp/hacmp.status
[root@p630 /]#cat /tmp/appstop.sh
echo "----------------------------" >>/tmp/hacmp.status
echo >>/tmp/hacmp.status
date >>/tmp/hacmp.status
echo "Application stoping ..." >>/tmp/hacmp.status
echo >>/tmp/hacmp.status
echo "----------------------------" >>/tmp/hacmp.status
两个超简单的脚本,这里只需要你提供脚本/tmp/appstart.sh,脚本可以为空脚本,但是文件一定要有并且要有可执行权限。
我的脚本上次写好的,这次再用一遍:-)
创建资源组
我们要为app和ora分别创建资源组
rgname随便起,选择主节点,接管方式保持默认
Participating Nodes (Default Node Priority) 我选错了,两台主机都要选中才可以接管, [b80 p630] 这个可以手写进去,哪个主机写在前面,哪个主机是这个资源组的默认主机,ORACLE默认由b80的启动,app由p630启动,刚才我改好了,现在进行进一步设置,OK,简单的资源组创建设置完成,现在我们开始检查同步HACMP
ERROR: Service adapter b80_svc on network net_ether_02 is on the same
subnet as at least one of the boot adapters on this network.
Service labels must be on a different subnet when the network is configured
to use IP aliasing for IP address takeover.
ipalias方式不允许服务ip和boot ip在同一网段,默认是ipalias方式,现在我们把它改成replacement方式 Enable IP Address Takeover via IP Aliases [Yes] 这个改成NO,重新同步
奇怪突然掉线,我重新连一下,不知道是哪网络出问题了。还好现在又连上了
检查和同步HACMP配置
Automatically correct errors found during [No]
这个改成yes,自动更改错误
Verify, Synchronize or Both [Both]
选了both,ha配置都正常的话它会自动把ha配置信息同步到另外一台机器上(b80)
暂时b80上什么信息都没有
同步要花比较长的时间
这次同步顺利完成!信息都同步过了了。
现在这个简单的HA初步就配置完成了,网卡啥的坏了或者你手动tackover应该都可以正常切换
通常我们还要配置个心跳网络用户检查一台主机完全宕机,这次我们试验使用串口做心跳,我已经把串口线连好了,两台主机都是连在第二个串口上,第一个我设置成管理用的串口了。
现在开始配置串口心跳,port number写成一样的,Enable Login Guide上好像有提示使用disable,不过我上次使用过使用enable也照样成功。这次我们使用默认的disable,测试串口连接。顺利看到/etc/hosts的内容,串口已经联通了,现在我们把串口心跳网络添加进HA,好像是在这加的,我查下吧,这个教程已经很长了,我们把串口添加和HA接管测试放到下一个教程里。
昨天夜里太晚撑不住就睡觉了,现在继续。
配置心跳网络,选择我们建好了用来做心跳的,添加成功,点错了。。。。
等一会吧呵呵
Network net_rs232_01
p630_tty1_01 /dev/tty1
已经添加进去了
重新同步ha
OK,没问题
现在我们准备启动HA,我们设置的service ip是192.168.1.87\88,启动HA后IP会被替换,等待
变等待边看启动信息。
88的已经通了,80断掉了
b80_svc 已经启动完成,我们设置的应用启动脚本也执行了,oravg varyon成功,两台主机的应用启动脚本都顺利完成
现在我们做一下接管测试,停掉P630
shutdown mode选择tackover,否则停止HA后不会自动切换,正常shutdown主机HA也不会切
630的ha已经停掉了,现在已经切过来了
现在我们重新启动P630上的HA,APP自动又切回到优先级更高的p630上
再测试一下把服务网卡宕掉,
n0: flags=5e080863,c0<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,CHECKSUM_OFFLOAD(ACTIVE),PSEG,LARGESEND,CHAIN>
inet 192.168.0.63 netmask 0xffffff00 broadcast 192.168.0.255
en1: flags=4e080863,80<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,PSEG,CHAIN>
inet 192.168.1.87 netmask 0xffffff00 broadcast 192.168.1.255
现在把en1宕掉,命令执行完后我们需要重新连接,因为这个连接会断掉
en0: flags=5e080863,c0<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,CHECKSUM_OFFLOAD(ACTIVE),PSEG,LARGESEND,CHAIN>
inet 192.168.1.87 netmask 0xffffff00 broadcast 192.168.1.255
en1: flags=4e080863,80<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,PSEG,CHAIN>
inet 192.168.0.63