者无法恢复故障点,应当启动磁盘阵列应急预案。
启动条件和存在的问题
当发生下列情况之一,在规定的时间内无法恢复时,由系统管理员,向省数据局应急预案指挥小组请示,批示后启动邮件存储系统应急预案:
⑴、磁盘阵列故障,导致磁盘阵列不可用;
⑵、光纤交换机、HBA卡、光纤故障,导致光通路阻塞;
⑶、veritas volume manager软件故障,导致无法mount到逻辑盘; 判断方法:
⑴、磁盘阵列(硬盘,SP磁盘控制器,电源,风扇)如果出现硬件故障,都可以通过点击Navisphere Manager图形化管理工具Storage Button查看Physical选项来确定。
⑵、通过光纤交换机和SP磁盘控制器的状态灯,可以确定光通路是否堵塞。 ⑶、在mss服务器上执行 # cd /dev # ls clsp*
如果可以列出clsp0, clsp1的设备名称,说明磁盘阵列已经被系统识别,可以判断HBA卡没有问题。
⑷、当很多用户反映接收不到磁盘阵列中的邮件时,可以判断是磁盘阵列故障。
存在问题
本预案启动后,用户将无法收取保留在磁盘阵列中的邮件;在邮件回迁的过程中,用户将无法收取保留在临时盘上的邮件。但是,用户保留在磁盘阵列或者临时盘上的邮件都不会丢失。这些问题要通知各市局值班人员和投诉部门,及时向用户做解释工作。
启动步骤
⑴、规划mailroot
在前端存储服务器上准备临时mailroot。mss0、mss1的本地硬盘空间比较大,而且可以扩展多块硬盘,而mss2的本地硬盘空间小,无法扩展硬盘,因此mss0、mss1将分别存储3个mailroot的邮件,具体规划如下:
mss0 对应 m0、m2、m3 mss1对应 m1、m4、m5 ⑵、建立mailroot 在mss0上做如下操作:
创建两个目录,分别为/home、/home1,在这两个目录下建立相应的mailroot,并将目录属主变为aimc。
cd /home; mkdir m0
chown –Rf aimc:aisoft /home/m0
touch /home/m0/m0 cd /home1; mkdir m2
chown –Rf aimc:aisoft /home1/m2 touch /home1/m2/m2 cd /home1; mkdir m3
chown –Rf aimc:aisoft /home1/m3 touch /home1/m3/m3 在mss1上做如下操作:
创建一个目录为/home1,在这个目录下建立相应的mailroot,并将目录属主变为aimc。
cd /home1; mkdir m1
chown –Rf aimc:aisoft /home1/m1
touch /home/m1/m1 cd /home1; mkdir m4
chown –Rf aimc:aisoft /home1/m4: touch /home1/m4/m4 cd /home1; mkdir m5
chown –Rf aimc:aisoft /home1/m5 touch /home1/m5/m5 注意事项
①、在日常维护中不要删除上述目录,也不要占用这些目录的磁盘空间。正
常情况下,临时盘可以存储系统2天的邮件信息,如果启用应急方案后,发现临时盘磁盘空间不足,应该及时增加新硬盘。
②、以上操作事先应当准备完毕,应急预案启动时需要检查临时mailroot的可用性,大约需要2分钟时间。
③、当mss0或者mss1不可用时,将所有的mailroot规划到一台mss服务器上。
⑶、停止HA服务
以root身份分别在mss0、mss1、mss2做如下操作: hastop -local –force cd /etc/rc3.d mv S99vcs s99vcs 此项操作需要5分钟时间。 ⑷、修改IP地址 在mss0上作如下操作: ifconfig ge0:4 plumb
ifconfig ge0:4 inet 10.1.42.3 netmask 255.255.0.0 up 在mss1上做如下操作: ifconfig ge0:4 plumb
ifconfig ge0:4 inet 10.1.43.3 netmask 255.255.0.0 up 在mss2上作如下操作: ifconfig ge0:2 down ifconfig ge0:3 down 此项操作需要5分钟时间 ⑸、修改配置文件 在mss0上做如下操作: cd /opt/aimc/0
mv mss.ini mss.ini.操作人.时间 cp mss_yj.ini mss.ini cd /opt/aimc/2
mv mss.ini mss.ini.操作人.时间 cp mss_yj.ini mss.ini cd /opt/aimc/3
mv mss.ini mss.ini.操作人.时间 cp mss_yj.ini mss.ini 在mss1上作如下操作: cd /opt/aimc/1
mv mss.ini mss.ini.操作人.时间 cp mss_yj.ini mss.ini cd /opt/aimc/4
mv mss.ini mss.ini.操作人.时间 cp mss_yj.ini mss.ini cd /opt/aimc/5
mv mss.ini mss.ini.操作人.时间 cp mss_yj.ini mss.ini 此项操作需要3分钟时间。 ⑹、重启mss服务
重启mss进程,并且观察restart.log及测试服务是否正常。 cd /opt/aimc ./aimc_stop ./aimc_start
tail –f restart.log 注意事项
①、所有启动应急预案的准备工作总共需要15分钟时间。
②、当故障在15分钟内无法修复时,就应该从两方面入手:1、继续查找故障原因,争取修复故障。2、开始应急预案实施前的准备工作,如果故障在规定的时间内无法恢复,将启用应急预案。
③、有些准备工作可以并行操作,例如:检查临时mailroot的可用性、停止HA服务、修改配置文件;有些工作必须串行工作,例如:修改ip地址必须在
停止HA服务之后操作。因此,准备工作的最佳人员配置为2个人,一个人负责检查临时mailroot的可用性和修改配置文件,一个人负责停止HA服务和修改ip地址,这样整个准备工作需要10分钟时间(详细流程见附件1)。
撤销条件及撤销步骤 ⑴、撤销条件
如果磁盘阵列恢复正常,首先将应用回迁到磁盘阵列上,再将临时盘上的邮件回迁到磁盘阵列上。
⑵、撤销步骤
①、恢复其他主机配置及服务
当磁盘整列恢复后,先恢复各存储服务器的配置文件和ip地址,并手工将磁盘阵列挂接导存储服务器上,重启mss服务进程,观察服务是否正常。
②、回迁用户邮件
当服务稳定后,在临时mailroot所在主机上进行邮件回迁磁盘阵列的操作。下面是回迁用户邮件的shell脚本,参数是临时mailroot的ID。以Aimc用户执行:
cd /opt/aimc/setup
nohup migrate.sh mailrootid &
#!/bin/sh
if [ $# -lt 1 ];then
echo \ exit 1 fi
cd ${HOME}/setup
mrhome=`inifile ../$1/config/mss.ini MSS MailDir`/m$1
userlist=`find ${mrhome}/MB/ -name mailinfo.dat|nawk -F/ '{printf(\cd ../$1/mapi
rm -f ${HOME}/setup/mail$1.lst for user in ${userlist} do
bmb ${user} | nawk -v prefix=${mrhome}/MF -v uid=${user} '{ if($8==\ groupid=$10 }
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库电子邮件系统应急预案(3)在线全文阅读。
相关推荐: