各个子系统的应急预案汇总如下:
2.1 webserver应急预案
启动条件
当发生下列情况之一,在规定的时间内无法恢复时,启动webserver应急预案:
⑴、两台主用webserver由于进程运行异常,页面无法正常显示; ⑵、两台主用webserver的页面被篡改; ⑶、硬件故障,致使webserver无法启动。 判断方法
Webserver服务器共有两台,IP地址分别为202.96.74.113和202.96.74.114,端口为2080。故障判断时,应该对这两台服务器分别做检查。例如:检查202.96.74.113这台机器,URL为 http://202.96.74.113:2080,查看页面显示是否正常。
启动步骤
⑴、停掉主用的webserver,启动备用的webserver。启动备用webserver的操作需要5分钟时间。
登录mail5.online.ln.cn和mail6.online.ln.cn $ cd /opt/aihttpd/bin $ ./apachectl stop 登录mail8.online.ln.cn $ cd /opt/aihttpd/bin $ ./apachectl start
⑵、如果主用webserver的页面被篡改,替换出现问题的webserver的页面文件后,再重启webserver。
$ cd /opt/aimc
$ tar xvf webroot.040430.tar $ cd /opt/aihttpd/bin $ ./apachectl stop
$ ./apachectl start
此项操作如果从备份目录获取页面文件,需要5分钟时间;如果从备份带获取页面文件,需要10分钟时间。
注意事项
⑴、在日常维护中,应当定期检查备用web server的可用性,并检查备份带和磁带机的可用性,定期更新备份文件和备份带。
⑵、在网络小组的协助下,通过apache server的事务日志和系统登录日志查找攻击源,及时在前端路由器上进行封堵。
⑶、主用的webserver服务器在南机房20、21机柜上,机器名称为 mail5.online.ln.cn、mail6.online.ln.cn。备份文件存放在mss1存储服务器/home1/backup。
撤销条件
当出现故障的webserver恢复时,将备用的webserver停掉,并启动已经恢复的webserver。
登录mail5.online.ln.cn和mail6.online.ln.cn $ cd /opt/aihttpd/bin $ ./apachectl start 登录mail8.online.ln.cn $ cd /opt/aihttpd/bin $ ./apachectl stop
2.2 用户认证系统应急预案
启动条件
当发生下列情况之一,在规定的时间内无法恢复时,启动用户认证系统应急预案:
⑴、aiuum进程运行异常;
⑵、aiuum无法连接oracle数据库,或者无法读取数据库的aiuum数据字典;
⑶、oracle数据库运行异常;
⑷、uas0、uas1服务器硬件故障,致使服务器无法启动。 判断方法
⑴、很多用户通过客户端软件(outlook、foxmail)或者webmail方式收发邮件时频繁提示“密码不对”或者“你没有访问此邮箱的权限!”,可以断定是用户认证服务器的问题。
⑵、在uas0、uas1上运行如下命令:
/opt/aiuum/bin/ServicePool monitor查看aiuum服务进程组的运行信息。如果运行信息中的“CurrentProcessCount=0”,表明连接数据库失败,或者无法读取数据库的AIUUM数据字典。
启动步骤
⑴、在前台业务服务器上修改aimc.ini配置文件,将下面红色字体修改为 Server1=9 10.1.32.3 8889 10
[UAPI]
;Backend: 1-LDAP, 2-RADIUS, 4-System, 8-Oracle, 16-OCS, 128+-WAN Server0=0 0.0.0.0 0 0 ; the backend,ip/connect_string,port and rate of the certify servers
Server1=9 10.1.32.1 8889 10 10.1.32.2 8889 10 Server2=0 0.0.0.0 0 0 ⑵、重启aimc进程 cd /opt/aimc ./aimc_stop ./aimc_start 注意事项
⑴、启用备用认证数据库后,用户信息将不能进行增、删、改操作,但不影响用户认证。
⑵、此项操作需要修改10台业务服务器的配置,每台服务器需要2分钟时间,总共需要20分钟时间。这项操作的最佳配置为2个人,分别负责5台业务服务器,这样共需要10分钟时间。
撤销条件
当uas0、uas1的数据库恢复正常时,可以将前端业务服务器上的aimc.ini配置文件改回,重启aimc进程并进行测试。
2.3 邮件存储系统应急预案
采用1台SUN E6500和2台SUN E3500组成邮件存储服务器群,实现MSS(Mail Storage System)功能。3台MSS之间通过软件进行负载分担。服务器上配置了Veritas File System、Veritas Volume Manager软件,提高了文件访问的效率,同时,配置了Veritas Cluster Server软件进行负载分担和互为备份:任何一台服务器出现故障其他服务器都可以马上接替其工作,配置了一台HUB配合负载分担的切换工作。
3台存储服务器都采用双千兆网卡与Catalyst4006连接,每台服务器上的两块网卡都同时工作,绑定1个IP,平时一块网卡作为备用网卡,当主网卡出现问题或者网线出现故障时,备用网卡会自动接管主网卡工作,做到无缝切换。
启动条件
当发生下列情况之一,在规定的时间内无法恢复时,启动邮件存储系统应急预案:
⑴、某个mailroot对应的mss进程运行异常; ⑵、mss服务器硬件故障。 判断方法:
⑴、很多用户通过客户端软件(outlook、foxmail)或者webmail收取邮件时,连接总是超时或者提示“系统I/O error”,可以判断为邮件存储系统的问题。
⑵、通过mapi命令查看某个mailroot对应的mss进程运行状态: ①、uapi –s 邮箱内部uid –f location查看用户的mailroot值,例如为0;
②、telnet到这个mailroot对应的存储服务器上,执行如下命令: /opt/aimc/0/mapi/bmb 邮箱内部uid
如果系统报错或者超时,表明mailroot对应的mss进程有问题。 启动步骤
将这个mailroot切换到其他存储服务器上。以root权限登录mss服务器,执行如下操作:
#hagrp –switch ServicesGroupName –to sysName
其中ServicesGroupName为 mss0 mss1 mss2 mss3 mss4 mss5(mss*表示资源组的名称)
sysName为mss0 mss1 mss2(mss*表示存储服务器的名称)
执行上述操作后,通过hastatus命令查看切换是否正常 撤销条件
当原mss进程恢复正常时,将对应的mailroot手工切换回原存储服务器上。
2.4 磁盘阵列应急预案
方案说明
存储子系统拓扑图
当邮件系统连接的磁盘阵列由于光纤交换机、磁盘阵列、磁盘、光通路阻塞,或者veritas volume manager软件等故障导致磁盘阵列上的mailroot不能挂接到前端存储服务器时,可以在前端存储服务器的本地硬盘建立临时mailroot以保证邮件收发服务。
在启动应急预案前,首先判断故障点,如果是硬件故障,替换相应的硬件;如果是软件原因,联系相关人员处理;如果在规定的时间内无法判断出故障点或
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库电子邮件系统应急预案(2)在线全文阅读。
相关推荐: