当出现突发事件和系统故障时,故障排查效率的高低将直接影响应急处置效率,东莞局信息中心在总结了大量运维经验后,首创性地推出了“信息系统故障布尔定位法”。
此前,当系统出现故障时,由于专业跨度大,往往需要各专业运维人员都赶赴现场进行排查,耗费较大的人力、物力和时间,若故障发生在节假日期间,则应急处置效果更是事倍功半。通过布尔定位法,东莞局信息中心的运维人员能对系统故障进行快速定位并确定故障所涉及的专业,通知相关系统的专业负责人跟进处理,在提高应急处置效率的同时节省了人力资源,并对日常运维工作的效能提升起到促进作用。
据信息中心工作负责人介绍,该“定位法”通过梳理各系统的从终端用户到服务器各服务链路的薄弱环节及其常见故障,找出各类故障的共性特征,并结合运维人员的实践经验,形成一个系统性的故障处理知识库。他表示,将该“定位法”命名为“布尔定位法”源于其运用了“布尔运算”法则,并形象地将布尔运算法比喻为BULL公牛插座,“是”与“否”对应插座的“开”与“关”,通过对故障现象进行简单的“是”与“否”的判断,逐步推断出最终唯一的结论,实现对故障系统的快速定位。“例如,用户访问业务系统时如果页面出现‘Internet Explorer无法显示该网页’的提示,根据布尔定位法的知识库,可以初步判断故障点可能在安全系统或主机系统。”信息中心1000号工程师邓伟峰举例,“我们需要检查是否所有业务系统都无法访问。如果‘是’的话,可以确定故障点是在安全系统。如果‘否’的话,则故障点就在主机系统了。”
记者了解到,运维人员通过该“定位法”简单、快捷的操作方式对故障系统进行快速定位,有效降低了专业门槛。“我们计划将知识库向全局员工推广,一方面可以使1000号的工程师能更有效地引导用户清晰地描述故障现象。”该局信息中心运维人员林浩钊介绍道,“另一方面,只要是具备一定计算机知识的用户都可以按图索骥,自行对故障原因进行初步判断,我们的运维人员在处理故障的时候就更加有方向性和针对性。”该定位法在执行过程中,能有效地将故障排查时间从原来的平均1.5小时缩短到0.75小时,得到信息运维人员的一致好评。
经过1个多月以来的试运行,东莞局信息中心已运用布尔定位法有效解决了用户反映的终端类故障200多起。下阶段,东莞局信息中心将进一步完善故障处理知识库,同时计划把“布尔定位法”推广至其他信息服务领域,使信息业务管理达到规范描述、快速定位和便于分析,有助于构建大数据下的自助报障平台,进而提升信息服务能力和管理水平。(封祐钧)