| 电网企业

请登录

注册

云南电网公司举办营销管理信息系统容灾应急演练

2013-12-02 14:25:23 云南电网公司
A A
随着云南电网业务的快速发展,各业务运作更加依赖于信息系统的稳定运行,其结果是一旦发生大的灾害,云南电网公司的IT系统及其所支持的业务系统将毁于一旦。为避免发生重大灾难发生时信息系统瘫痪、用户资料
       随着云南电网业务的快速发展,各业务运作更加依赖于信息系统的稳定运行,其结果是一旦发生大的灾害,云南电网公司的IT系统及其所支持的业务系统将毁于一旦。为避免发生重大灾难发生时信息系统瘫痪、用户资料、运营数据的丢失,云南电网公司于2009年8月建成重要信息容灾备份系统,2011年11月成功开展容灾切换演练,2013年,容灾应急演练再度列为云南电网公司度信息系统运维的重要工作计划。

  11月22日,由信息部组织,信息中心承办的云南电网公司营销管理信息系统容灾应急演练正式举行,来自云南电网公司信息部、市场部、信息中心,昆明供电局,云南云电同方科技有限公司,技术支撑厂商、能讯、远信公司等近80人参加。真实模拟了云南电网公司营销管理信息系统在云电科技园生产环境数据库、存储设备不可用,短时间内无法恢复生产环境,而电力大厦20楼容灾环境运行正常的情况下,公司应急指挥中心讨论决定以及时恢复营销业务为目标,启动营销管理信息系统(云南电网公司营销3.0系统)容灾切换应急预案,成功造就云南电网公司信息系统应急演练的3个“最”。

  影响范围最广

  云南电网公司营销管理信息系统是云南电网公司营销业务一体化大集中系统,供云南电网公司本部、各地、市、县供电单位使用。该系统容灾于2009年建设完成,整个容灾环境分为生产服务器区和灾备服务器区,分别位于云电科技园数据中心机房和电力大楼20楼机房,通过EMC存储级数据复制进行实时数据同步,保证生产环境和容灾环境数据的一致性。演练能够验证该核心业务系统在发生重大灾难时容灾环境的可靠性以及故障上报制度、应急预案、应急容灾组织结构的合理性,为关键业务系统提供风险预防机制和灾难恢复措施,在确保数据安全的基础上提高业务连续运行能力,降低企业运营风险,将业务损失降低到可接受的程度,提升管理和服务质量,增强企业竞争力。

  演练涉及到云南电网公司17个地/市级供电单位,113个县级供电单位的营销系统及营销业务关联模块的正常使用。营销系统有3.244万用户,再加上由于多个与营销有关的业务系统需要通过业务功能接口、直连数据库、数据库链接等方式调用、访问和抽取该系统的业务数据,因此演练共影响到云南电网公司95598呼叫中心、网上营业厅、营销综合分析、营销监控、银电互联、南网数据中心等10个系统的正常使用。是云南电网信息专业影响范围最广的一次应急演练。

  考虑到演练期间更改数据库连接、重启数据库等步骤导致数据丢失等问题,演练组提前通知了供电单位演练期间停止对各有关系统的使用。云南电网公司信息部副主任黄文载说道:“营销管理信息系统是一个重要的信息系统,影响面非常广,涉及到千家万户的客户用电信息等资料,这些资料一旦丢失会对社会造成很大的影响,因此这次我们协调了方方面面,通过短信、网页、电话通知等形式对演练进行了公告。”提前将95598呼叫中心语音服务和电话接听转至备用平台,手工记录工单,演练完成后再将工单信息以手工录入系统,将演练停机对95598呼叫中心的业务影响降至最低;更改了营销综合分析、营销监控、南网数据中心系统数据抽取时间;通知银行和优付通等调用银电互联接口,调整对账时间窗口,避开演练对功能调用的影响;更改营配集成接口和电能量接口的数据库连接指向,有效降低影响。

  准备最充分

  与“不打招呼”的应急演练不同的是,信息系统由于涉及的人员、操作、流程、设备较多,存在一定的风险,需要完备的演练准备。

  “演练的前期准备是按照项目管理的模式来开展,各组安排都比较到位,定岗、定员、定责,把组织架构建立起来。进行了WBS分解,整个工作从会务策划到实施过程,谁来负责,有哪些活动都清清楚楚地定下来,准备非常周全,这是值得以后发扬的一点。”信息中心安全生产部主任周靖谈到。演练前精心编制了云南电网公司《营销管理信息系统应急演练整体方案》、《营销管理信息系统应急演练技术指导手册》、《营销管理信息系统应急演练PPT》,经过公司信息部、市场部、信息中心以及系统运维单位云电同方公司反复校核与审查,使得方案更加周密。

  按照从低到高的顺序,演练将风险系数分为5个级别,开展了风险点预估和风险点管控,最大限度地消除和规避风险。在演练管理层面,多次讨论应急演练方案及流程,细化并优化各流程环节,避免流程不合理导致演练时间大于预期、演练关键人员不在场导致沟通和操作的延误等问题。在技术层面,编制操作手册,避免输入错误命令,检查保证网络通信质量、服务器运行情况、网络通信质量,提前添加数据库配置,检查测试中间件组件服务器与灾备数据库网络连通性,做好应用程序备份,提出一系列规避方法和应急处置方法。演练还采用了自上而下的联络方式,任务信息传递方式从上到下由演练指挥组下达至演练实施组、后勤保障组、技术保障组、信息通信组各组组长,由各组组长再下达至具体的实施和保障人员;任务执行反馈和异常情况信息反馈从下至上,由实施和保障人员上报至各组组长,各组组长上报至演练指挥组,确保演练的顺利进行。

  持续时间最长

  从演练准备、演练实施、到演练结束总结,整个演练过程持续近7个小时,影响业务时间近4小时。

  11月22日晚上20:00,演练队伍分别在信息中心应急指挥中心、值班室、监控室、云南电网公司电力大楼20楼、昆明供电局95598呼叫中心陆续就位。“下面开始介绍演练议程和工作方案……”21时30分,演练负责人张建文再次对演练内容进行了确认。随着演练总指挥黄文载一声令下,演练正式开始。

  “22时02分容灾应急演练正式开始,本次演练预计持续4小时,影响营销系统所有用户,营销系统接口模块部分功能(95598系统电子工单录入及相关查询、网上营业厅呼叫中心模块、综合分析等系统的数据抽取、银电互联银行对账等)。目前操作人员正在进行系统切换前主机、网络、数据完整性、应用运行情况的最后检查,预计20分钟后完成。”这是第1条演练过程实时报送短信,演练对每项操作时间都作了明确记录,用于和计划进行对比,寻找差异,制定整改措施。

  22时13分,系统切换条件检查完毕,满足切换条件,切换工作正式开始。工作人员将业务运行环境从生产环境切换至容灾环境,待验证容灾系统的可用性后,再将业务回切至生产环境。切换和回切过程对生产环境数据库集群、操作系统双机的启停、灾备环境数据库主机操作系统卷组激活、灾备环境数据库启停、中间件数据库连接指向更改等进行了系列操作,11月23日2时11分,营销管理信息系统容灾演练圆满完成。

  云南电网公司信息部副主任黄文载在结束时谈到:“今天的营销管理信息系统容灾应急演练非常成功,既验证了我们的容灾系统的胜任能力,又检验了我们的管理和技术能力。”“这是我参加过做得最好的一次演练,我认为取得的效果和前期大家的准备有关,特别是技术方案很严谨。我到现场看到,一个营销系统的故障恢复牵涉到一、二十个技术人员的工作,我个人感觉到一种震撼。”信息中心总工程师赵凌在总结会上有感而发:“同时我也感到了压力,随着信息中心定位的转变,信息系统运维工作将转移到信息中心,信息中心的担子将会更重。”

  应急预案、业务连续性计划、信息系统灾难恢复计划的制定与维护是一个长期、综合的系统工作,下一步,信息中心还将对各个系统的计划、预案进行不定期的维护、优化,并定期进行演练,保证灾难发生时信息系统的真实、可用,保障云南电网公司各业务的安全、可靠的运作,维护云南电网公司良好的社会形象。(
大云网官方微信售电那点事儿
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
我要收藏
个赞

相关新闻