引言
电网调度自动化系统是电网运行指挥中枢,负责监视和控制电力系统的发电、输电、变电和配电设备的安全运行,对电力系统的安全稳定运行起着重要作用。失去监视控制和调度管理后,局部电网事件很可能会迅速扩大到整个电网,甚至造成电网崩溃。2008年1月份国内南方地区的冰雪灾害、5月份“汶川”发生的特大地震等一系列严重自然灾害,对电网调度自动化系统提出了严峻的考验,为保证不间断的电网监控和调度,迫切需要建立电网调度自动化灾备系统。随着国内智能电网的提出,电力系统的稳定高效自愈运行目标对电网调度自动化系统的可靠性、容灾能力提出了更高的要求。
在“十二五”期间,国家电网公司十分重视电网调度自动化灾备系统的建设并制定了规划。
随着计算机技术、通信技术、数据库技术等信息技术的进步,尤其是云计算技术的飞速发展,为新型的基于服务器虚拟化技术的云灾备系统建设提供了条件。依托全网分布建立的灾备中心,通过构建面向服务的灾备平台,实现基于底层网络、计算、存储等分布式资源的虚拟化云计算服务,按需为电力调度中心用户提供网络化的灾备服务,并通过自身保护机制进一步保证用户灾备数据的可用性和安全性。
目前电网中灾备系统建设方案较多,并没有一个统一的评价标准,许多灾备系统设计并不合理,存在过多冗余和系统资源浪费,或者备用容量不够,在发生大的故障时达不到系统备用的要求。针对这一问题,本文首先提出了电网调度自动化灾备系统评价方案,然后对各备用系统方案进行优化分析,最后结合云平台技术,提出云灾备系统设计方案。
1 灾备系统效用模型
对于灾备系统进行效用分析是评价系统可行性的一项重要内容,可以给电网调度自动化灾备系统的设计与建造提供参考。
1.1 影响因素
对于灾备系统,以下4个方面是影响其投资成败的主要因素。
1)备用容量
调度系统的两大特点就是大数据量与大计算量,而海量数据是当前的主要瓶颈,考核备用容量的重要指标就是服务器的数据量,将系统的数据量作为地区i的备用容量Qi。
2)设备投入
设地区i的设备投入为Pi,则服务器投入与备用容量关系为:
P i=aCpriQi
式中:Cpri为存储成本价格;α为备用强度。
3)地区灾难概率分析
设地区i的灾难概率为pi,所有人为、自然灾害对服务器造成的破坏,最终表现形式为:①硬件层面故障,包括传输故障、存储故障;②服务层面故障,包括操作系统故障、应用服务故障。
上述2种故障的更底层(直接)事件可能如下:失火、雷电、台风、网络病毒等。层次关系如图1所示。
图1 影响服务器的灾难层次分析图
设各底层事件在地区i发生的概率如下:火灾事件pf、台风事件pt、地震事件pe、雷击事件ps、网络安全事件pn、病毒事件pv。假设底层事件的发生是相互独立的,那么地区i任一底层事件发生的概率为:
pi =1-(1-pf)(1-pt)(1-pe)˙(1-ps)(1-pn)(1-pv) (2)
4)灾难损失
灾难造成的负面损失Ci主要包括如下方面:①直接损失,即设备损坏的损失,是固定值;②间接损失,即因为电网调度自动化系统坏掉对电力调度造成的潜在损失,与恢复时间t有关系。
设在地区i建立一个工作站需要设备投资为Ii,灾难损失程度系数为λi,该系数不仅描述了当灾难发生时的设备损失程度(灾难发生时设备的损毁代价为λiIi),而且反映了数据损失的程度,而一般意义上,数据损失程度越大,恢复其正常工作所需要时间将越长,即