随着电厂自动化程度的增加,提高关键设备的有效性运行和可维护性也变得非常重要。传统的设备检修方式日益暴露出其局限性,设备故障带来的经济损失也日益受到发电企业的重视和关注。文章通过对发电机组设备安全现状的分析,基于专家案例库丰富的故障和预警模型,结合 IO 组态、高速数据通信等信息化技术,详细阐述了电厂设备在线监测与故障预警系统的设计与实现。 系统的应用能够对设备故障提前告警,确保设备安全稳定运行,有效降低设备故障发生率,大大提高了机组设备的管理效率。
0、引言
电厂生产过程的任何故障不仅直接影响电能产量和电能质量,而且还可能造成设备损毁和人身事故。要使发电机组设备能够安全、可靠、有效的运行,使其充分发挥作用,发展设备状态监控和故障预警技术是必经之路。 故障预警技术的基本思想是实时监测设备的运行状态,在设备故障产生初期,即设备当前运行状态与正常状态偏差较小时,给出准确的、快速的诊断结果,为检修和运行人员争取更多的故障处理时间与主动性,提高机组设备的可靠性,降低维修成本,减少经济损失。 电厂设备在线监测与故障预警系统,针对电力行业发电机组中重要的设备设计并研发的一款智能分析系统,为发电机组的设备监控、预警、检修、辅助决策等提供整体的解决方案。
1、系统架构设计
1.1、物理架构
电厂设备状态监测与故障预警系统的物理架构如图 1 所示。 系统的物理架构构建了从生产数据实时采集到应用层数据处理,再到多平台信息展示的应用架构,形成完善、高速、安全的环境体系,以实现电厂设备的实时监测和预警。
1) 生产层: 包含分布式控制系统(Distributed Control System, DCS)、 可 编 程 逻 辑 控 制 器(Programmable Logical Controller, PLC)等 多 个 系 统,通过分布式采集器,从这些系统中采集数据,并将数据发送到应用层。 生产层和应用层两者之间通过物理隔离装置进行连接,使得采集的数据只能单向地从生产层流向应用层,保证了实时数据的高效安全稳定传输。
2) 应用层: 包括实时库服务器、 Web 服务器、数据库服务器、文件服务器、接口服务器等一系列设备,实时库服务器获取从生产层面传来的实时数据,对这些数据进行统一划分、归档,再将处理过后的数据经由内部网络传输到 Web 服务器,由 Web 服务器发送给多平台的信息展示层。
3) 多平台信息展示层: 在该层系统通过 Web 服务器,向 PC 端、手机端等多个平台推送最新设备运行信息,用户可以随时掌握设备运行状态并对可能发生的故障进行排查,保证了电厂安全、高效、稳定的生产,减少经济损失。
1.2、数据架构
系统按照数据类型可分为从设备上实时采集的原始数据、 Web 系统中维护的设备测点信息和配置的指标工况故障信息以及实时库内的信息,通过对数据进行处理后就可得到监测预警数据。 实时库作为重要的一环,支撑起系统状态监测和故障预警这2 个主要功能。 系统的数据架构如图 2 所示,通过IO 模块,获取原始数据,经由内部网络传输到实时模块。 在这一过程中,实时数据库保留原始数据的实时快照,以备 Web 系统所用。 实时模块分为 3 个子功能模块,分别是历史模块、报警模块和计算模块。
1) 系统通过历史模块,记录实时数据并实例化,用于系统学习和分析各设备的历史运行规则。
2) 报警模块根据获取 Web 系统中维护的设备测点参数,通过算法获得各设备对应工况等信息,再通过对实时数据的计算分析比较生成报警记录。
3) 计算模块通过系统的 WebSocket 服务,获取实时数据库提供的实时快照、历史数据和报警数据,并经过 Web 系统的再处理,以报表、表单、图形、消息提醒等方式展现给用户。
1.3、技术架构
系统的技术架构如图 3 所示,自下而上的将系统分为采集层、存储层、应用层、服务层和展示层。各个层面分工明确,相互之间由内外网混合模式进行数据传输。
1)采集层: 负责系统的数据采集,是系统的数据源头。
2)存储层: 负责数据的压缩、存储、检索及查询,为核心功能层提供数据支撑。
3)应用层: 用于搭建软件应用环境,负责底层技术支撑,并与硬件服务层紧密关联,使得各子系统服务能正常运行。
4)服务层: 给客户端或者第三方系统提供数据或者信息推送,是系统中的关键一环,从存储层获取数据,通过系统中算法、公式等一系列操作,将汇总的数据转换成可视化信息推送给各平台展示。
5)展示层: 提供了系统信息的多种展示方式,包括 PC 端和移动端数据的展示。
2、系统关键技术
设备在线监测与故障预警系统分为在线监测和故障预警 2 部分。 在线监测最重要的就是数据的实时性,即用户能在第一时间了解生产实时情况,实现对实时数据流的高速处理。 故障预警最重要的是预警的准确性,准确的故障预警能减少事故的发生,减少机组停机时间。 预警的准确性依赖于专家库和计算过程的准确性。 整个系统的设计开发都是围绕着在线监测和故障预警 2 部分展开。
信息化系统的核心是数据,对本系统来说,所有的功能都是以实时数据为核心展开的。 其中系统的主要数据处理部分由科大国创自主研发的 Iplant实时数据库完成。 Iplant 实时数据库主要负责数据的采集、存储、分析、计算、报警以及向客户端以及第三方系统的数据推送。 实时数据库为各种上层应用提供数据支撑,是系统运行的基础。
2.1、IO 组态
IO 组态模块是实时数据库的采集模块,是整个系统的数据源头。 IO 组态模块采用分布式数据采集,可以在不同的网络节点、不同的物理位置甚至可以穿过物理隔离装置部署 IO 采集器。 IO 组态模块根据已经配置好的通信装置和对应的通信参数,从不同系统和装置中采集数据并上传给实时数据库。不同的通信协议和不同的通信设备向上采用统一的数据上送接口,完全实现通信协议的透明化。 采集器和实时数据库采用松耦合设计,既可以部署在同一台机器上,也可以部署在不同机器上以增强系统部署灵活性。 系统已经实现的通信协议有: OPC,Modbus, IEC102,IEC104 等多种标准通信协议以及PI, pSpace, EDNA 等各实时数据库厂家 API,支持被动接收和主动采集 2 种采集模式。
2.2、历史数据管理
历史数据处理模块负责整个系统的数据存储、检索,历史数据的压缩效率直接影响着文件的存储时间。 历史文件管理以测点为核心,围绕着测点来组织历史数据,数据类型分为 Float, Digital, Int4,Int2, byte 等多种类型,存储的测点信息包括时间戳、测点值、质量戳。 历史文件存储采用三级索引、时间戳差分存储等技术手段来提高检索效率和存储容量,并通过最近内存访问机制优化数据访问,缩短数据的访问时间,提高在系统中查询、比较、计算历史数据的效率。
2.3、数据压缩及拟合
在实时数据库中,通常具有数据采集量大及数据临近度高的特点。 如果不对这些数据进行压缩,将对系统资源造成巨大的浪费,因此,为了节省磁盘空间,系统在历史数据存储时,会根据设定,采用旋转门压缩、死区压缩或哈夫曼压缩算法进行数据压缩。
2.4、高速数据通信技术
由于系统有数据采集、实时数据处理、历史数据、计算以及报警等多个模块,所以模块间的数据通信速度直接影响了系统的实时性以及数据的正确性。为了保证系统的实时性以及正确性,模块间的通信采用了持久化内存映射方式,这种方式的优点是通信效率高,在异常断电或者程序异常的情况下能保证数据不丢失。 在服务器端和浏览器端传输实时数据时采用了 WebSocket 技术,由于传输采用了二进制数据块通信并保持常连接的方式,其通信效率比传统的 http 轮询有数十倍的提高,这样才能确保系统中的页面在浏览器中运行流畅,无迟延,告警信息能够实时迅速地推送给用户。
2.5、分布式技术
由于系统特点或者硬件条件限制,不同的功能模块可能要在不同的服务器上或者不同的物理位 置 部 署, 系 统 采 用 了 互 联 网 通 信 引 擎(Internet Communications Engine, ICE)技术来解决模块之间的通信问题。 ICE 是一款高性能、跨平台、跨语言的中间件,支持分布式部署管理、消息中间件以及网格计算等。
本系统利用了 ICE 框架技术来实现各个模块的分布式功能。 当测点多、数据量非常庞大或者服务器处理能力不足时,可以将实时数据库的各个功能模块分布到不同的服务器上。
2.6、实时数据计算
系统监控和预警依赖于对实时数据准确、及时、灵活的统计计算处理。 计算模块将公式脚本经过词法分析、语法分析等过程,可以实现简单公式、脚本段以及复杂脚本的运算。
简单公式包括运算符、表达式、函数、测点、公式以及括号等,函数包括常用数学函数、 IF97 水蒸气函数以及自定义函数、测点间横向计算函数以及纵向统计函数。 简单公式可以综合运用测点编码信息、表达式、二级公式、四则运算、逻辑关系、预定义数学公式、自定义函数等多种参数,组合形成所需的计算规则。
脚本段包括变量定义、表达式语句、 if 分支、switch 分支、 for 循环、 while 循环等。
复杂脚本除了包括表达式、脚本段外,还包括函数调用,每个脚本都有个 main 函数作为运行入口。复杂脚本可以满足更灵活、更强大的实时计算需求。
系统中的计算引擎载入上述计算规则,当接收到实时数据时,则立即自动触发计算,并根据计算结果和预先设定的规则决定是否报警。 计算结果也可以被当作实时数据存储到实时库中,从而在历史数据回放时避免再次计算,降低了系统负荷。
2.7、故障信息推送
故障预警依赖实时数据计算来实现故障预警信息推送功能。 故障预警触发方式分为周期性触发和新数据触发模式,可直接针对测点报警,也可以针对计算公式(脚本)的计算结果报警。 系统还考虑到了测点在不同工况下的报警情形,可针对不同工况分别设定报警触发条件。 报警触发方式有阈值报警、设计值报警以及上下限报警等多种方式。 为防止偶发性的数据异常,系统通过设置持续时间、死区等方式排除数据扰动,减少误报、重复报的现象。
报警产生以及结束后会将相关报警信息在实时数据库模块本地缓存后再发送到 Web 服务器,由Web 服务器进行面向用户的报警通知、展示等。
3、系统主要功能
3.1、设备信息管理功能
设备信息管理功能主要用于维护发电机组设备的主要物理信息,包含机组设备的位置信息、设备相关技术规范维护信息(包括设备编码、厂家等)、设备测点等基础信息。 除此之外,还要构建指标体系,将设备上的所有测点进行提取和筛选,选取与设备运行状况密切相关的有用测点(如设备的性能参数、主要指标等),抽象成多个采集点指标。 根据专家案例库挖掘的测点间的计算或逻辑关系维护成虚拟测点,这些虚拟测点称为计算点指标,可作为设备运行健康状况的标志值,也可成为对管理人员而言容易理解、直观化的某些运行参考数据。这些采集点和计算点指标形成整体的指标体系,设备监控和故障预警都要围绕它们来实现。
3.2、模型管理功能
模型管理功能主要用于维护设备的一系列性能参数(如设计参数、特征参数和相关参数等)以及参数报警的上下限值,根据这些参数和限值,通过实时监测参数指标值,系统实现了传统的故障阈值报警。
模型管理模块还有一个主要功能就是关联相似相关设备,建立设备间关系。相似设备是指运行环境、模式相似的平行设备;相关设备是指机组运行过程中,设备健康状况会相互影响的设备。 相似、相关设备的关联,有利于实时监测过程中用户对设备间运行状况的比较,以及故障报警后设备异常数据间的比较和分析。 因为本系统故障预警不是仅仅针对单个测点,而是可以根据专家库的知识,组合多个测点的实时数据来综合判断某设备是否有故障,因此当用户发现某个设备出现告警时,可以通过一层层展开,查看多个相关测点的实时数据,从而判断问题的根源所在。
设备信息和模型管理模块维护的指标信息、性能参数、设备间关系,都会展示在设备指标关系页面(见图 4),便于监控设备运行状况。
3.3、提供专家案例库功能
专家案例库是业务专家通过知识和经验的积累,针对设备形成的故障和预警模型。 系统开发前期大量收集电厂故障方面的资料,并根据专家的专业知识、事故案例分析和专业工程师、检修人员在日常工作实践中积累的经验,把理论和经验相结合分析总结出一套典型故障模型(包括故障征兆、分析、解决方案等)。 通过对典型故障模型的分析和公式量化,把专家的知识、事故案例分析结论和专业工程师、检修人员的故障判断量化为数据、计算公式等一系列明确的预警准则(如横向多个指标间的相互关系、时间纵向的指标变迁等),建立起一套完整的预警机制,并且在电厂设备运行中进行反复的验证,不断汲取经验进行优化完善。 由典型故障模型及其对应的预警准则所构成的专家案例库(见图5),是系统成功预警的基石。
3.4、设备监测功能
系统除了提供电厂传统的组态图监测画面,还提供更为直观明了的设备状态监测画面(见图 6)。状态监测页面以 SVG 图形技术展示了发电机组的工艺流程,并且可以为发电机组主要设备定制监测页面,所有设备都可以点击设备图标弹出其实时监控页面查看运行状况,图 7、图 8 分别为水冷壁实时监测页面和水冷壁测点监测页面。
3.5、故障预警功能
系统通过使用企业自主研发的实时数据技术,对自动采集的实时数据进行存储,再根据前期在系统的知识库模块中建立维护的故障预警准则进行计算和分析,用以判断预警准则是否成立,并将结果快速高效安全地发送到系统 Web 服务器, Web 服务器再将各预警信息实时推送到系统前台的状态监测页面和相关检修人员的手机客户端。
当预警系统发出警示时,用户不仅可以看到发出警示的设备对应的信息,还可以通过关系树查看是该设备的哪些测点可能发生故障,并通过相关相似设备查看发生警示的设备是否会影响到其下游设备的运行或者警示是否是其上游设备的某些异常导致,以便更加直观、快速地找出问题来源。
当某一设备发出告警信息时,系统将其可能影响到的设备问题的相关指标参数,通过趋势图组的形式在同一界面上显示,以及对该设备的相关相似设备运行状况进行分析比较,为相关技术人员查看、分析和判断等工作提供了便利,不仅有利于全面分析问题,还可以极大地提升工作效率减少经济损失。同时系统会将设备可能发生的故障发出处理请求,生成缺陷处理单,并对处理过程、响应时间和处理结果进行跟踪统计。
3.6、检修决策功能
故障和预警发生后,在保障设备安全运行的前提下,对设备进行寿命分析,融合维修成本、节能效益等管理信息,为厂领导提供设备维修和更换方案进行技术经济分析,提供维修辅助决策,并且根据专家案例库里的典型故障模型,提供具体对策和处理建议,指导运行人员进行运行调整和处理,从而有效地消除故障,保证机组设备经济、安全运行。
4、结语
适应国内电力行业的发展需求,实现设备预知性维修,是电力设备检修改革发展的必然趋势。 本系统对机组设备的性能参数进行实时状态监测,自动提取反映设备故障特征的信息,利用故障诊断模型识别设备的健康状态,给出设备最有可能发生故障原因的建议,对解决发电机组设备问题具有很好的指导意义,为机组设备状态检修的优化提供有力支持。
本系统的研究主要集中在设备运行状态预测部分。 目前由于实现故障预警的预警准则是人为分析总结制定的规则,其准确性还需要在实践中反复不断的验证和优化。 不断的完善、优化、充实专家案例库,是本系统未来发展的方向。 由于发电设备的故障预警系统研究是国内外研究的新兴课题,在应用推广上还有漫长的道路要走.
(史兴领 夏力伟 李剑 崔显成 蒋莹莹 毛飞)