平台介绍
电力大数据技术平台(Power Data Platform),简称PDP,是一款服务于电力行业大数据处理和应用的基础技术平台,PDP从电力行业的特点出发,兼容目前主流的大数据技术框架,如Hadoop,Spark,Storm等,能够实现多种数据源的集成接入,数据综合治理,应用领域建模和数据分析展示等全流程的技术功能。
PDP平台主要分为:数据层、计算分析层和服务应用层三部分。数据层集成了大数据主流技术框架,能够实现各种数据库、文本、外部实时接口多种数据源接入和海量数据的存储处理,对电力行业的各种数据资源(结构化数据、非结构化数据以及半结构化)使用不同的技术处理。在计算分析层,集成通用的模型库和算法库,同时开发了多种针对电力业务特点的算法和分析模型。在服务层,实现了多种大数据分析设计的开发接口和界面,集成了R语言开发环境和多种图形化的建模设计界面,为电力的领域应用提供了方便实用的接口,电力行业的业务人员可以在服务层完成针对自己特殊领域的数据分析和模型算法研究,并最终发布展示。