本书立足于大数据分析基础知识和电网企业数据应用实际,介绍大数据概述、电网大数据研究及应用背景等内容;讲解电网企业日常业务开展中涉及的主流数据分析技术与应用工具,内容包含技术基础、统计分析、机器学习、可视化技术等;介绍近年来电网企业开展数据分析应用的典型实践案例,内容覆盖电网生产、营销、财务、物资、调控、发展等专业领域。
随着新一轮科技革命和产业变革的兴起,物联网、大数据、云计算、人工智能等数字技术日新月异,以数据资源为重要生产要素、以全要素数字化转型为重要推动力的数字经济正在成为经济发展的新引擎。在数字经济浪潮中,越来越多的企业开始走上数字化转型之路。近年来,电网企业不断加大技术投入,积极开展智能电网建设。目前,已实现用户、变压器、线路等基础档案数据和电测量数据的全采集,积累了海量的用户和设备数据资源,为行业大数据分析提供了扎实的数据基础。国家电网有限公司提出实施大数据战略,建设具有中国特色国际领先的能源互联网企业。南方电网公司明确提出“数字南网”建设要求,将数字化作为公司发展战略路径之一。在2020年新型冠状病毒性肺炎疫情防控阻击战中,电网企业通过应用企业复工复产电力指数、物资供应链上下游协同度分析等大数据产品,以数字化手段战“疫”,助力疫情防控和社会生产全面恢复,有效保障了企业生产经营有序开展。
本书基于电网企业转型需要,系统阐述了电网企业日常数据分析所需的常用技术和典型案例,是长期从事信息化和数据分析工作骨干人员多年工作经验的积累与总结。第1章为大数据概述,主要介绍大数据产生背景、大数据发展现状与趋势;第2章为电网大数据研究及应用,主要介绍电网数字化发展历程、电力大数据概念、电网大数据应用现状及展望;第3章介绍电网企业在用的各类工具,包括SPSS、Python、Tableau等常用分析软件的基本原理;第4章讲解统计分析基本方法和原理,同时介绍两个基于SPSS统计分析实现;第5章讲解机器学习的基本类型原理,同时介绍了基于Python回归、聚类等方法在电力业务分析中的具体实现;第6章讲解可视化分析技术具体方法,同时介绍基于Python的可视化实现和基于Tableau的可视化实现;第7章主要介绍相关应用案例,本书精选电网企业历年开展数据分析应用的8个具体实践案例,内容覆盖电网企业内部各个专业。
本书在编写过程中,参阅借鉴了不少有关人员的研究成果及实际案例,在此对他们的辛勤工作和贡献表示深深的谢意。
限于编者水平,书中难免存在疏漏和不足之处,恳请读者批评指正。
前言
1 大数据概述
1.1 大数据产生背景
1.2 大数据发展现状与趋势
1.3 大数据应用及影响
2 电网大数据
2.1 电网数字化发展历程
2.2 电力大数据技术
2.3 电力大数据建没及展望
2.4 电力数据风险及安全防护
3 技术基础工具
3.1 大数据应用方法和工具
3.2 SPSS技术基础
3.3 Python技术基础
3.4 Tableau技术基础
4 统计分析方法
4.1 统计学概述
4.2 统计学基本分析方法
4.3 电网企业统计分析案例
5 机器学习及其在电网数据中的应用
5.1 机器学习概述
5.2 深度学习
5.3 基于机器学习方法的电网数据分析
6 电力数据可视化技术
6.1 数据可视化概述
6.2 基于Python的电网数据可视化
6.3 基于Tableau的电力数据可视化
7 电网大数据分析案例
7.1 总体介绍
7.2 成果案例
参考文献