智能电网中电力负荷短期预测数据挖掘模型
摘要:依据数据挖掘理论对数据进行收集、整合,运用改进型
BP神经网络模型处理数据,建立电力负荷模型进行短期预测.通过不同精度下的实验分析,结果表明,改进型神经网络负荷预测模型在高精度下预测结果优于低精度下预测结果,最大误差同比降低80% ,适用实际负荷预测.
关键词:数据挖掘;改进BP算法;人工神经网络;电力负荷预
测;L—M 法
IBM高级电力专家MartinHauske解释智能电网有3个层面的含义:首先是利用传感器对发电、输电、配电、供电等关键设备的运行状况进行实时监控;然后把获得的数据通过网络系统进行收集、整合;最后通过对数据的分析、挖掘,达到对整个电力系统运行的优化管理.笔者对电力负荷数据进行数据挖掘,达到负荷准确预测的目的.
1、数据挖掘
数据挖掘在人工智能领域习惯上又称为数据库中知识发现(Knowledge Discovery in Database,KDD),也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤.知识发现过程由以下3个阶段组成:数据准备;数据挖掘;结果表达和解释.
以住的数据挖掘中多采用以时间序列法为代表的各种经典负荷预测方法,该法很难找出负荷与影响因素之间呈高度非线性化的量化关系.采用BP神经网络算法可以任意逼近非线性系统,
能很好地对历史负荷曲线进行拟合 .
2、BP神经网络
BP网络也称误差回传神经网络,是一种无反馈的前向网络,网络中的神经元分层排列.每一层内神经元的输出均传送到下一层,由联接权来达到抑制、减弱或增强这些输出的作用,输出层和隐层神经元的净输入是前一层神经元输出的加权和.每个神经元均由它的输入、阈值和活化函数来决定神经网络自身的活化程度.
2.1 传统BP神经网络
2.1.1 传统BP神经网络模型
传统的3层网络中,假定net为输出,0为输入,输入神经元有i个,隐层神经元有j个,输出层神经元有k个.隐层第j个神经元的输人为netj=
,输出为oj=tan(netj);输出层第k个
神经元的输入为netk= ,输出为g(x) =
。其中,lg为S型对数函数;tan为S型正切函数. 2.1.2 传统算法BP神经网络的缺点
BP神经网络学习过程中的误差反向传播过程是通过使目标函数最小化来完成的.传统算法使用的是梯度下降法.梯度下降法的缺点是,在最初几步下降较快,但随着接近最优值,由于梯度趋于零,致使误差函数下降缓慢,容易陷入局部极小值等问题.对此问题的解决出现了很多新的方法比如累计误差校正算法
等.
2.2 改进型BP神经网络
改进型BP神经网络利用非线性阻尼最小二乘法(Levenberg—Marquardt,L—M)来完成网络训练,Levenberg—Marquardt法实际上是牛顿法和梯度下降法的结合.L—M 的学习规则为
式中:e为误差矢量;J为网络
误差对权值导数的雅可比(Jacobian).当近于梯度法;当
很大时,上式就接
很小时,上式就变成牛顿迭代法.它的优点
在于网络权值数目较少时收敛非常迅速.应用Levenberg—Marquardt优化的BP算法比传统的BP神经网络算法及其它改进算法(如共轭梯度法、附加动量法、自适应调整法及拟牛顿法等)有迭代次数少、收敛速度快、精确度高等优点 。
2.3 数据挖掘架构下的BP神经网络预测
根据设计的BP神经网络预测模型,采用改进型BP算法进行电力负荷预测.
2.3.1 数据准备阶段
收集整合历史负荷数据,初始化样本矩阵.将输入层节点所描述的负荷值、温度数据组成一个12行15列的BP神经网络训练样本矩阵.为了使输入样本数据易于修改且简捷,将样本数据存放在文本文件中,利用MATLAB神经网络编程工具箱中的函数读取数据,然后初始化样本矩阵.
将样本矩阵中存在的负荷数据进行预处理.SCADA系统提供
负荷预测所需的历史负荷数据,考虑采集数据时由于各种干扰导致概率性地存在误差很大的错误数据,若以这些数据作为神经网络的输入,则预测结果会出现较大误差.故需对历史负荷数据进行预处理:
a.对因通信通道中断而缺少负荷数据和因电力系统故障而存在异常负荷时,参照正常负荷曲线进行修正或剔除相应异常样本;
b.对因采样错误带来的负荷异常值,采用数据横向对比的方法消除,即将某一时刻的负荷与其前后时刻的负荷比较,如果差值大于某一阈值,则认为有干扰,要采用软件滤波加以修正.
将一周中的每一天都看做一种日期类型,即共有7种类型,以此提高预测精度.
以北方某城市的7月10 Et至20日负荷整点负荷值为样本,预测7月21日的负荷值.为避免出现神经元饱和现象,将样本中的实际负荷数据进行归一化处理,其中负荷样本和温度的归一化处理采用如下公式
2.3.2 建立并训练BP神经网络
采用Newff函数神经网络结构创建一个3层BP网络,网络隐含层神经元的激励函数为s型函数.然后训练BP神经网络.其过程是根据样本矩阵找出一个新的BP神经网络拟合原始负荷曲线,尽
可能地使预测负荷曲线和实际负荷曲线相吻合,从而达到较好韵预测效果.训练前需要设定一些参数,如学习规则、误差指标、学习速率.采用L—M学习规则训练网络,就要运用trainlm 函数;设定误差指标是设定预测负荷曲线和实际负荷曲线的逼近程度;设定学习速率是设定神经网络训练的速度,采用L—M优化算法可以通过多次试验得到较好的效果来获得 .
2.4 负荷预测和分析
2.4.1 实例结果预测1
训练目标定为0.O1的实验结果输出为{0.235 8,0.108 7,0.142 8,0.219 1,0.533 9,0.679 7,0.704 0,0.717 7,0.778 3,0.742,0.806 9}.训练结果和预报误差分别如图1和图2所示.
2.4.2 实例结果预测2
训练目标定为0.000 000 01的实验结果输出为{0.2l1 8,

