基于自适应过滤与BP神经网络的城市时用水量组合预测模型

作者:班福忱 吴丹 黑月明
单位:沈阳建筑大学市政与环境工程学院
摘要:城市短期时用水量预测是城市管网进行优化调度决策的基础, 用水量预测的准确性与稳定性更是关系着城市供水正常运行管理的关键。根据某市的用水数据, 分别利用时间序列预测方法以及解释性预测方法对城市短期时用水量进行预测。综合两种预测方法的优点, 提出了基于权系数优化理论的组合预测法。通过实例预测结果比较, 用水量组合预测法模型较单项预测模型有更高的准确性和稳定性。
关键词:时用水量预测 自适应过滤法 BP神经网络法 组合预测法

 

0 引言

   城市用水量预测是根据过去一段时间的用水数据信息, 通过建立一定的数量关系预测出未来几小时、几天、几个月甚至几年的用水量[1]。根据用水量预测时间的长短可将其分为两类:长期预测与短期预测。短期预测是根据城市几天或几个月的用水数据以及天气和用水习惯等影响因素, 预测未来几天或几个月的用水量, 是城市运行调度的基础[2]

   目前城市用水量预测方法大体可分为定性预测与定量预测。自适应过滤法与BP神经网络法分别属于用水量定量预测的时间序列法和回归分析预测法。时间序列法是通过数理统计的方法对多种因素综合作用的历史数据进行规律统计和曲线拟合, 因该方法将系统看作黑箱进行预测, 所以如果未来有不可预测的突发事件, 预测结果精度将会受到很大影响;回归分析预测方法是能够反映输入输出之间某种关系的一种方法, 在预测时会考虑影响因素的作用结果, 但影响因素的选择以及影响因素的量化值都是带有一定主观性及不确定性, 预测结果精度也会受到一定影响。将两种方法进行适当组合将大大提高预测的精度。首先利用自适应过滤法以及BP神经网络法对城市短期时用水量进行单项预测, 在此基础上建立这两种方法的组合预测模型。

1 时用水量预测模型建立及评价原理

1.1 自适应过滤法基本原理

   自适应过滤法是属于时间序列预测方法的一种, 它是通过拟合历史用水量数据的规律来预测未来的用水数据。因此自适应过滤法适合预测具有一定周期规律的短期用水量数据, 如月用水量、日用水量和时用水量。自适应过滤法基本原理是为预测的时间序列设定一组权数, 通过历史用水数据的不断训练而对权数不断调整, 经过多次的迭代最终得出变化不大的一组权数, 在此基础上求解用水量。

   自适应过滤法的基本公式见式 (1) [3]:

    

    

   ωi———第t-i+1期的观测值权数;

   yt-i+1———第t-i+1期的观测值;

   N———权数的个数, i=1, 2, …, N;t=N, N+1, …, n, n为序列数据的个数。

   权数调整公式见式 (2) :

    

   式中ω′i———调整后的第i个权数;

   ωi———调整前的第i个权数;

   k———学习常数, 其大小决定了权数高速的速率;

    

1.2 BP神经网络法基本原理

   人工神经网络算法是一种模仿生物神经结构处理信息模式的算法模型, 与生物神经网络相似, 它也是主要由输入层、输出层、隐含层以及各层之间连接的权值组成。BP神经网络是人工神经网络中运用较为广泛的一种算法, 它是在人工神经网络的基础上, 通过不断误差反馈来进行权值调整的一种误差前馈网络模型[4]

   BP神经网络法计算基本公式见式 (3) ~式 (5) :

    

   式中netpj———单元j的输入总和;

   Wij———神经元i、j之间的权重;

   Opi———单元i的输入;

   f———作用函数;

   N———处理单元数;

   p———训练样本个数;

   j———神经网络单元数。

   BP神经网络每次计算后的输出值都会有误差Ep, 网络会根据误差来调整权值Wij, 误差Ep计算公式以及权值Wij调整公式见式 (6) 、式 (7) :

    

   式中δpj———训练误差;

   t———学习次数;

   η———学习因子。

1.3 组合预测法基本原理

   组合预测模型最常用的方法为线性组合法, 即各个单项预测结果乘以相应权系数的和, 具体公式如式 (8) 所示[7]:

    

   式中y———组合预测结果;

   wi———第i个单项预测结果权系数;

   yi———第i个单项预测结果;

   n———单项预测模型个数。

   组合预测模型中最重要的是确定各个单项预测结果的权系数, 目前较为常用的方法有算术平均法、倒数法和数学优化法[8]。本文采用的是通过建立以预测相对误差平方和为目标函数, 组合权数为决策变量的组合权系数优化模型, 以此求解出组合模型的最优权数[9]

   建立的组合权系数优化模型见式 (9) :

    

   约束条件为:;0<wi<1;q为第i个时刻的真实用水量。

   在利用组合模型预测城市时用水量之前, 首先需要进行单项模型的预测, 然后再将单项预测结果进行线性组合。单项模型预测结果组合时, 组合权系数周期为48h, 因此, 预测结果的组合权系数个数以48个为一个周期, 最终求出一个周期48组最优组合权系数。在此基础上对单项模型进行组合。

1.4 预测结果比较方法

   模型预测结果的比较一般会引入常用的评价指标, 为对比3种模型预测结果的准确性与稳定性, 本文分别求出了3种时用水量预测结果的平均绝对误差、平均相对误差、精度方差和模型有效度[10,11]。假设模型分别预测了n个时用水量, ft为模型中第t个小时预测的用水量, qt为第t个小时的真实用水量, 则平均绝对误差 (MAE) 、平均相对误差 (MAPE) 、模型在t小时的预测精度 (At) 、精度方差 (σA (t) ) 、模型有效度 (S) 的计算公式见式 (10) ~式 (14) :

    

   式中E (At) 、σ (At) ———模型在t小时的预测精度的均值和均方差。

2 模型预测工程实例

   为验证模型的可行性, 本文以某市14天, 即336h的用水数据为依据, 对模型的准确性和稳定性进行验证。为了能够充分验证模型的有效性, 本文利用前12天的历史用水量来预测后2天, 即48h的用水数据;通过48h的预测结果准确性和稳定性评价, 以此来说明所建立模型的长效预测精度和预测稳定性。

   根据图1中14天内用水量变化情况, 以24h为周期可分析出每天用水数据变化规律基本相同, 即从4:00用水趋势开始上升;8:00~9:00达到高峰;9:00~10:00用水趋势开始下降;从14:00~15:00用水趋势开始再次回升;18:00~19:00再次达到用水高峰;之后用水趋势开始逐渐下降, 这一趋势基本符合居民用水习惯。

图1 14天内用水量变化情况

   图1 14天内用水量变化情况

    

2.1 自适应过滤法预测时用水量实例

   自适应过滤法预测时用水量首先是选择一定个数的时间序列, 并确定权数个数及数值。此次实例将要预测48h的用水量, 权数个数为48个, 初始权值数值为1/48。然后利用48个权值及前48个用水数据来求第49h的用水量, 根据权数调整公式及所求的预测值与真实值来求第49个权值, 再利用后48个权值和相应的48个用水数据求出第50个用水量, 以此类推。最后利用288h的用水量来不断求出新的权值, 设置迭代次数, 直到48个权值基本趋于稳定, 利用最新权值求出第13天和第14天共48h的用水量。根据原理和公式, 编写Fortran预测程序进行预测, 具体预测结果如图2所示。

   由图2可知自适应过滤法模型预测结果与真实用水数据趋势基本吻合, 但是预测准确性较差。通过数据可知, 模型48h的预测结果误差最大出现在第13天的22:00为12.29%, 预测结果误差最小出现在第13天的6:00为0.92%。因此时间序列预测模型的准确性并不是很高, 且没有控制在5%之内, 没有达到模型预测精度要求。

图2 自适应过滤法预测结果与真实值对比

   图2 自适应过滤法预测结果与真实值对比

    

2.2 BP神经网络法预测时用水量实例

   BP神经网络法预测城市用水量的方法属于解释性预测方法。利用BP神经网络法对时用水量预测时, 将时用水量的影响因素分解出来, 进行综合预测。城市用水量主要受自然因素和社会因素影响[5]。在短期用水量预测中, 自然因素包括当天的温度变化、气候干燥等, 而社会因素主要指工作日和节假日等对用水规律的影响。

   在进行时用水量预测时, 选取了3个时用水量的主要影响因素, 分别是气温、阴晴和日期[6]。在预测之前将包括气温、阴晴和日期在内的影响因素进行量化处理。3种影响因素量化的机理都是通过观察以往历史数据中, 当天温度、阴晴状况、以及工作日等对时用水量的实际影响状况进行量化[6]。其中温度量化值是根据历史数据中对应温度范围的用水量比重来量化;阴晴量化值是根据晴天用水量多, 雨天用水量少的常识量化;星期量化值是根据以往星期用水量平均值与周一用水量的比值进行量化。具体量化结果如表1所示。

   表1 用水量影响因素量化值对照   

表1 用水量影响因素量化值对照

   根据上述模型公式利用MATLAB编写函数, 即可进行模型求解计算。BP网络结构具有3个输入单元, 2个隐含层和1个输出单元。3个输入单元分别为节假日情况、阴晴情况和温度情况;输出单元为时用水量;第一隐含层有7个节点, 第二隐含层有5个节点。网络学习速率为0.01, 动量因子为0.08, 网络训练次数为40 000次, 合成时训练误差和目标误差分别为0.001和0.000 05, 合成阈值为0.01。隐含层作用函数为sigmoid, 输出层作用函数为purelin, 网络训练函数为traingdm, 网络学习函数为learngdm。用前10天数据为训练样本, 第11、12天数据为测试样本, 对第13、14天数据进行预测。预测具体结果如图3所示。

图3 BP神经网络法预测结果与真实值对比

   图3 BP神经网络法预测结果与真实值对比

    

   由图3可知BP神经网络法模型预测结果与真实用水数据趋势基本吻合, 但是预测准确性较差。通过数据可知, 模型48h的预测结果误差最大出现在第14天的23:00为15.59%, 预测结果误差最小出现在第14天的12:00为0.30%。因此BP神经网络法模型的准确性也不是很高, 且没有控制在5%之内, 没有达到模型预测精度要求。

2.3 组合预测法预测时用水量实例

   组合预测的目标函数求解过程中, 可以通过拉格朗日求解多元函数最值法求解权系数。本文利用此法对权系数进行求解, 最后求出48组最佳权系数。以第13天的7:00和8:00为例, 自适应过滤法预测结果与BP神经网络预测结果的权系数分别为0.236 8与0.763 2, 0.072 7与0.927 3。具体组合预测结果如图4所示。

图4 组合预测法预测结果与真实值对比

   图4 组合预测法预测结果与真实值对比

    

   由图4可知组合预测法模型预测结果与真实用水数据趋势基本吻合, 且两条曲线拟合程度较好。通过数据可知, 模型48h的预测结果误差最大出现在第14天的8:00为4.43%, 预测结果误差最小出现在第14天的16:00为0.05%。组合预测法模型预测准确性较单项模型有很大提高, 且都控制在5%以内, 符合模型预测精度要求。

3 预测结果比较

   根据模型的计算结果数据和模型评价指标的计算公式, 分别计算出了3个模型的4个评价指标, 以此对模型进行综合评价。

   从表2中可以看出, 在平均相对误差指标中, 组合预测法模型的平均相对误差均小于两个单项预测模型, 且预测平均误差均小于5%, 符合预测模型精度要求, 因此组合预测法模型的准确性较高。同时, 在模型精度指标中, 组合预测法模型有效度接近于1, 均高于两种单项模型的有效度, 验证了组合预测法模型具有更好的预测准确性。

   表2 3种预测模型指标评价比较   

表2 3种预测模型指标评价比较

   从图5的k线中也可更直观地看出组合预测法误差波动基本都在两个单项模型中间, 且误差总体水平小于单项模型;同时表2的精度方差指标中, 组合预测法模型的准确度方差相较于两种单项模型较小, 这体现了组合预测法模型具有更高的预测稳定性。因此组合预测法模型比单项模型具有更好的预测准确性和稳定性。

图5 3种预测模型误差k线

   图5 3种预测模型误差k线

    

4 小结

   通过对3种模型预测结果误差比较, 组合预测法模型比单项预测模型有更高的准确性和更好的稳定性。用水量的准确预测是后期管网科学优化调度的基础。以预测的时用水量为依据可建立管网优化调度决策模型, 确定在各个时段各供水水源的最佳供水量和供水压力, 进而确定泵站内水泵机组的最优组合和启停情况, 制定调度方案对管网进行科学供水。不仅能够节省水力和电力资源, 更能够减小管网因供水量过多造成的爆管事故和存水时间过长造成的水质安全事故等供水事故发生的概率。

    

参考文献参考文献

[1]周艳春, 李树平, 赵子威, 等.基于BP神经网络工具箱的城市短期用水量预测.给水排水, 2015, 41 (s1) :375~377

[2] 陆健.基于BP神经网络和遗传算法的城市供水系统优化调度模型研究:[学位论文].南京:河海大学, 2007

[3] 安明阳, 付婉霞, 韩伟, 等.城市供水三种时用水量预测方法的比较.给水排水, 2012, 38 (s2) :229~231

[4] 陈卫, 陆健, 吴志成.BP网络的城市时用水量预测组合模型.哈尔滨工业大学学报, 2009, (6) :197~200

[5] 刘洪波, 张宏伟, 田林.人工神经网络法预测时用水量.中国给水排水, 2002, 18 (12) :39~41

[6] 向平, 张蒙, 张智, 等.基于BP神经网络的城市时用水量分时段预测模型.中南大学学报自然科学版, 2012, 43 (8) :437~441

[7] 梁德阳.基于SARIMA和BP神经网络的时间序列组合预测模型研究:[学位论文].兰州:兰州大学, 2014

[8] 翟静, 曹俊.基于时间序列ARIMA与BP神经网络的组合预测模型.统计与决策, 2016, (4) :29~32

[9] 王圃, 陈荣艳, 孙晓楠, 等.加权组合模型在城市用水量预测中的应用.中国给水排水, 2010, 18 (3) :428~434

[10] 石慧, 王玉兰, 翁福利.BP神经网络和模糊时间序列组合预测模型及其应用.计算机应用, 2011, 31 (s2) :90~91

[11] 李斌, 许仕荣, 柏光明, 等.灰色-神经网络组合模型预测城市用水量.中国给水排水, 2002, 18 (2) :66~68

[12] 袁伟, 陈晓东.基于GA-BP神经网络与LSSVM支持向量机的日用水量组合预测模型.水电能源科学, 2015, 33 (10) :33~37
1322 1 1
文字:     A-     A+     默认 取消