基于BP神经网络的分流制雨水管中旱流流量预测模型

作者:郭萌 胡欣逸 苏定江 张智 姚娟娟
单位:重庆大学环境与生态学院 中国市政工程西北设计研究院有限公司重庆分院 重庆市市政设计研究院
摘要:年径流总量的准确性会影响控制率的计算,而监测的年径流总量中存在旱流流量影响,准确预测雨水管中旱流流量并进行识别,能得到更加切合实际径流控制率的统计结果。将BP神经网络模型运用到旱流流量的预测上,可以提高其预测的准确性。以重庆市璧山区2017~2019年的典型下垫面雨水管出口旱流流量实测数据为例,选取月份、星期、小时、温度、湿度等指标作为预测参数,建立了BP神经网络预测模型,并运用该模型对各种典型下垫面的分流制雨水干管中的旱流流量进行预测与辨析。结果表明:模型预测值的相关性系数(R2)都在0.70以上,模型精度较高,能够准确地预测分流制雨水管出口中的旱流流量,可以提高雨水径流量计量的准确性。
关键词:海绵城市年径流总量雨水管道旱流流量预测BP神经网络
作者简介:姚娟娟,女,1982年出生,四川隆昌人,博士,副教授,主要研究方向为水处理及海绵城市研究。通讯处:400045重庆市沙坪坝区沙正街电话:13637780292 E-mail:yaojuanjuan@cqu.edu.cn;

 

0 引言

年径流总量控制率能够对低影响开发措施对径流体积的控制能力进行考察,而计算年径流总量控制率则需对年径流总量进行准确地监测。不论国内外,分流制雨水管中普遍存在雨污混接、地下水下渗等现象[1],使得雨水管中普遍存在旱流流量,且旱流流量时空变化较大,简单的扣除将影响雨管内雨水径流量的准确计量。因此,研究雨水干管中旱流流量的规律,对其进行识别,对于雨水径流量的准确监测以及年径流总量控制率的精确计算至关重要。

在旱流流量的监测中,可能参杂着没有任何联系的信息,想要使用线性方法来建立模型很困难,但是通过BP神经网络模型去求解旱流流量的非线性系统[2],可以更好的解决问题。它能够学习以及储存大量输入层与输出层的关系,并且能够反馈多层映射关系,能够处理旱流流量中所有的随机、大量、模糊的信息[3],但目前国内外鲜有应用BP神经网络模型对分流制的旱流流量进行预测的研究[4,5]。本研究以重庆市璧山区海绵城市年径流总量监测为例,采取BP神经网络模型对分流制雨水管道中的旱流流量进行预测与识别,从而保障雨水径流量的准确性。

1 旱流流量的监测

本研究利用重庆市璧山区海绵城市智慧监测系统所得的实时监测数据开展不同下垫面分流制雨水管道中的旱流流量的规律研究[6,7]。重庆市璧山区海绵城市智慧监测系统共计8个独立的监测站,如图1和表1所示。研究采用2017年7月1日~2019年7月1日共计24个月中,8个监测站监测的无降雨时的旱流流量数据进行分析。为减少前期/后期降雨对旱流流量存在的干扰,研究将前后24h有降雨记录的旱流流量数据剔除,最终获得共计268d有效旱流流量数据。

2 旱流流量影响因子分析

旱流流量的准确预测是年径流总量控制率的关键一环,影响旱流流量预测的因素复杂多样。考虑到土地利用、人口活动、经济发展水平等因素不能直接用数据表示,所以从不同尺度的下垫面进行了分类讨论,从住宅、商业等小尺度的下垫面到大流域大尺度的下垫面都进行了讨论,而天气状况、工作日等因素会影响人们用水量的情况,造成旱流流量的变化。本文基于现有数据,通过对旱流流量变化的分析,最终确定预测模型的输入变量及理由如表2所示。

图1 监测点的选取(○为雨水管出口,为汇水面积)

图1 监测点的选取(○为雨水管出口,为汇水面积)

Fig.1 Monitoring point selection map

表1 8个典型地块下垫面面积统计
Tab.1 Statistical table of underlying surface area of 8typical plots   

表1 8个典型地块下垫面面积统计

表2 旱流流量影响因子
Tab.2 Impact factor of dry weather flow   

表2 旱流流量影响因子

3 BP神经网络

3.1 建模原理

BP(Back propagation)神经网络模型于1985年由Rumelhart和Mc Clelland首次提出[8]。其原理是通过输入一个变量,经过BP神经网络模型中的输入层、隐含层以及输出层神经元后产生一个输出变量,然后通过实际输出与期望输出的比较,得到误差反馈到上一个神经元,进行权值修改,重复该过程直至模型输出的误差在可接受范围内[9]

3.2 数据处理

在数据采集过程中会因过失误差产生异常值,为了使预测的结果更能有效的反映出客观实际,将268d的数据先用K-means聚类的方法剔除异常值。随机从样本总体中选择k个样本,初始地代表一个簇,对数据集中剩余样本,根据其与各个簇中心的距离,将它赋予给距离最近的簇,重新计算每个类的平均值。这个过程不断重复,直到满足某种收敛条件。通常,收敛条件采用平方误差准则,使其变化不超过一个设定的值,见式(1)。

 

式中E———样本总体中所有样本的的平方误差总和;

k———聚类数;

P———样本;

mi———类Ci的平均值。

根据最终的聚类结果,决定选用51 659个数据进行神经网络模型的训练、验证及测试。

因为所有收集的数据变化较大,所以需要将所收集的数据映射到[-1,1]之间,进行归一化处理,这样有利于提高BP神经网络的训练速度[10]。具体算法见式(2):

 

式中p———收集的一组数据;

minp,maxp———这组数据的最小值和最大值;pn———映射后的数据。

本研究采用MATLAB工具箱中Neural Net Fitting神经网络工具进行BP神经网络模型训练。将处理好的268d共计51 659个数据,月份、星期、小时、温度、湿度等输入量以及流量输出量输入MATLAB中BP神经网络中进行训练以及测试。并且为了防止BP神经网络训练数据过度而偏离,把数据随机分为训练、验证以及测试组,分别所占比例为70%、15%、15%。

3.3 模型的建立与检验

经过前期对旱流流量数据的研究,选取影响旱流流量的因素分别为月份、星期、小时、温度、湿度。设输入层与输出层为x0,x1,x2,x3,x4,分别代表月份、星期、小时、温度、湿度,月份为1~12月,星期为1~7日,小时为0点0分~24点0分,温度为地面温度,湿度为地面湿度,输出层为y0,代表旱流流量。每个节点的输出值都是和权重矩阵所对应元素的权重数相运算的结果,然后同一行(列)累加作为下一层对应节点的输入。输入层单元i到隐含层单元j的权值为vij,隐含层单元j到输出层单元k的权值为Wjk,用b1,b2来分别表示隐含层单元和输出层单元的阈值。

该网络隐含层单元的输出值见式(3):

 

输出层各单元的输出值见式(4):

 

隐层神经元个数的选取是衡量网络建模效果好坏的一个关键因素。通常是采用经验方法以及反复的试算才能确定最优隐层。最终经过反复试算,选择误差最小的隐层神经个数,为13个。

4 结果与分析

4.1 旱流流量分析

对璧山区8个监测点的有效旱流流量占比进行分析,1#~8#占比分别为2.67%、19.19%、15.35%、41.2%、4.61%、26.03%、39.42%、49.47%。除1#和5#以外,其余点的旱流流量都在10%以上,8#的旱流流量占比将接近50%左右,4#和7#的旱流流量占总流量的40%左右,说明旱流流量在总流量中占有的比例较大,在计算时需要扣除。虽然5#和6#均为住宅的用地性质,7#和8#同为流域的用地性质,用地性质相同,但是旱流流量的占比均存在较大差异,说明用地性质可能对旱流流量有一定的影响,但不是主要的。

8个监测点的旱流流量均在总流量中占有一定的比例,不同点位的旱流流量所占比例差异较大,在对年径流总量计算时,如果全年外排雨量不扣除这些旱流流量,将会导致监测结果偏高。BP神经网络模型既可以用于小尺度的下垫面也可以用于大尺度的下垫面上,只要有排口的地方,都可以对其建立BP神经网络预测模型,在降雨时对其进行分离与识别,从而保证径流的准确性。

4.2 旱流流量日变化分析

以永嘉桥流域为例,对其有效旱流流量进行逐时分析(见图2),24h内均存在旱流流量,且逐时波动较大,无明显规律。考虑使用降雨前非降雨期的旱流流量数据并不能反映一天旱流流量的变化过程,而且雨季时会有连续的降雨,此时只是扣除某一段时间反映的旱流流量会造成较大的误差。BP神经网络模型是一种可以深度学习的算法,本身具有自适应与自组织能力,避免了这种误差。随着数据的不断增加与变化,BP神经网络可以通过监测的数据,调整拟合值与实际值之间的误差,通过误差反馈机制,调整模型参数,对结果进行修正、改进与完善。如果区域有较大的变化时,可以采用新的数据集,用新的模型参数进行预测。

4.3 旱流流量的预测模型

通过224代BP神经网络训练后,训练结果达到收敛,结果如表3所示。嘉陵工厂监测点BP神经网络旱流流量的预测模型中,预测值与监测值的相关系数为0.90,其中训练组的相关系数为0.900,验证组的相关系数为0.945,测试组的相关系数为0.823,说明预测结果与实测值相关性十分显著,模型模拟效果较好,能准确的还原嘉陵工厂监测点有降雨时的旱流流量。

图2 旱流流量日变化箱型图

图2 旱流流量日变化箱型图

Fig.2 Dry weather flow of daily variation box diagram

璧山中学、南门唐城、人民广场、同景国际、金科小区、检察院流域监测点的预测模型中,预测值与监测值的相关系数为0.75~0.85,说明模型模拟效果较好,能够有效的还原各个监测点有降雨时的旱流流量,其中璧山中学、南门唐城、同景国际和金科小区的均方误差低,说明模型的精度高。

表3 不同下垫面BP神经网络旱流流量预测模型
Tab.3 The dry weather flow prediction model of BP neural network in different underlying surface   

表3 不同下垫面BP神经网络旱流流量预测模型

永嘉桥流域监测点BP神经网络旱流流量的预测模型,预测值与监测值的相关系数为0.70,其原因为嘉桥流域汇水面积最大,永嘉桥流域中不规律的旱流流量偏多,导致永嘉桥旱流流量BP神经模型R2为0.70略低于0.75,但永嘉桥旱流流量BP神经网络模型也能够部分还原规律的旱流流量。

4.4 BP神经网络模型的测试

从表4中可以看出,BP神经网络旱流流量模型的R2均在0.7以上,说明该BP神经网络模型能够进行后续旱流流量预测。

为了验证BP神经网络模型的精度,对8个BP流量神经网络模型进行回归显著性验证,结果如表4所示。结果表明所有BP神经网络模型的P值均<1E-10,通过了显著性检验,说明BP神经网络旱流流量的模型预测结果是可靠的。

表4 8个典型地块BP神经网络模型验证结果
Tab.4 Verification results of 8typical plot BP neural network models BP neural network in different underlying surface   

表4 8个典型地块BP神经网络模型验证结果

综上表明,上述经过训练、测试及验证所得的BP神经网络模型可以准确对重庆市璧山区雨水出口的旱流流量进行预测,扣除降雨时雨水径流量中的旱流流量,保证雨水径流量的准确性用于后续径流控制率的研究计算。

5 结论

(1)BP神经网络模型能够充分挖掘出旱流流量的变化规律以及其他因素对旱流流量的影响。通过对重庆市璧山区雨水出口监测所得实际数据分析计算表明,BP神经网络模型针对分流制雨水管出口的旱流流量预测具有很好的适用性,能够准确预测分流制雨水管出口的旱流流量,该方法能够较为准确的除去降雨时的雨水径流中的旱流流量。

(2)不论是以小要素构成小尺度的下垫面还是由小要素组成大流域大尺度的下垫面都可以用该模型对旱流流量进行预测,该模型具有一定的普适性。

(3)旱流流量影响了年径流总量的精确度,扣除后对海绵城市径流量监测工作有指导作用,为海绵城市的建设工作提供了帮助。

 

参考文献[1]Weiss G,Brombach H,Haller B.Infiltration and inflow in combined sewer systems:Long-term analysis[J].Water Science and Technology,2002,45(7):11-19.

[2]Wang J J,Shi P,Jiang P,et al.Application of BP neural network algorithm in traditional hydrological model for flood forecasting[J].Water,2017,9(1):48.

[3]Wu B,Han S J,Xiao J,et al.Error compensation based on BP neural network for airborne laser ranging[J].Optik,2016,127(8):4083-4088.

[4]赵文刚,刘晓群,宋雯,等.基于PSO-BP神经网络的西洞庭湖南咀站径流预测[J].人民长江,2019,50(3):124-130.

[5]班福忱,吴丹,黑月明.基于自适应过滤与BP神经网络的城市时用水量组合预测模型[J].给水排水,2017,53(11):107-111.

[6]Dong J H,Wang G Y,Yan H Y,et al.A survey of smart water quality monitoring system[J].Environmental Science and Pollution Research,2015,22(7):4893-4906.

[7]Kulkarni P,Farnham T.Smart city wireless connectivity considerations and cost analysis:Lessons learnt from smart water case studies[J].Ieee Access,2016,(4):660-672.

[8]Rumelhart D E,Hinton G E,Williams R J.Learning representations by back-propagating errors[J].Nature,1986,323(6088):533-536.

[9]Xu Z X,Yin H L,Li H Z.Quantification of non-stormwater flow entries into storm drains using a water balance approach[J].Science of the Total Environment,2014,487(15),381-388.

[10]崔东文.多隐层BP神经网络模型在径流预测中的应用[J].水文,2013,33(1):68-73.
Prediction model of separate discharge dry weather flow based on BP neural network
Guo Meng Hu Xinyi Su Dingjiang Zhang Zhi Yao Juanjuan
(College of Environment and Ecology,Chongqing University Chongqing Branch of Cscec Aecom Consultants Co.,Ltd. Chongqing Municipal Research Institute of Design)
Abstract: The accuracy of annual total rainfall will affect the calculation of control rate.Dry weather flow effect the annual total rainfall monitored.The more accurate the dry weather flow in the rainwater was predicted and identified,the more realistic statistical results of runoff control rate can be obtained.Applying the BP neural network model to predict the dry weather flow can improve the accuracy of the prediction.This paper takes the measured data of the dry weather flow current of the typical underlying surface rainwater pipe from 2017 to 2019 in the Bishan District of Chongqing as an example.The BP neural network prediction model was established.It used the months,weeks,hours,temperature,humidity and other indicators as prediction parameters.And the model was also used to predict and analyze the dry weather flow in the separate discharge of various typical underlying surfaces.The result shows that the correlation coefficient(R2)of the model predictive value is above 0.70,indicating that the model has high precision and can accurately predict the dry flow in the outlet of the splitting rainwater pipe,which can improve the accuracy of the rainwater flow metering.
Keywords: Sponge city; Annual runoff; Rainwater pipeline; Dry weather flow; Prediction; BP neural network;
1862 0 0
文字:     A-     A+     默认 取消