基于BP神经网络的分流制雨水管中旱流流量预测模型
0 引言
年径流总量控制率能够对低影响开发措施对径流体积的控制能力进行考察,而计算年径流总量控制率则需对年径流总量进行准确地监测。不论国内外,分流制雨水管中普遍存在雨污混接、地下水下渗等现象
在旱流流量的监测中,可能参杂着没有任何联系的信息,想要使用线性方法来建立模型很困难,但是通过BP神经网络模型去求解旱流流量的非线性系统
1 旱流流量的监测
本研究利用重庆市璧山区海绵城市智慧监测系统所得的实时监测数据开展不同下垫面分流制雨水管道中的旱流流量的规律研究
2 旱流流量影响因子分析
旱流流量的准确预测是年径流总量控制率的关键一环,影响旱流流量预测的因素复杂多样。考虑到土地利用、人口活动、经济发展水平等因素不能直接用数据表示,所以从不同尺度的下垫面进行了分类讨论,从住宅、商业等小尺度的下垫面到大流域大尺度的下垫面都进行了讨论,而天气状况、工作日等因素会影响人们用水量的情况,造成旱流流量的变化。本文基于现有数据,通过对旱流流量变化的分析,最终确定预测模型的输入变量及理由如表2所示。
3 BP神经网络
3.1 建模原理
BP(Back propagation)神经网络模型于1985年由Rumelhart和Mc Clelland首次提出
3.2 数据处理
在数据采集过程中会因过失误差产生异常值,为了使预测的结果更能有效的反映出客观实际,将268d的数据先用K-means聚类的方法剔除异常值。随机从样本总体中选择k个样本,初始地代表一个簇,对数据集中剩余样本,根据其与各个簇中心的距离,将它赋予给距离最近的簇,重新计算每个类的平均值。这个过程不断重复,直到满足某种收敛条件。通常,收敛条件采用平方误差准则,使其变化不超过一个设定的值,见式(1)。

式中E———样本总体中所有样本的的平方误差总和;
k———聚类数;
P———样本;
mi———类Ci的平均值。
根据最终的聚类结果,决定选用51 659个数据进行神经网络模型的训练、验证及测试。
因为所有收集的数据变化较大,所以需要将所收集的数据映射到[-1,1]之间,进行归一化处理,这样有利于提高BP神经网络的训练速度

式中p———收集的一组数据;
minp,maxp———这组数据的最小值和最大值;pn———映射后的数据。
本研究采用MATLAB工具箱中Neural Net Fitting神经网络工具进行BP神经网络模型训练。将处理好的268d共计51 659个数据,月份、星期、小时、温度、湿度等输入量以及流量输出量输入MATLAB中BP神经网络中进行训练以及测试。并且为了防止BP神经网络训练数据过度而偏离,把数据随机分为训练、验证以及测试组,分别所占比例为70%、15%、15%。
3.3 模型的建立与检验
经过前期对旱流流量数据的研究,选取影响旱流流量的因素分别为月份、星期、小时、温度、湿度。设输入层与输出层为x0,x1,x2,x3,x4,分别代表月份、星期、小时、温度、湿度,月份为1~12月,星期为1~7日,小时为0点0分~24点0分,温度为地面温度,湿度为地面湿度,输出层为y0,代表旱流流量。每个节点的输出值都是和权重矩阵所对应元素的权重数相运算的结果,然后同一行(列)累加作为下一层对应节点的输入。输入层单元i到隐含层单元j的权值为vij,隐含层单元j到输出层单元k的权值为Wjk,用b1,b2来分别表示隐含层单元和输出层单元的阈值。
该网络隐含层单元的输出值见式(3):

输出层各单元的输出值见式(4):

隐层神经元个数的选取是衡量网络建模效果好坏的一个关键因素。通常是采用经验方法以及反复的试算才能确定最优隐层。最终经过反复试算,选择误差最小的隐层神经个数,为13个。
4 结果与分析
4.1 旱流流量分析
对璧山区8个监测点的有效旱流流量占比进行分析,1#~8#占比分别为2.67%、19.19%、15.35%、41.2%、4.61%、26.03%、39.42%、49.47%。除1#和5#以外,其余点的旱流流量都在10%以上,8#的旱流流量占比将接近50%左右,4#和7#的旱流流量占总流量的40%左右,说明旱流流量在总流量中占有的比例较大,在计算时需要扣除。虽然5#和6#均为住宅的用地性质,7#和8#同为流域的用地性质,用地性质相同,但是旱流流量的占比均存在较大差异,说明用地性质可能对旱流流量有一定的影响,但不是主要的。
8个监测点的旱流流量均在总流量中占有一定的比例,不同点位的旱流流量所占比例差异较大,在对年径流总量计算时,如果全年外排雨量不扣除这些旱流流量,将会导致监测结果偏高。BP神经网络模型既可以用于小尺度的下垫面也可以用于大尺度的下垫面上,只要有排口的地方,都可以对其建立BP神经网络预测模型,在降雨时对其进行分离与识别,从而保证径流的准确性。
4.2 旱流流量日变化分析
以永嘉桥流域为例,对其有效旱流流量进行逐时分析(见图2),24h内均存在旱流流量,且逐时波动较大,无明显规律。考虑使用降雨前非降雨期的旱流流量数据并不能反映一天旱流流量的变化过程,而且雨季时会有连续的降雨,此时只是扣除某一段时间反映的旱流流量会造成较大的误差。BP神经网络模型是一种可以深度学习的算法,本身具有自适应与自组织能力,避免了这种误差。随着数据的不断增加与变化,BP神经网络可以通过监测的数据,调整拟合值与实际值之间的误差,通过误差反馈机制,调整模型参数,对结果进行修正、改进与完善。如果区域有较大的变化时,可以采用新的数据集,用新的模型参数进行预测。
4.3 旱流流量的预测模型
通过224代BP神经网络训练后,训练结果达到收敛,结果如表3所示。嘉陵工厂监测点BP神经网络旱流流量的预测模型中,预测值与监测值的相关系数为0.90,其中训练组的相关系数为0.900,验证组的相关系数为0.945,测试组的相关系数为0.823,说明预测结果与实测值相关性十分显著,模型模拟效果较好,能准确的还原嘉陵工厂监测点有降雨时的旱流流量。
璧山中学、南门唐城、人民广场、同景国际、金科小区、检察院流域监测点的预测模型中,预测值与监测值的相关系数为0.75~0.85,说明模型模拟效果较好,能够有效的还原各个监测点有降雨时的旱流流量,其中璧山中学、南门唐城、同景国际和金科小区的均方误差低,说明模型的精度高。
表3 不同下垫面BP神经网络旱流流量预测模型
Tab.3 The dry weather flow prediction model of BP neural network in different underlying surface

永嘉桥流域监测点BP神经网络旱流流量的预测模型,预测值与监测值的相关系数为0.70,其原因为嘉桥流域汇水面积最大,永嘉桥流域中不规律的旱流流量偏多,导致永嘉桥旱流流量BP神经模型R2为0.70略低于0.75,但永嘉桥旱流流量BP神经网络模型也能够部分还原规律的旱流流量。
4.4 BP神经网络模型的测试
从表4中可以看出,BP神经网络旱流流量模型的R2均在0.7以上,说明该BP神经网络模型能够进行后续旱流流量预测。
为了验证BP神经网络模型的精度,对8个BP流量神经网络模型进行回归显著性验证,结果如表4所示。结果表明所有BP神经网络模型的P值均<1E-10,通过了显著性检验,说明BP神经网络旱流流量的模型预测结果是可靠的。
表4 8个典型地块BP神经网络模型验证结果
Tab.4 Verification results of 8typical plot BP neural network models BP neural network in different underlying surface

综上表明,上述经过训练、测试及验证所得的BP神经网络模型可以准确对重庆市璧山区雨水出口的旱流流量进行预测,扣除降雨时雨水径流量中的旱流流量,保证雨水径流量的准确性用于后续径流控制率的研究计算。
5 结论
(1)BP神经网络模型能够充分挖掘出旱流流量的变化规律以及其他因素对旱流流量的影响。通过对重庆市璧山区雨水出口监测所得实际数据分析计算表明,BP神经网络模型针对分流制雨水管出口的旱流流量预测具有很好的适用性,能够准确预测分流制雨水管出口的旱流流量,该方法能够较为准确的除去降雨时的雨水径流中的旱流流量。
(2)不论是以小要素构成小尺度的下垫面还是由小要素组成大流域大尺度的下垫面都可以用该模型对旱流流量进行预测,该模型具有一定的普适性。
(3)旱流流量影响了年径流总量的精确度,扣除后对海绵城市径流量监测工作有指导作用,为海绵城市的建设工作提供了帮助。
[2]Wang J J,Shi P,Jiang P,et al.Application of BP neural network algorithm in traditional hydrological model for flood forecasting[J].Water,2017,9(1):48.
[3]Wu B,Han S J,Xiao J,et al.Error compensation based on BP neural network for airborne laser ranging[J].Optik,2016,127(8):4083-4088.
[4]赵文刚,刘晓群,宋雯,等.基于PSO-BP神经网络的西洞庭湖南咀站径流预测[J].人民长江,2019,50(3):124-130.
[5]班福忱,吴丹,黑月明.基于自适应过滤与BP神经网络的城市时用水量组合预测模型[J].给水排水,2017,53(11):107-111.
[6]Dong J H,Wang G Y,Yan H Y,et al.A survey of smart water quality monitoring system[J].Environmental Science and Pollution Research,2015,22(7):4893-4906.
[7]Kulkarni P,Farnham T.Smart city wireless connectivity considerations and cost analysis:Lessons learnt from smart water case studies[J].Ieee Access,2016,(4):660-672.
[8]Rumelhart D E,Hinton G E,Williams R J.Learning representations by back-propagating errors[J].Nature,1986,323(6088):533-536.
[9]Xu Z X,Yin H L,Li H Z.Quantification of non-stormwater flow entries into storm drains using a water balance approach[J].Science of the Total Environment,2014,487(15),381-388.
[10]崔东文.多隐层BP神经网络模型在径流预测中的应用[J].水文,2013,33(1):68-73.