极限学习机在供水管网爆管定位中的应用研究
0 引言
供水管网中的爆管事故是水资源流失的重要原因,据统计,2017年我国漏水量高达78.5亿m3
目前,爆管预警的方法主要分为两种,其一是根据管材、管径、管龄等管道特性及荷载、埋深等环境因素,结合已有经验,建立爆管预警模型
近年来,极限学习机(Extreme Learning Machine,ELM)作为一种新型单隐含层前馈神经网络算法,引发了诸多关注。极限学习的概念由黄广斌等
1 爆管事故的模拟
由于极限学习机需要大量数据进行训练,而供水管网爆管的历史数据往往数量匮乏、较难获得,因此采用节点流量倍数法,通过软件模拟爆管事故得到所需数据。该法是将爆管点定义在管网节点上,在管网正常运行的工况下,各节点的需水量为正常用水量;当发生爆管事故时,将爆管流量以新增用水量的形式,添加到爆管管段所连的节点需水量上,取特定的倍数系数,来表示爆管流量的大小。在无需改变管网的拓扑结构的情况下,通过编程实现爆管工况的自动模拟。
2 应用极限学习机的爆管定位方法
2.1 极限学习机原理
极限学习机是一类新型单隐含层前馈神经网络算法,由输入层、隐含层和输出层构成,每一层都包含若干个神经元。
单隐层神经网络学习的目标是使得输出的误差最小,因此要最小化损失函数。若以xi代表训练数据样本,yi代表样本类别,n代表训练样本总数量,则对于给定的任意样本数据集X={<xi,yi>|i=1,2,3,…,n},极限学习机的数学模型见式(1)

其中,g(*)为激活函数,W、β分别表示表示输入层与隐含层的连接矩阵,及隐含层与输出层的连接矩阵,具体如式(2)所示。bi为输入层与隐含层的偏置,Yi为期望输出。

其中n,k,m分别表示输入层、隐含层和输出层的神经元个数。
在经典的梯度下降算法中,迭代过程需调整所有的参数,求解的速度较慢。而极限学习机算法只需要随机选定输入权重w和隐含层的偏置b,通过矩阵求解,就可以确定隐含层的输出权重矩阵β,且该解是唯一的。训练极限学习机神经网络的过程可转化为求解一个线性系统,其输出权重β计算公式如式(3)所示:

其中,g(XW+b)'为矩阵g(XW+b)的广义Moore-Penrose逆矩阵。
2.2 爆管特征值的确定
爆管的发生是流量突变的过程,其直接的变量参数即为流量,同时,爆管点的流量骤增,会引发管段压力的变化。管网压力值的监测较流量更便捷,成本更低,可作为爆管特征值的基础变量。在管网的n个节点中,在k节点处发生爆管事故,对管网各节点水压产生不同的影响,将被考察节点i的水压变化值记为ΔHi,其中爆管节点k自身的水压变化值ΔHk最大。将各点压力变化值按式(4)进行标准化处理,得到流量的单一变量Xik作为爆管特征值,其物理意义为:受k节点爆管引起的流量变化影响,在k节点处产生单位水压变化时,i节点水压的变化值。

式中Xik———爆管节点k对压力监测点i的影响系数(爆管特征值);
ΔHi———压力监测点i的水压变化值;
ΔHk———爆管节点k的水压变化值。
2.3 爆管定位的极限学习机模型
爆管定位的极限学习机模型示意情况如图1所示,输入层的每个神经元代表一个压力监测点,每个压力监测点在一个爆管工况下的爆管特征值Xik组成一组输入参数,导入输入层用于训练。同时,设定输出层最终导出该工况编号,以爆管节点编号作为工况编号,因此输出层神经元个数为1。隐含层作为中间层,其神经元个数与输入层和输出层神经元个数有关。
常见的隐含层的激活函数(又称激励函数)为tanh函数、ReL函数和Sigmoid函数等。相比前两者,Sigmoid函数的泛化能力更强,同时输出范围有限,数据在传递的过程中不容易发散,函数也更易于求导。其数学形式见式(5):

尽管当输入值远离坐标原点时,函数梯度变得很小,几乎接近于零,会出现梯度饱和问题,对于存在反向传播过程的神经网络的微分链式法则计算有较大影响,不利于其权重的优化。但极限学习机算法的神经网络仅单向传播,避免了梯度饱和的不利影响,因此Sigmoid函数为此情况下激活函数的最佳选择。
利用MATLAB编程以便完成计算,爆管定位的极限学习机算法程序框图如图2所示。
3 实例分析
选用某市工业园区供水管网的一个片区,探究极限学习机爆管定位模型的应用效果。管网片区规模约3.95km2,共有111个节点,148根管段。管道管径在DN300~1 000,以DN300的管段为主。管材多为球墨铸铁;管龄在10~25年。借助模糊聚类法设置3个、6个、10个三种不同的监测点梯度以探究模型最佳监测点密度,见图3。
3.1 爆管工况的模拟
3.1.1 爆管流量梯度的选择
爆管流量的主要影响因素为管径和爆管点压力。由于管网管径跨度较大,相比根据常见爆管流量公式计算具体的爆管流量梯度,以节点用水量的系数作为其数值梯度更为合理,即在节点高日高时用水量的基础上乘以一定系数作为该点的爆管流量。考虑管网实际情况,取2、3、5、8、10共5个系数梯度进行后续计算。
3.1.2 爆管时间点的选择
根据管网的用水量时间变化曲线图,选择5个代表性时间点的管网工况用于模拟,分别为:3:00(用水低谷),7:00(用水早高峰),10:00(用水均值),15:00(用水低谷),21:00(用水晚高峰)。
3.2 极限学习机结构
输入层神经元个数为监测点个数,各个压力监测点在不同爆管工况下的爆管特征值即为输入参数。输出层输出唯一的工况编号(爆管节点编号),以定位爆管位置,故输出层神经元个数为1。参考常见前向三层神经网络结构的已有研究,结合极限学习机模型实际试验发现,中间隐含层神经元个数为30时定位效果较好。故图3中三种监测点布置时极限学习机的神经网络的拓扑结构为3/6/10×30×1。
3.3 结果分析
3.3.1 爆管预警定位精度的确定
管网中的每个节点具有唯一的编号,因此节点编号背后蕴含着地理位置的信息。极限学习机模型完成训练后,爆管预测时通过输出编号锁定定位爆管点的位置,再与实际爆管点比较,即为检验模型精确程度的过程。若定位点与爆管点位置重合,即视为精准预测;若定位点与爆管点位置不重合,则需计算二者间最短水流路径。为进一步判定模型定位误差是否合理,需设定相应管网的极限误差距离,作为判定是否定位超限的依据。
为寻找合理的定位误差范围,对爆管事故的极限响应范围进行估算。爆管事故发生后流量增大,从而引起管道水头损失的增加,水压随即产生变化。在合理的影响范围内,压力监测点所监测到的水压变化值ΔH与爆管事故在该监测点造成水头损失相同。由模糊聚类法选出的压力监测点在相应聚类分组的节点中灵敏度最高,对压力波动的响应程度最大,因此,借助监测点的压力数据计算极限误差距离。爆管前后压力监测点压力差可由海森-威廉公式推出,见式(6):

式中ΔH———爆管前后压力监测点压力差,m;
q0———爆管前节点流量,m3/s;
q1———爆管后节点流量,m3/s;
Ch———管道粗糙系数;
D———管径,m;
L———爆管点与监测点间的管道长度,m。
当节点流量水平、管径与管道粗糙系数相同的情况下,爆管点与压力监测点相邻时,爆管造成的监测点压力变化值最大。因此,将监测点受相邻节点爆管产生的爆管前后压力差ΔHmax作为已知极大值,与相邻节点爆管前后的流量一同作为已知量,带入式(6),反求出该爆管工况下,监测点对爆管事故有所响应的最远距离。一旦模型定位的爆管点与实际爆管点间的距离超过最远响应距离,说明模型未能识别该次爆管产生的压力波动,爆管点定位不成功。
因此,定义监测点对爆管事故的最远响应距离即为爆管定位模型的极限误差距离L0。当模型预测节点与爆管节点之间的最短通水路径大于L0时,即认为该次爆管定位距离超限。
考虑实际管网复杂程度,在压力监测点个数为10的布设情况下(见图3),计算极限距离,以获得更多的参考数据。同时,设定爆管流量系数为10,管网工况为21:00(用水晚高峰)。所选爆管点的流量从0.58~9.93m3/h不等,已覆盖管网大多数节点的流量水平。将管网各参数值带入式(6),其计算结果如表1所示。
计算得极限误差距离L0均值为482.6m,取整为500m,即当定位爆管点与实际爆管点水流路径大于500m时视为定位距离超限。
3.3.2 爆管预警定位结果
图3所示管网片区共111个节点,结合不同的爆管流量梯度及爆管时间,其爆管工况数为111×5×5=2 775(组)。在模拟得到的2 775组爆管参数中,程序随机选择2 750组数据用于极限学习机训练和建模,余下25组数据作为测试集,得到爆管预测结果后,按3.3.1所述方法计算、检验模型精度。为考察模型的稳定性,可利用程序在每次测试完成后将数据打乱,不断重复上述“抽选-训练-定位-检验”的过程。本研究共完成50余次爆管预警模拟计算,表2为随机抽取其中10次结果。综合多组预测结果,发现模型稳定性良好,数次预测精度相差较小。
3.3.3 爆管定位精度和压力监测点布置的关系
根据表2,以精准定位次数与总爆管测试次数的比值表示定位准确率,得到3种压力监测点密度下该片区管网的平均预测定位精度,如表3所示。
表3 压力监测点密度与定位精度关系
Tab.3 Relation between density of pressure monitoring points and positioning accuracy

表3显示,随着片区压力监测点数量的增加,定位精度有明显升高。当单个监测点平均服务面积为1.32km2时,平均精准定位精度为36.0%,而当其服务面积缩减至0.66km2及0.40km2时,定位精度进一步大幅提升,可有效减少自来水资源的流失。
同时,为探究压力监测点布设位置与模型定位精度的关系,此处以爆管点分布较均匀的第5组爆管定位结果举例,如图4所示。
分析图4可知,爆管点附近是否有压力监测点对定位的准确性有着显著影响。当监测点数量增至6个时,管网东北部监测点密集程度增加,该区域定位距离超限的爆管点由4个降至2个,整体准确性提升;当监测点数量增至10个时,管网西南部的监测点也得到补充,该区域原有定位距离超限的3个爆管点均能被准确定位。这表明在考虑监测点敏感性的同时,其布设应尽量均匀,才能有效消除爆管监测盲区。
3.3.4 爆管定位精度和爆管管径的关系
基于10组爆管定位结果,对不同爆管位置的管径与其爆管预测精度进行了统计,其结果如表4所示。随着爆管管道的管径增大,平均预测精度也随之增大。究其原理,由于管道的管径越大,其相连节点的用水量越大,在同样的工况下,爆管事故的强度也随之升高,受其影响而产生的压力变化更易被压力监测点所识别。应用极限学习机爆管定位模型的预测结果验证了这一规律,从侧面证明了该模型具有一定的准确性和应用价值。
3.3.5 爆管定位距离超限的原因分析
针对定位距离超限的爆管节点,分析发现其原因主要分为三类,仍以爆管点分布较均匀的第5组爆管定位结果为例,如图5所示。
第一类原因为距离监测点过远。这一点在前文压力监测点布设对预测精度的影响分析中已有提及,图5中以蓝色圈出的管网东北部的爆管点225、290,及西南部的爆管点185、231、240,都是因距离压力监测点的距离随监测点的增设而缩小,从而缩小了定位误差或被精准定位的典型例子。
第二类原因为爆管节点流量较小,同时监测点周围存在流量较大的节点。以图5中橙色圈出的管网北部的爆管点260、257、271和管网西部的爆管点189为例,分析高日高时工况下这类爆管点四周的节点流量情况,如图6所示。当爆管点四周其他节点流量最大可达爆管点流量的10倍以上时,爆管所带来的水量变化几乎无法对监测点压力造成影响,特别是爆管程度较小(即爆管流量系数取值较小)时,所得的爆管特征值为0。而且,这一类爆管节点的定位随机性很强,没有明确的定位规律。如爆管点271在图5的三次模型预测中预测点位置均不相同,在监测点个数为10个时甚至出现定位超限。因此,尽管爆管点距压力监测点较近,极限学习机依然无法识别其特性,最终导致定位失准。
第三类原因为爆管节点的爆管特征值与其他节点相似。图5中以粉色圈出的管网西北部爆管点250为例,该爆管点水量与周围节点相似,距测压点距离较近,但依然出现定位距离超限的情况。总结其规律,最可能的原因为该点爆管的特异性不强,即该点在A工况下的爆管特征值可能与其他较远节点在B工况下的爆管特征值极为相似,导致极限学习机定位模型误判。
综上可知,极限学习机爆管定位模型的定位精度不是由爆管点流量单一影响的,其影响因素较为综合,是更客观、更适用于实际管网的爆管预警模型,能较好地应对实际管网中的复杂情况。此外,针对爆管节点流量较小和爆管特异性不强的两类节点,应在权衡定位该点的重要性与经济性后,考虑以在附近进一步增设压力监测点或加强人工检查频率的方式,加强管网运行的安全性。
4 结语
(1)针对给水管网爆管预警问题,定义了爆管特征值作为基础变量,结合不同的管网运行工况和爆管程度对爆管事故进行了模拟,以得到充足的爆管数据。利用极限学习机算法完成了爆管定位模型的构建,并结合管网实例,探究了该算法的适用度及定位精度。结果表明,模型具有较好的定位效果,可应对实际管网的复杂情况,考虑其学习速度快、泛化性能高、人为干预少的优势,该模型在爆管预警方面具有较好的应用前景。
(2)爆管定位精度受压力监测点的布置、爆管管径、爆管节点的流量及其爆管特异性的综合影响。理论上爆管预警精度主要与爆管特异性有关,即节点的一组爆管特征值独特性强时,即便爆管流量较小,依然可以被精准定位。因此针对爆管造成的压力变化弱这一问题,应注重提高压力监测点的密度并保证其合理均匀分布,从而获得足够数量的爆管特征值,提高节点爆管特异性,不仅有效消除爆管监测盲区,更提升爆管定位精度。
(3)爆管事故具有突发性强且发生频率低的特点,这使得事故前后监测数据极难获取,成为利用计算机学习方法进行爆管定位的一大难题。因此,本文采用模拟管网进行爆管定位的理论研究,以满足极限学习机训练所需数据量并分析关键的定位精度影响要素。若将爆管定位模型用于实际管网,仍需结合监测数据的准确性、干扰因素的甄别等实际问题,对模型进行修正与优化。再则,本文提出的爆管定位方法是基于SCADA监测数据,故监测数据的准确、监测仪表的高精度是模型正常发挥作用的必要条件。未来管网压力监测技术提升后,基于极限学习机的爆管定位模型必能发挥更大的作用。
[2]陈能,信昆仑,莫宇琨.基于管材分类的供水管网爆管风险预测模型[J].净水技术,2018,37(1):112-116.
[3]陶涛,颜合想,信昆仑,等.基于SCADA压力监测的爆管定位分析[J].供水技术,2016,10(4):11-14,28.
[4]程伟平,陈梅君,许刚,等.基于SCADA数据的长距离输水管爆管定位研究[J].中国给水排水,2019,35(13):57-61.
[5]戴雄奇.供水管网重大漏损事故模拟、定位与控制技术[D].天津:天津大学,2010.
[6]曾翰,柯庆,周超,等.供水管网爆管动态风险评估[J].净水技术,2018,37(2):94-99.
[7] Huang G B,Zhu Q Y,Siew C K.Extreme learning machine:a new learning scheme of feed forward neural networks[J].2004IEEE International Joint Conference,2004,2:985-990.
[8] Huang G,Zhu Q,Siew C.Extreme learning machine:Theory and applications[J].Neurocomputing.2006,70(1-3):489-501.