NSGAⅡ算法的参数取值对供水管网多目标优化设计的影响
王礼炳 王琦 王志红 熊柳 周中健
广东工业大学土木与交通工程学院
第二代非支配排序遗传算法 (NSGA-Ⅱ) 被广泛应用于供水管网优化设计, 但在NSGA-Ⅱ算法的参数取值对优化效果的影响方面缺乏深入研究。基于此, 以2个大型供水系统的多目标设计为例, 系统研究NSGA-Ⅱ算法中的4个关键参数 (交叉概率、变异概率、交叉分布指数和变异分布指数) 对算法搜索性能的影响。结果表明:交叉和变异分布指数对NSGA-Ⅱ的性能有显著影响, 2个参数中必须至少有一个保持较小值, 才能使NSGA-Ⅱ发挥出较满意的搜索性能;相反, 交叉和变异概率在以推荐值为中心的较大邻域范围内对算法搜索性能没有显著影响。
作者简介: *王琦E-mail:wangqiguangzhou@163.com;
收稿日期:2018-05-31
Influence of parameter values in NSGA-II algorithm on multi-objective optimization design of water supply networ k
Wang Libing Wang Qi Wang Zhihong
Received: 2018-05-31
0 前言
城市供水系统是由相互联系的一系列构筑物和供水管网组成
第二代非支配排序遗传算法 (NSGA-Ⅱ) 是供水管网优化领域一种常用的优化算法, 由Deb和Srinivas在2002年提出
NSGA-Ⅱ算法有6个参数, 分别是种群大小 (Population Size, PS) , 进化代数N, 交叉概率pc, 变异概率pm, 交叉分布指数ηc, 变异分布指数ηm。种群大小和进化代数共同决定了目标函数的评价次数, 在一定范围内, 目标函数评价次数越多, 算法的收敛性越好, 但优化时间也随之增加。pc和pm控制着种群进化过程中发生交叉或变异操作的概率。ηc和ηm控制着种群发生交叉和变异时子代个体与父代个体的距离。ηc和ηm可以取任意非负实数, 取较大值时产生的子代个体将以较大概率分布在距离父代较近的位置;反之, 取较小值时子代个体更有可能位于距离父代个体较远的位置
基于此, 本文旨在通过对NSGA-Ⅱ关键参数的系统测试与分析, 发现潜在的影响规律并提出通用的参数设置原则。
1 供水管网多目标优化数学模型
1.1 目标函数
分别以最小化铺设管道的总费用Ctotal和最小化节点不足水头总和Hd为两个目标函数, 见式 (1) 和式 (2) :
式中N——管网管道数, 根;
Ci ——更换管道的直径对应的单位管长花费, EUR/m;
Li ——第i根管道长度, m;
M ——管网节点数, 个;
Hmin ——管网节点所需的最小水压, mH2O;
Hj ——第j个节点的实际水压, mH2O。
1.2 决策变量和约束条件
决策变量为管网中每根管道的管径。供水管网优化必须满足节点连续方程, 管网能量平衡方程, 管段压降方程, 节点水头约束条件及可选标准管径条件。各约束条件表达式见式 (3) ~式 (7) :
节点连续性方程:
能量方程:
管段压降方程:
节点水头约束条件:
可选标准管径约束条件:
式中A——衔接矩阵 (联系矩阵) ;
Q ——管网系统中的节点流量, m3/s;
q ——管网系统中的管段流量, m3/s;
L ——回路矩阵;
h ——管网系统中的管段水头损失, mH2O;
s ——管网系统中的管段摩阻;
Dk ——任意一根管道的管径大小, mm;
Dz ——可选标准管径大小, 下标z为可选标准管径总数目, mm。
2 探究参数取值对优化结果的影响
2.1 案例管网
本试验选用的案例管网为Balerma Irrigation Network (BIN)
2.2 试验设计
试验主要分为两个部分, 第一部分探究交叉和变异分布指数对NSGA-Ⅱ算法优化性能的影响, 第二部分探究交叉和变异概率对优化性能的影响。试验流程如图2所示。
第一部分的试验固定交叉和变异概率, 观测NSGA-Ⅱ的收敛性对交叉和变异分布指数取值的敏感程度。交叉和变异概率取文献中的推荐值[3], 即pc=0.9, pm=1/454=0.002 2 (454为案例管网的决策变量[9]) 。理论上, 分布指数可以取任意非负实数[4], 但是过小或过大都不利于算法收敛, 根据相关研究中广泛采用的取值范围, 将交叉和变异分布指数的范围设为[1 100], 进而确定一系列不同组合, 得到在推荐的交叉和变异概率下NSGA-Ⅱ优化性能最优的分布指数组合。
第二部分试验固定交叉和变异分布指数 (即第一部分试验找到的最优组合) , 进行一系列单因素敏感性分析。具体来说, 先固定pc=0.9, 观察不同的pm对NSGA-Ⅱ收敛性的影响, 找到最优的pm后, 再固定变异概率值, 观测不同的pc对NSGA-Ⅱ收敛性的影响。
上述试验都在C语言环境下完成编译;涉及水力计算的部分通过调用EPANET2的动态链接库实现
在种群进化的初始阶段, 算法找到的管径的解集很可能会使管网部分节点存在负压, 这时种群还没有跳出非可行域。一般算法在进化足够大的情况下都能跳出非可行域。然而, 当算法的参数设置不尽合理时, 即使进化相当长的时间也有可能被困在非可行域内。因此, 本试验采用3种指标评价NSGA-Ⅱ算法的优化性能:①每个参数组合下跳出非可行域的种子数 (Nseed) ;②10组随机试验中, 节点不足水头总和Hd为0时对应的铺设管道费用的 平均值Avg (CtotalHd=0) ;③Avg (CtotalHd=0) 偏离已知最优解192.14 万欧元
2.3 结果和分析
2.3.1 交叉和变异分布指数对优化结果的影响
不同交叉和变异分布指数下的结果如表1所示。表1从左往右是按f的大小升序排列, 越往前优化性能越好。可以看出, 最优的交叉和变异分布指数组合是[20 10], 在这个组合下, Avg (CtotalHd=0) 只偏离了已知最优解1.47%。最后5组只有部分种子甚至没有种子跳出非可行域, 并且f也比其他14组更大。这5组的共性是ηc和ηm两个参数的取值都偏大, 而没有一个较小的参数来提供全局搜索。相反, 其他14组全部10个种子跳出了非可行域, f也能维持在一个较小值, 除了[20 30], 其他组都有一个参数取值较小 (≤10) 。所以可以认为, 两个分布指数必须有一个值较小 (≤10) , 才能使NSGA-Ⅱ的优化性能较优, 见表1。
2.3.2 交叉和变异概率对优化性能的影响
不同变异概率下的优化结果见图3。图3显示了固定ηc=20, ηm=10, pc=0.9, 观测取不同pm时对优化结果的影响。可以看出, pm在文献推荐值0.002 2周围 (0.001~0.015) , f变化不大, 而当pm>0.02时, f明显增大了。当pm=0.01时, NSGA-Ⅱ优化性能最好, Avg (CtotalHd=0) 只偏离了已知最优解的1.20%。
不同交叉概率下的优化结果见图4。图4显示了固定ηc=20, ηm=10, pm=0.01, 观测取不同pc时对优化结果的影响。可以看出, pc=0.75是NSGA-Ⅱ优化性能优劣的分界线, pc 在0.75~0.95算法优化性要优于其在0.45~0.7;并且, 在pc处于0.75~0.95范围内, f虽然有起伏, 但变化不大, 说明在pc在该范围内, 对算法优化性能影响不大。当pc=0.86时, NSGA-Ⅱ优化性能最好, Avg (CtotalHd=0) 只偏离了已知最优解的1.15%。
表1 不同交叉和变异分布指数下的优化结果 (CtotalHd=0单位:万欧元) 导出到EXCEL
[ηcηm] | [20 10] | [20 1] | [50 1] | [10 1] | [100 1] | [20 5] | [80 1] | [1 20] | [30 1] |
Nseed | 10 | 10 | 10 | 10 | 10 | 10 | 10 | 10 | 10 |
Avg (CtotalHd=0) | 194.96 | 195.41 | 195.56 | 195.57 | 195.65 | 196.17 | 196.43 | 196.75 | 196.80 |
f/% | 1.47 | 1.70 | 1.78 | 1.78 | 1.82 | 2.10 | 2.23 | 2.40 | 2.43 |
[ηcηm] | [1 50] | [20 30] | [1 100] | [1 1] | [20 40] | [20 50] | [20 60] | [20 100] | [100 100] |
Nseed | 10 | 10 | 10 | 10 | 4 | 5 | 4 | 0 | 0 |
Avg (CtotalHd=0) | 196.99 | 197.35 | 197.49 | 197.63 | 198.62 | 220.44 | 248.68 | / | / |
f/% | 2.52 | 2.71 | 2.78 | 2.86 | 3.37 | 14.73 | 29.43 | / | / |
通过第二部分试验可以看出, 交叉和变异概率在文献推荐值周围较宽范围对NSGA-Ⅱ优化性能影响不大, 但在这个范围外, 算法优化性能会受到明显影响。
3 案例验证
为了验证以上基于BIN管网得出的参数设置原则, 本文又用NSGA-Ⅱ算法对英国埃克斯特市的供水管网 (EXN) 进行优化, 目标函数与BIN管网一致。EXN是由英国埃克斯特大学水系统研究中心建立的一个实际管网, 服务人口约为40万。EXN管网包含2 465根管道, 1 891个用水节点, 5个阀门以及7个水源节点, 节点所需的最小压力为15 mH2O, 管网的拓扑结构如图5所示。图中加粗的位置表示由当地工程师根据经验挑选出来的567根瓶颈管道, 也是本次优化设计时考虑的全部决策变量。EXN管网的设计任务是确定在瓶颈管道所在位置铺设平行管道的最优方案。每条管道有10种不同的管径尺寸以及不铺设平行管共11种可选方案;因此, EXN优化问题的解空间共包含11567种可能的组合方式。
本次研究中种群大小仍为100;为减小计算时间, 进化代数设为10 000, 即目标函数的总评价次数为1 000 000。同样, 为了控制初始种群对结果的影响, 每组参数组合都独立计算10次。NSGA-Ⅱ的参数取值和对应的优化结果如表2所示。参数组合1~4的交叉和变异概率都取文献中的推荐值, 但交叉和变异分布指数取不同值。由表2可知:采用文献中的推荐值 (即ηc=20, ηm=20) 并不是最优的参数组合;当ηc=20, ηm=1时NSGA-Ⅱ获得了最优的Avg (CtotalHd=0) 。进一步观察发现:参数组合1和2对应的优化结果显著超过参数组合3和4, 组合1和2中至少有一个分布指数较小, 组合3和4中两个分布指数都偏大, 这与BIN管网得到的试验结果一致。组合5和6的交叉概率分别为0.75和0.95, 其他3个参数都相同。由表2可知:两组的优化结果十分接近。同样, 组合6和7除了变异概率相差5倍, 其他3个参数保持一致, 但两组的优化结果几乎一致。上述试验说明在一定范围内交叉和变异概率对优化结果的影响微乎其微。
表2 EXN管网验证结果 (CtotalHd=0单位:百万英镑) 导出到EXCEL
参数 组合 |
pc | pm | ηc | ηm |
Avg (CtotalHd=0) |
Min (CtotalHd=0) |
1 | 0.9 | 0.0018 | 1 | 1 | 4.85 | 4.47 |
2 | 0.9 | 0.0018 | 20 | 1 | 2.02 | 1.94 |
3 | 0.9 | 0.0018 | 20 | 20 | 10.48 | 10.05 |
4 | 0.9 | 0.0018 | 20 | 30 | 10.36 | 10.03 |
5 | 0.75 | 0.001 | 20 | 10 | 10.50 | 9.84 |
6 | 0.95 | 0.001 | 20 | 10 | 10.10 | 9.22 |
7 | 0.95 | 0.005 | 20 | 10 | 10.29 | 9.19 |
4 结论
本文基于两个较大规模供水管网系统的多目标优化设计问题对NSGA-Ⅱ的4个关键参数进行敏感性分析, 系统探究了交叉概率、变异概率、交叉分布指数和变异分布指数对算法优化性能的影响, 主要结论如下:
(1) 交叉和变异分布指数对NSGA-Ⅱ的搜索性能有显著影响。分布指数取值偏大意味着NSGA-Ⅱ侧重局部搜索, 而取值偏小意味着NSGA-Ⅱ侧重全局搜索。两个参数必须至少有一个取较小值才能使NSGA-Ⅱ维持较优的搜索性能。如果没有合理设置这两个参数, 整个种群甚至无法找到可行解 (即Hd=0) 。
(2) 与分布指数相比, 交叉和变异概率对NSGA-Ⅱ的搜索性能影响较小。交叉和变异概率的取值在以文献推荐值为中心的较大邻域范围内, 对NSGA-Ⅱ的搜索性能没有显著影响。
(3) 基于本文的研究结果, 采用NSGA-Ⅱ求解管网多目标优化设计问题时, 针对4个关键参数取值的建议如下:交叉和分布指数在1~20, 交叉概率在0.75~0.95, 变异概率为文献推荐值, 即决策变量个数的倒数。
参考文献
[1] 严煦世, 范瑾初.给水工程, 第四版.北京:中国建筑工业出版社, 1999
[2] 刘书明, 李婷婷, 王晓婷, 等.自适应遗传算法在给水管网优化中的应用.给水排水, 2017, 43 (4) :107~110
[10] Rossman L A.EPANET 2Users manual.Environment Protection Agency, 2000.
[1] 严煦世, 范瑾初.给水工程, 第四版.北京:中国建筑工业出版社, 1999
[2] 刘书明, 李婷婷, 王晓婷, 等.自适应遗传算法在给水管网优化中的应用.给水排水, 2017, 43 (4) :107~110
[3] Deb K, Pratap A, Agarwal S, et al.A fast and elitist multiobjective genetic algorithm:NSGA-Ⅱ.IEEE Transactions on Evolutionary Computation, 2002, 6 (2) :182~197
[4] Deb K, Goyal M.A combined genetic adaptive search (GeneAS) for engineering design.Computer Science and Informatics, 1996, 26 (4) :30~45
[5] Wang Q, Guidolin M, Savic D, et al.Two-objective design of benchmark problems of a water distribution system via MOEAs:Towards the best-known approximation of the true pareto front.Water Resources Planning and Management, 2015, 141 (3) :04014060
[6] Zheng F F, Zecchin A C, Maier H R, et al.Comparison of the searching behavior of NSGA-Ⅱ, SAMODE, and Borg MOEAs applied to water distribution system design problems.Water Resources Planning and Management, 2016, 142 (7) :04016017
[7] Jayaram N, Srinivasan K.Performance-based optimal design and rehabilitation of water distribution networks using life cycle costing.Water Resource Research, 2008, 44 (1) :568~569
[8] Asadzadeh M, Tolson B.Hybrid pareto archived dynamically dimensioned search for multi-objective combinatorial optimization:application to water distribution network design.Journal of Hydroinformatics, 2012, 14 (1) :192~205
[9] Reca J, Martinez J.Genetic algorithms for the design of looped irrigation water distribution networks.Water Resources Research, 2006, 42 (5) :110~119
[10] Rossman L A.EPANET 2Users manual.Environment Protection Agency, 2000.
[11] Cisty M, Bajtek Z, Celar L.A two-stage evolutionary optimization approach for an irrigation system design.Journal of Hydroinformatics, 2017, 19 (1) :115~122