基于遗传算法优化极限学习机的绿色建筑投资估算方法
为实现2020年城镇新建建筑中绿色建筑占比达到50%的目标,许多专家及学者就制约绿色建筑发展的因素进行了研究,研究发现绿色建筑建造成本是对其影响较大的制约因素。而绿色建筑投资估算作为决策阶段的主要工作对其造价成本控制具有关键作用;因此,准确进行绿色建筑投资估算对促进其发展具有重要意义。
极限学习机(Extreme Learning Machine-ELM)是一种学习速率快、泛化性能强且适用于小样本的高效预测智能算法,而我国绿色建筑的现状是已建绿色建筑样本量较小;因而,采用ELM进行绿色建筑投资估算具有先天优势。此外,考虑到ELM在处理存在少量误差的样本时会出现病态状况进而影响其网络结构的鲁棒性与稳定性;而遗传算法(Genetic Algorithm-GA)在优化非线性模型时具有不受参数数目、优化原则及模型结构等条件约束的优点。故本文在综合分析影响绿色建筑投资估算因素的基础上,采用GA对ELM的隐含层输入权值w与阈值b进行寻优,以改善模型性能和提高模型精度,构建基于GA优化ELM的绿色建筑投资估算模型,并用工程实例来验证模型的可行性,为工程实践提供参考。
1 绿色建筑投资估算特征指标的确定
工程项目显著性成本理论(Cost-significance,简称CS)是指在一项由若干造价呈显著不均匀状态分布的分项工程所组成的单项工程中,若单项工程造价的80%左右由约20%的分项工程项目承担,则这些分项工程项目被称为显著性成本项目(Cost-significance Items,简称CSIs)。因CSIs造价在工程项目总造价中所占比例较为稳定,且目前已被用于工程造价的估算,故本文采用CS理论来寻找绿色建筑的特征指标。
绿色建筑工程造价涉及土建、绿色节能技术与材料以及冷暖设备等多个领域,对经阅读文献及工程实践所收集的26个绿色建筑造价资料进行分析总结后得知绿色建筑项目的CSIs为:现浇钢筋混凝土工程、节能技术及材料与室内外环境工程。根据表1可知,以上三个CSIs的造价为总造价的78.76%,而CSIs数量为分项工程总数量的25%,符合显著性成本理论。
根据3个CSIs所涉及的专业领域,利用文献阅读、专家访谈与专家打分法对影响绿色建筑造价成本的实际因素进行分析,以获取绿色建筑的特征指标。其中,文献阅读与专家访谈的目的是分析典型绿色建筑项目案例,然后列出影响绿色建筑造价的因素清单,敲定初选清单以及就其中的各个特征指标所表征的涵义达成一致。而专家打分法则是邀请建筑、室内装饰与暖通等领域的20位专家对初选清单中的各因素以0或1进行打分(初选清单指标因素见表2)。若某个因素有60%及以上专家打分为1就保留,否则删除;按此准则进行反复打分,直至获得每位专家皆认可的特征指标表,并以此作为极限学习机(ELM)的输入向量。
为使工程特征指标既能表示绿色建筑的特点,也能有效突显绿色建筑投资额的核心参数;本文运用CS理论与专家打分法,最终筛选出了12个最能表征绿色建筑投资估算的特征指标,量化后的结果如表3所示。
2 基于GA-ELM的绿色建筑投资估算模型
2.1 极限学习机
极限学习机(ELM)作为一种新型单隐含层前馈神经网络算法,其特点是初始化输入权值w与阈值b随机给定,只需设置隐含层神经元数量即可求得唯一最优解。图1为ELM网络拓扑结构图。
如图1所示,ELM由输入层、隐含层与输出层等三个处理单元层组成,相邻单元层神经元通过突触实现全连接,同层神经元间无连接,前层输出为下层输入。现假设有N个任意各不相同的样本(xi,yi),xi与yi分别表示样本的特征输入向量与输出向量,其中xi=[xi1,xi2,…,xin]T∈Rn,yi=[yi1,yi2,…,yim]T∈Rm则前馈神经网络的输出可以表示为:
fL(x)=∑Li=1βig(wi·xi+bi),xi∈Rn,wi∈Rn,βi∈Rm(1)
其中:L表示隐含层神经元个数;g(x)表示激励函数,可为“hardlim”,“Sigmoid”,“prelu”中任意一种;wi表示输入层到隐含层第i个神经元的输入权值,wi=[wi1,wi2,…,win]T;bi为隐含层第i个神经元的阈值;βi表示隐含层第i个神经元的输出权值,βi=[βi1,βi2,…,βin]T;wi·xi为wi和xi的内积。
若训练集样本量与隐含层中神经元数量相同,将存在βi,wi和bi使得:
fL(x)=∑Li=1βig(wi·xi+bi)=yi,i=1,2,…,L(2)
式(2)可写作:
Hβ=Y(3)
因ELM算法中,隐含层输入权值w和阈值b可随机设定,则H为确定矩阵,称作ELM网络隐含层输出矩阵。隐含层输出矩阵权值β,可求解式(4)得知。

其中:H+为隐含层输出矩阵H的广义逆。
2.2 遗传算法原理
遗传算法(GA)是一种能结合自然选择机制与遗传学原理并用计算机语言进行模拟的新型计算算法模型,其主要机理是将问题的求解过程转化为遗传学中选择、交叉及变异染色体中的基因信息,最终遗传进化为最优染色体。
2.3GA优化ELM流程
如图2所示,基于GA优化ELM的流程如下。
步骤1:输入样本数据并进行归一化处理,随机选择80%作为训练样本,其余为测试样本;
步骤2:ELM网络隐含层输入权值w与阈值b随机生成,并运用十位雷格码进行编码,然后作为GA的初始种群;
步骤3:将获得的隐含层输入权值w与阈值b解码并赋予ELM,利用训练样本训练ELM网络;最后采用训练好的网络对测试样本进行预测,并计算预测值与真实值的RMSE值,即GA目标函数值;
步骤4:根据RMSE值对隐含层输入权值w与阈值b进行评价,然后利用GA进行初始种群更新,即更新隐含层输入权值w与阈值b,直至达到遗传代数后终止,获得最终群体;
步骤5:解码最终种群,即获得最优隐含层输入权值w和阈值b;
步骤6:将最优隐含层输入权值w和阈值b赋予ELM;
步骤7:使用训练样本对赋予最优隐含层输入权值w和阈值b的ELM网络进行训练,训练结束后得到基于GA优化ELM的绿色建筑投资估算模型。
3 工程实例分析
3.1 样本选取及参数设置
样本数据来源于上文所提及的26个绿色建筑项目造价资料,表4为采用最终确定的12个特征指标对其进行量化处理后的结果。随机选取80%(20个)作为训练样本,其余作为测试样本。
ELM与GA的参数设置如表5所示,ELM隐含层神经元个数设置为20,隐含层激活函数选择“Sigmoid”;考虑到本文最终目的是进行绿色建筑投资估算,因而输出层神经元个数设为1。GA种群大小设置为40,遗传代数设置为100,染色体长度设置为10,交叉概率设置为0.7,变异概率与代沟分别设置为0.01与0.95,适应度函数设置为RMSE。
3.2 数据分析
载入样本数据,随机选取训练样本,训练经GA优化后的ELM网络模型,然后对测试样本进行预测。ELM与GA-ELM的预测结果对比如图3。
从图3可以很直观地看出使用GA优化后的ELM预测结果与测试样本真实值更加贴近,预测结果曲线与真实值曲线拟合度更高,故GA可用于优化ELM,且优化后的ELM性能更优;通过计算GA优化ELM前后预测结果与测试样本真实值的相对误差及RMSE值,可以对GA的优化效果进行定量评价,相对误差及RMSE值的计算结果见表6。
由表6可知,ELM预测结果与测试样本真实值的相对误差在3%~12%之间,均方根误差(RMSE)为0.0847;而GA优化后的ELM预测结果与测试样本真实值的相对误差在0.1%~5%之间,均方根误差(RMSE)为0.0161。因此,GA优化ELM效果良好;此外,GA优化后的ELM预测结果与测试样本真实值的相对误差最大为4.70%,远小于绿色建筑决策前期投资估算误差允许值(10%)。由此可见,GA-ELM算法的性能较优,可用于绿色建筑决策前期的投资估算。
为进一步验证GA-ELM算法用于绿色建筑投资估算的优越性,同时采用BP神经网络进行绿色建筑投资估算的预测,并将两者的预测结果进行对比。BP神经网络是一种误差逆向反馈的前馈多层神经网络,其可模拟人脑神经元对数据进行并行处理与探索数据规律。运用BP神经网络进行绿色建筑投资估算时,同样使用表3中的样本数据,随机选取80%(20个)作为训练样本,其余为测试样本,BP神经网络类型为单隐含层BP神经网络;参数设置:隐含层神经元个数为9,隐含层激活函数选择“Sigmoid”,最大训练次数设为1000,训练要求精度为0.001,学习率设为0.01。BP神经网络与GA-ELM预测结果对比见图4。
通过图4可看出,GA-ELM估算模型预测结果曲线与测试集样本真实值曲线的拟合度与贴近度较BP神经网络预测结果曲线相比更优;为了对两种方法进行定量分析,计算其相对误差及相对误差平均值见表7。
由表7中的数据可得知,虽然BP神经网络在投资估算误差方面满足决策前期投资估算的误差允许值,但其相对误差值主要分布在5%~10%之间;而使用GA-ELM时的相对误差则在0%~5%之间,且GA-ELM的相对误差平均值相对BP神经网络的相对误差平均值而言降低了77%。
综上所述,GA-ELM用于绿色建筑投资估算切实可行,且投资估算精度与模型性能皆优于其他投资估算方法。
4 结 语
采用基于GA优化的ELM模型进行绿色建筑投资估算的预测时,得到如下结论。
1)绿色建筑投资估算的影响指标多且复杂,本文将“显著性成本理论”与ELM原理相结合用于绿色建筑的投资估算是一种新的尝试;并且采用GA对ELM的隐含层输入权值与阈值进行寻优,优化后的ELM模型结构稳定且性能优,更适用于绿色建筑投资估算。
2)工程实例分析结果表明,GA优化后的ELM模型用于绿色建筑投资估算相对误差在5%以内,符合决策前期的投资估算误差要求(10%);此外,与BP神经网络估算模型相比,其相对误差平均值比BP神经网络降低了77%,误差范围更小,说明GA优化的ELM模型估算精度更高。
3)本研究采用专家打分法对特征指标进行筛选,该方法模糊性与主观性较强容易对评价指标的科学与客观性产生影响;因此,特征指标的筛选方法需进一步研究与完善。
4)运用数学方法建立模型进行投资估算,需要一定数量的类似已建工程充当样本予以支撑;虽然本文采用适宜小样本预测的ELM对绿色建筑投资估算的精度进行了提升;但为进一步提高绿色建筑投资估算精度,望尽快健全绿色建筑造价资料库。
[2]张飞涟,梁秀峰.基于GA-ELM的城市轨道交通工程投资估算方法研究[J].铁道科学与工程学报,2019(7):1842-1848.
[3]晁晖,周晓熙.工程项目设计中的可靠度-成本优化模型[J].技术经济,2016(1):88-91.
[4]胡庆国,蔡璧蔓,何忠明,等.基于BP神经网络的装配式建筑投资估算[J].长沙理工大学学报(自然科学版),2018(4):66-72.
[5]陈祥芳.建筑安装工程造价预算控制要点及其把握措施分析[J].建材与装饰,2019(25):160-161.
[6]翟博文,陈辉林,马丽丽.绿色建筑增量成本可视化设计与应用研究[J].建筑经济,2019(4):87-92.
[7]牛春媛.应用显著性成本法建立保障性住房项目投资预测模型的实证研究[J].黑龙江科技信息,2013(24):35-36.
[8] 中国建筑科学研究院有限公司,上海市建筑科学研究院(集团)有限公司.绿色建筑评价标准:GB/T 50378-2019[S].北京:中国建筑工业出版社,2019.
[9]李晨,杨俊安,刘辉.基于信息熵和GA-ELM的调制识别算法[J].系统工程与电子技术,2019(23):21-30.
[10]王新环,刘志超.一种基于遗传算法的极限学习机改进算法研究[J].软件导刊,2017(9):79-82.
[11]李万庆,陈佳琪,孟文清,等.基于BSA-ELM模型的建筑工程施工成本预测研究[J].数学的实践与认识,2019(23):10-17.