基于GA-SVM的基坑施工地面沉降时间序列预测研究
0 引言
地下工程和基坑施工导致的地面沉降对基坑施工的安全影响程度日益突出, 尤其是随着我国地下交通工程的快速发展, 基坑稳定性的预测变得尤其重要。地面沉降是基坑稳定性和施工安全的重要因素之一, 不仅会产生基坑坍塌的风险而且会引起周围建筑物沉降和裂缝。基坑施工的地面沉降数据具有非线性特征, 而且地下工程的施工稳定性和数据的监测比地上工程难度系数大, 因此人们对地面沉降数据预测的关注度显著增加。
地面沉降监测数据宏观地反映了内部复杂力学机制, 蕴含了系统内部力学演化的信息, 因此期望能从中找出演化规律, 利用已知的观测数据来预测未来的发展动态, 进而反馈于原设计, 及时调整施工方案或采取相应处理措施[1]。随着城市化步伐的加快, 基坑工程向着更大、更深、更复杂的结构发展, 基坑工程建设的安全形势越来越严峻, 人工智能算法被广泛用来预测基坑地面沉降, 逐渐代替经验公式算法和力学分析方法等传统方法[2]。神经网络算法 (BP) [3,4]经常被应用于地面沉降的预测, 但神经网络算法存在一定的局限性。例如, 容易形成局部极小而得不到全局最优, 训练次数多, 学习效率低, 收敛速度慢等缺点, 使得该算法的发展有一定的局限性。
Vapnik首先提出了支持向量机 (SVM) [5]应用与分类和回归预测, 在模式分类问题上支持向量机能够提供好的泛化性能, 这是支持向量机特有的功能。支持向量机有通用性、鲁棒性、有效性等特点, 在解决实际问题的分类和回归预测方面属于最好的方法之一。遗传算法 (GA) [6,7]是由美国密歇根大学的Holland教授提出的一种仿生类算法, 模拟自然界生物进化过程与机制来优化问题的一类自组织、自适应概率搜索算法, 被广泛应用于支持向量机参数寻优。本文采用三次样条插值法对数据进行预处理, 并用GA算法进行SVM参数寻优, 建立GA-SVM预测模型对基坑地面沉降数据进行时间序列预测。
1 基坑地面沉降预测[8]
基坑工程不仅是一门实践性很强而且是一门综合性很强的学科, 基坑工程具有风险大、安全储备小的特点。本文以广州某地铁深基坑为工程背景, 对基坑地面沉降数据进行研究, 建立智能优化预测模型GA-SVM对地面沉降数据进行预测, 确保在基坑施工过程中项目施工人员可以有效掌握地面沉降量的变化趋势, 避免传统模式上信息反馈的滞后性, 降低或规避由于施工作业导致风险发生的概率。
地面沉降监测时间序列预测属于小样本预测, GA-SVM模型完全是在MATLAB环境下进行的, 基本流程如图1所示。
2 GA-SVM时间序列预测模型
2.1 SVM方法理论
SVM是基于统计学理论发展而来的, 是一种机器学习方法, 釆用结构风险最小化准则。该法主要用于模式识别和函数拟合, 适合小样本的学习问题[9]。SVM的基本思想[10,11]是通过定义核函数将非线性输入空间变换到一个高维空间, 并构造最优超平面, 即对于给定的样本集 (xi, yi) , i=1, 2, 3, …, l, xi∈Rn, yi∈R, 通过非线性变换ф (x) 把低维度空间中的非线性数据表达成高维度空间中的线性数据, 其非线性回归方程是:

通过 (2) 式进行最小化求解式 (1) 中的函数的复杂度w和偏置量b。

式中:C称为惩罚因子;ε为损失函数。综合考虑拟合误差, 引入松弛变量ξi, ξj·使优化目标如下所示:

为了求解 (3) 的最优解, 引入拉格朗日函数, 将其转变为对偶问题, 求Lagrange因子ai, ai*的最大目标函数:

最终得到的回归函数为:

式 (5) 中k (xi, x) =φ (xi) φ (xj) 是SVM的核函数。SVM常用的核函数有3类, 分别是多项式核函数、径向基核函数 (RBF) 、Sigmoid核函数。本文用RBF核函数:

2.2 GA算法理论
本文采用GA遗传算法[12]对支持向量预测模型的参数进行寻优, GA遗传算法是最成功的一种群智能计算机应用算法, 借鉴生物“适者生存, 优胜劣汰”的进化规律提出的一种仿生类算法, 其基本思想是首先根据待求解优化问题的目标函数构造一个适应度函数, 并按照一定的规则生成经过基因编码的初始群体, 并进行评价、交叉和变异、选择等操作, 最后获得最适应环境的群体作为问题的最优解, 是一种有效的全局寻优方法。GA寻优的主要步骤[13]如下。
1) 初始化随机产生初始群种P={x1, x2, x3, …, xn}, 对每个个体进行编码得到对应的初始编码, 并对初始编码优化。
2) 适应值计算对于个体xi (i=1, 2, 3, …, n) 适应环境的能力高低是由指定的适应度函数评价的。问题不同, 构造适应度函数的方式不同, 通常用目标函数作为适应度函数对函数进行优化。
3) 选择选择适应度高的M个个体作为重新繁殖下一代的新的群体。这一过程体现了达尔文的“适者生存”原则。
4) 遗传操作已给定的杂交概率Pc对M个个体中的任意2个个体进行交叉运算, 重复此操作直达所有的个体杂交完成。以原设定的概率变异Pc在M个个体中选择若干个体进行变异运算, 提高个体的进一步搜索能力。
5) 停止条件的检验算法若满足条件, 停止运算, 解码得到最优解。若不满足条件, 转到2) 重新迭代。最终到达或接近最优解。
2.3 GA-SVM理论
支持向量机是基于核函数学习的算法, SVM的核函数有3类, 核函数将非线性不可分样本转换到线性可分的特征空间, 选择不同的核函数意味着产生不同的分类超平面, 核函数选取使SVM预测结果产生较大差异, 核函数的参数g选取对SVM的性能有直接影响[14,15]。惩罚参数C代表了模型的复杂度和逼近错误的折中, 影响模型的拟合度和泛化能力。针对SVM参数选择上的不足, 本文利用遗传算法的简单通用、鲁棒性强、高效全局寻优的优点[16], 对SVM的参数C和g进行寻优, 提高SVM的预测准确率。本文集合广州某地铁深基坑地面沉降的实际情况, 建立基于GA优化SVM参数的时间序列预测模型。具体流程如图2所示。
3 工程实例分析
利用建立的GA-SVM对广州某地铁车站基坑地面沉降进行预测分析, 车站主体为地下3层混凝土箱形框架结构, 车站基坑总长163.8m, 标准段基坑深24.2m, 宽17.5m, 端头井基坑深25.20m, 宽21m。地铁站位两边建筑物密集, 周边有成熟的住宅小区, 周边房屋结构以多层框架为主, 最近处距离基坑不足3m。车站地貌属珠江三角洲冲积平原河流冲积阶地, 场地地下水位埋深0.7~2.6m (标高4.790~6.910m) , 稳定水位埋深1.6~3m (标高2.410~6.000m) , 本站场地处于珠江南岸附近, 距江边500~600m。为确保基坑施工的顺利进行和周边建筑物的安全, 在基坑施工过程中对基坑周围的地面沉降进行了实时监测。
基坑地面沉降的监测点有84个, 本文选取了其中60个监测点的部分数据进行预测分析。首先, 由于基坑地面沉降的60个测试点的数据并非等时间间隔进行监测记录, 因此对每个监测点的监测数据进行三次样条插值, 以2d为间距进行插值, 生成新的时间序列。基坑地面沉降某2个监测点的原始数据和插值数据曲线如图3所示。通过三次样条对基坑地面沉降的监测数据进行插值, 使得基坑地面沉降的监测数据具有相等的时间间隔, 有利于提高支持向量机预测的准确性。
60个监测点插值后的数据以第1~60个监测点最后1天的 (每个监测点的第195个) 监测数据为训练集标签, 以第1~60个监测点的前194个监测数据为训练集, 把最后1天的监测数据视为未知数据, 利用建立的GA-SVM模型进行预测, 把预测值和实际值进行对比, 用来检验模型的准确性。首先插值后的数据利用函数mapminmax进行归一化, 经过了100次的迭代得到最佳适应度值, 如图4所示。
由图4可知, 模型GA-SVM最佳惩罚参数c=5.051, 核函数参数g的最佳值g=5.115 5, 训练集的均方差MSE=0.057 344。利用最佳参数c和g对SVM进行训练, 然后对数据进行回归预测, 图5是原始数据和回归预测数据的对比图像, 可以看出GA-SVM可以较好地拟合训练数据, 相关系数R=99.932 1%, 此时最小均方差MSE=0.000 098 7, 表明预测值和实际值一致性较高。
图6和图7是地面沉降的原始数据和回归预测的误差图和相对误差图。原始数据的误差量主要分布在-0.2~0.2mm, 相对误差量主要分布在-0.1~0.1mm, 表明预测精度较高, GA-SVM在基坑地面沉降的预测有较高的精确度和可信度。
表1是不同预测模型对基坑地面沉降的预测效果。从表1中可以看到GA-SVM的均方差最小, 相关系数最大, 其预测结果最为理想。GA-SVM预测模型相对于SVM来说, 避免了随机选择参数或凭借经验选择参数。反映出GA-SVM时间序列预测模型在基坑地面沉降的预测适用性更强。
4 结语
GA-SVM模型对地铁站基坑的地面沉降的时间序列预测有很强的优越性, 其预测精度达到了99.932 1%, 准确的预测值可以科学地指导基坑的信息化施工。GA-SVM模型相对于SVM提高了模型的收敛速度和预测效果, 其预测效果更加接近基坑地面沉降的监测值。根据对预测值的分析, 可以及时掌握基坑地面沉降情况的稳定性, 以便于提前采取相应措施, 保证深基坑的安全施工。GA-SVM模型对基坑的地面沉降时间序列预测以及类似的工程应用具有较高的应用价值和借鉴意义。
[2]黄茂松, 王卫东, 郑刚.软土地下工程与深基坑研究进展[J].土木工程学报, 2012, 45 (6) :146-161.
[3]黄丽.BP神经网络算法改进及应用研究[D].重庆:重庆师范大学, 2008.
[4] 王小川, 史峰, 郁磊, 等.MATLAB神经网络43个案例分析[M].北京:北京航空航天大学出版社, 2013.
[5]Cortes C, Vapnik V.Support-vector networks[J].Machine learning, 1995, 20 (3) :273-297.
[6]葛继科, 邱玉辉, 吴春明, 等.遗传算法研究综述[J].计算机应用研究, 2008, 25 (10) :2911-2916.
[7]HOLLAND J H.Adaptation in natural and artificial systems::an introductory analysis with applications to biology, control, and artificial intelligence[M].2nd ed.Cambridge:MIT press, 1992.
[8] 刘国彬, 王卫东.基坑工程手册[M].2版.北京:中国建筑工业出版社, 2013.
[9]何婷婷.基于支持向量机的边坡可靠性分析[D].杭州:浙江大学, 2014.
[10]刘希亮, 赵学胜, 陆丰, 等.基于GA-SVM的露天矿抛掷爆破抛掷率预测[J].煤炭学报, 2012, 37 (12) :1999-2005.
[11]WU C H, HO Janming, Lee D T.Travel-time prediction with support vector regression[J].IEEE trans on intelligent transportation systems, 2004, 5 (4) :276-281.
[12]梁旭, 黄明, 宁涛, 等.现代智能优化混合算法及其应用[M].2版.北京:电子工业出版社, 2014.
[13] 汤河宗, 杨静宇.群智能优化方法及应用[M].北京:科学出版社, 2015.
[14]刘爱国, 薛云涛, 胡江鹭, 等.基于GA优化SVM的风电功率的超短期预测[J].电力信息系统与控制, 2015, 43 (22) :90-95.
[15]Fernandez M, Caballero J, Fernandez L, et al.Genetic algorithm op-timization in drug design QSAR:bayesian-regularized genetic neuralnetworks (BRGNN) and genetic algorithm optimized support vec-tors machines (GA-SVM) [J].Mol divers, 2011 (15) :269-289.
[16]刘春芬.基于GA的SVM网络威胁频率预测方法[D].长沙:国防科学技术大学, 2006.