基于灰色关联聚类-粗糙集的民用建筑低碳环保数据指标体系构建
1 引 言
构建民用建筑低碳环保数据指标体系,为节能减排、资源治理、环境保护等关键问题提供数据服务,对于指导我国建筑领域节能环保工作具有深远意义。
目前,国内外已有与低碳环保相关的指标体系研究:一是国内外权威机构的绿色建筑评估体系。如英国绿色建筑评估体系(BREEAM)、美国绿色建筑评估体系(LEED)、中国绿色建筑评价标准等,这些绿色建筑评价指标体系涵盖“四节一环保”方面,并在项目实践中得到广泛的应用与推广。然而绿色建筑评估体系仅适用于评估单体建筑的绿色程度,难以衡量民用建筑领域总体的低碳环保水平;二是我国不同行业部门根据自身管理、运行的需求,建立了不同层次的节能环保数据指标库。如国家统计局、住房和城乡建设部、生态环境部等部门的统计数据指标。但统计数据指标由于编制的主体部门不同,缺乏系统性和整体性,且指标交叉重叠和空白的问题并存;三是已有文献提出的指标体系。如江涛等对于煤炭矿山绿色环保指标的研究、张亚暾构建的低碳交通评价指标体系。但文献研究多聚焦于矿山、交通、火电等行业的绿色环保水平,缺乏对民用建筑低碳环保数据指标的梳理。因此,构建系统合理的民用建筑低碳环保数据指体系成为亟待解决的问题。
科学合理的方法是构建指标体系的关键。在方法选择上,一是单一方法筛选指标,代表有:德尔菲专家调查法、层次分析法、主成分分析法、因子分析法等。上述单一方法存在较强的主观性,对样本的需求量较大,且忽略了指标或样本之间的信息重复性;二是多方法相结合筛选指标,一定程度上弥补单一方法的缺陷。如刘清等运用聚类分析对通航风险影响因素进行分类,并结合结构方程模型建立风险演变指标体系。
灰色关联聚类-粗糙集具有聚类分析和属性约简的优点,通过结合两种方法的优势,在保持信息分类能力的同时删除冗余属性,以达到简化知识表达的目的。近年来,该方法逐渐运用于评价指标的筛选,并取得了较好效果。鉴于此,笔者先结合理论分析和频度分析,从国内外权威机构和经典文献中初步选取低碳环保数据指标,针对指标的冗余性、数据的连续性特点,以灰色关联聚类代替粗糙集中的等价关系分类,对初选的指标进行约简筛选,并结合我国民用建筑节能减排现状对指标进行补充和完善,构建民用建筑低碳环保数据指标体系。
2 低碳环保数据指标体系构建的原理及方法
2.1 总体思路
如图1所示,民用建筑低碳环保数据指标体系的构建按指标初选-聚类约简-补充完善3个步骤进行。通过前期的调研,遵循目的性、可行性、全面性和无冗余的4大原则,从权威机构的经典高频指标、统计部门的统计数据、行业协会的年鉴报表中,初步海选能反映民用建筑全生命周期阶段低碳环保的指标;针对海选的指标,剔除无法获取的数据指标,并将收集得到的数据标准化处理,进行灰色关联聚类-粗糙集指标约简,删除影响较小的数据指标;对约简后的指标,参照标准规范和现状需求,进一步地补充与完善,得到民用建筑低碳环保数据指标。
2.2 指标筛选原则
(1)目的性原则
在大量文献资料和数据库调研的基础上,紧扣我国建筑业低碳环保的特点选取数据指标。
(2)可行性原则
指标的数据来源须结合我国民用建筑资源环境的具体实际情况,其获取渠道应是稳定可靠的,能在后续的研究过程中保质保量的获取。
(3)全面性原则
要求指标全面且具有代表性,涵盖建筑全生命周期低碳环保各方面的特性。
(4)无冗余原则
每一个数据指标都是对建筑低碳环保某个或某些方面的概括,要求具有独立性和无重复性。
2.3 指标选取基础
低碳环保数据指标应能反映我国民用建筑领域建筑碳排放和环保降耗的现状,本研究立足于建材生产、建筑建造、建筑运行、报废拆除的建筑全生命周期,从建筑碳排放、绿化治理、大气环境、污水排放、固体废弃物、声环境6个方面设置准则层。指标选取基础如下:
(1)国内外权威机构的高频指标。如英国建筑研究院环境评估方法(BREEAM),从健康舒适、废弃物管理、污染、用地和生态几个方面选取经典指标。
(2)国内行业部门及协会的调研。一方面,从行业年鉴、统计报表、部门协会统计数据中调研与低碳环保相关的数据指标,从中筛选能衡量民用建筑低碳环保的数据指标,另一方面,深入行业部门,利用问卷调查、专家座谈、实地考察等方式,确定现行数据指标的定义、边界范围、适用条件、应用需求及常见问题。
(3)现行国家、地方和行业标准规范的梳理。这些标准规范明确建筑业低碳环保指标所需要达到的一种限值水平,对所选取的数据指标具有一定的补充和参考价值。
2.4 灰色关联聚类-粗糙集理论
2.4.1 粗糙集属性约简
粗糙集是一种处理模糊和不确定性问题的方法,其优点在于只需要数据集,无需任何先验知识或信息,对不确定性的描述和处理较客观。
利用粗糙集属性约简理论进行低碳环保数据指标的约简,是将每次去掉一个指标后的灰色关联聚类结果与原始聚类结果相比较,若两次聚类结果相同,则说明该指标对于样本的分类作用不明显,是非必要的,应删除;否则,应予以保留。
2.4.2 灰色关联聚类
灰色关联聚类可替代经典粗糙集中的等价分类,将观测指标划分为若干个可定义类别,用于同类指标的归并,简化复杂的指标体系。
设有n个观测对象,每个观测对象有m个不同的特征数据,有如下的特征序列,
X1=(x1(1),x1(2),…,x1(n))
X2=(x2(1),x2(2),…,x2(n))
…
Xm=(xm(1),xm(2),…,xm(n))
对于所有的i≤j,i,j=1,2,…m,在原始矩阵标准化处理的基础之上,计算Xi与Xj的灰色关联度系数εij,构成关联矩阵A:

在矩阵A中,当i=j时,εij=1。一般阈值λ∈(0.5,1],当εij≥λ(i≠j)时,视Xi与Xj为同一类别,特征变量X1,X2,…,Xm在阈值下的分类为λ灰色关联聚类。
2.4.3 最佳聚类的确定
在灰色关联聚类中,对于不同的λ值,有不同的聚类数r。
(1)F统计量确定聚类
设有观测样本总数为n,每个样本zi有m个不同的特征属性,计算对应阈值λ的F统计量。
如果F>Fα(r-1,n-r)(α=0.05),则说明类与类之间的差异明显,分类合理。F越大,分类效果越好。若满足F>Fα(r-1,n-r)的F值不止一个,则可进一步比较(F-Fα)/Fα的大小,从较大中找一个满意的F值。
(2)谱系图确定聚类
Bemirmen提出根据研究目的来确定聚类方法,并给出谱系图聚类分析的4大准则。
准则一:各类的重心距离必须很大;
准则二:每一类所包含的元素不要过多;
准则三:分类的结果需符合实际的研究需要;
准则四:若采取集中不同的分类方法,在各自的聚类图中应具有相同的类。
本研究将F统计量与系统谱系图结合起来,通过F统计量确定几个较满意的分类,再利用谱系图聚类分析准则选取最佳分类标准。
3 低碳环保数据指标体系构建实证分析
3.1 指标海选
运用频度分析和理论分析,结合我国民用建筑全生命周期低碳环保的特点,从国内外权威机构的高频指标和部门协会的年鉴报表中海选指标。共包含5个准则层:绿化治理、大气环境、污水排放、固体废弃物、声环境,海选的指标详见表1的指标层。将这些指标按性质分为正向指标和负向指标。
3.2 基于灰色关联聚类-粗糙集的数据指标约简
3.2.1 样本数据的获取和标准化处理
初步筛选后的指标共有40个,其中绿化治理、大气环境、污水排放、固体废弃物选取不同气候分区的10个典型省市作为样本数据,分别为:河北、内蒙古、黑龙江、江苏、福建、湖北、广东、四川、陕西、新疆;声环境部分选取这10个典型省市的省会作为样本数据:石家庄、呼和浩特、哈尔滨、南京、福州、武汉、广州、成都、西安、乌鲁木齐。原始数据来源国家统计局、《中国统计年鉴》、《中国环境统计年鉴》、《城乡建设统计年鉴》。依据指标性质,将正向指标和负向指标分别进行标准化处理,以消除不同量纲的影响,结果见表2。
3.2.2 指标约简分析
以X4固体废弃物准则层为例,利用灰色关联聚类-粗糙集理论对数据指标进行优化筛选。粗糙集指标约简的思路如图2。
(1)灰色关联矩阵
计算全部数据指标下的灰色关联矩阵,得10个样本的灰色关联矩阵A:

(2)确定最佳聚类
由灰色关联矩阵A,采用最大系数法生成聚类谱系图,见图3。并用原始数据矩阵分别计算聚类为3类、4类、5类、6类、7类时的F统计值、相应的临界值Fα(α=0.05)和对应的相对差值(F-Fα)/Fα,如表3所示。
由F统计量数值可知,对于3类、4类、5类、6类、7类,均有F>Fα(r-1,n-r),其中分为5类和6类的(F-Fα)/Fα是其中的较大者,结合谱系图确定聚类的目的导向准则,将分类数确定为5类:U/Ind(A)={{1},{2},{4,7},{6,8},{3,5,9,10}}。
(3)粗糙集指标约简
按照同样的方法,依次计算删除指标X4.1-X4.11情况下的灰色关联矩阵A1-A11,结合聚类谱系图和F统计量进行聚类,结果见表4:
根据灰色关联聚类结果可知,指标X4.1、X4.4、X4.9、X4.11删除不影响评价样本的聚类结果,由粗糙集指标约简理论,予以删除;剩下的指标中X4.7(生活垃圾无害化处理能力,吨/日)X4.10与(生活垃圾无害化处理量,万吨)是倍数关系,反映的信息量重复,删除X4.7;保留X4.2、X4.3、X4.5、X4.6、X4.8、X4.10。
其他准则层按相同的方法进行约简筛选,共保留21个数据指标,筛选结果在表1中标出。
3.3 低碳环保数据指标体系的补充完善
上述民用建筑低碳环保数据指标是从已有的统计年鉴统计报表上筛选的成熟指标,而建筑碳排放因其计算的复杂性,涉及能源资源种类较多,贯穿于建筑全生命周期,且相关的计量与评估方法尚未完善,因此并未直接反映到年鉴报表上。参考国家、行业标准规范,用碳排量这一指标补充低碳环保数据指标,并进一步引入碳排放强度以量化单位生产值的碳排放强度。
施工现场固体废弃物回收利用量反映建筑资源的回收再利用程度,已有相关的施工现场固体废弃物量化、预测和利用的研究工作在进行,因此将施工固体废弃物回收利用量这一指标加入民用建筑低碳环保指标中。
通过灰色关联聚类-粗糙集指标约简和标准规范的进一步补充,最终构建了涵盖建筑碳排放、绿化治理、大气环境、污水排放、固体废弃物、声环境的24个指标的指标体系,如图4所示。
4 低碳环保数据指标体系的应用探讨
目前民用建筑领域,低碳环保方面统计数据标准体系欠缺,本研究构建的低碳环保数据指标体系,涵盖民用建筑全生命周期的24个数据指标,可解决低碳环保数据认知机理与资源治理机制的关键性问题。指标的应用如表5所示。此外,依托低碳环保数据指标体系,在量化分析的基础上,可有效开展民用建筑低碳环保总体水平的评价与管理,进一步带动建筑领域咨询设计、绿色建造、废弃物回收利用等相关产业的发展。对于减少环境污染、实现节能降耗等方面产生积极的影响,实现客观的经济与环境效益。
5 结 语
基于灰色关联聚类-粗糙集理论,最终构建了民用建筑低碳环保数据指标体系,主要结论如下:
(1)灰色关联聚类-粗糙集理论克服了传统粗糙集指标约简只适用于离散数据的问题,为了得到最佳分类,采用聚类谱系图和F统计量定性与定量相结合确定分类阈值,约简结果全面、客观。
(2)民用建筑低碳环保数据指标涵盖碳排放、绿化治理、大气污染、污水排放、固体废弃物、声环境6个方面。在数据获取和计量分析的基础之上,可指导低碳环保政策措施的制定,对民用建筑全生命周期节能环保效益的评估和管理具有一定的指导意义。
[2] 林文诗,叶凌,程志军.国内外绿色建筑评价标准节能环保效能对比研究[J].工程建设标准化,2016(10):39-44.
[3] GB/T 50378-2019.绿色建筑评价标准[S].中华人民共和国国家标准,2019.
[4] 江涛,王佟,宋梅.煤炭行业绿色矿山建设标准及其评价指标初步探讨[J].煤田地质与勘探,2018(1):1-7.
[5] 张亚暾.城市低碳交通评价指标体系研究[D].杭州:浙江工业大学,2018.
[6] 张瑞,刘操,顾永钢,等.基于层次分析法的再生水补给型城市河湖水生态修复技术评价指标体系及其应用[J].环境工程学报,2017(6):3545-3554.
[7] 周颖,王洪志,迟国泰.基于因子分析的绿色产业评价指标体系构建模型及实证[J].系统管理学报,2016(2):338-352.
[8] Tripathi M,Singal S K.Use of Principal Component Analysis for parameter selection for development of a novel Water Quality Index:A case study of river Ganga India[J].Ecological Indicators,2019(96):430-436.
[9] 刘清,覃盼,李胜,李昊.内河复杂水域通航环境风险演变指标体系研究[J].中国安全科学学报,2014(8):139-144.
[10] Luan X-Y,Li Z-P,Liu T-Z.A novel attribute reduction algorithm based on rough set and improved artificial fish swarm algorithm[J].Neurocomputing,2016(174):522-529.
[11] 张文修.粗糙集理论与方法[M].北京:科学出版社,2001:12-13.
[12] 刘光才,赖汪湾.基于粗糙集理论及灰色关联分析模型的我国民航发展水平综合评价[J].数学的实践与认识,2017(22):46-57.
[13] 侯娜,李战江,苏金梅,任星燕.基于灰色动态聚类-粗糙集的绿色资源环境评价指标构建模型[J].统计与信息论坛,2017(8):96-103.
[14] 刘思峰.灰色系统理论及其应用.第8版[M].北京:科学出版社,2017:76-79.
[15] 谢季坚,刘承平.模糊数学方法及其应用.第4版[M].武汉:华中科技大学出版社,2013:73-74.
[16] 薛毅,陈立萍.统计建模与R软件[M].北京:清华大学出版社,2007:485-486.