基于人员位置大数据的建筑人员作息模式研究
0 引言
我国建筑运行能耗占全国总能耗的20%左右
目前针对人员在室作息的确定方法主要有以下几种。
第一种是经验法和标准规范法。经验法通常是指根据模拟者的主观判断,经验性地给出人员在室作息的分布;标准规范法通常是取现行国际和国内标准规范中人员在室作息的推荐值。经验法和标准规范法简单易行,但在准确性上无法保证,所采用的数据是否符合客观实际,是这种方法面临的最大问题。
第二种方法是传感器监测法。在人员作息的监测上最常用的方法是红外计数器计数法。将红外计数器安装在主要出入口,根据出入人流逐时叠加得到人流数据。红外计数器的缺陷在于存在重记和漏记的现象,形成的误差会累加,从而使得总体累计误差巨大。很多研究致力于提供算法弥补红外计数器的缺陷,但效果并不理想
第三种方法是人工计数的方法。这种方法曾应用于机场航站楼人员密度的统计和人员位移模式的获取。这种方法需要消耗大量的人力成本,且准确性并不高,实际应用中存在很多的障碍。
随着通讯技术和社交媒体的发展,社交媒体软件积累了大量的数据。通过记录用户发送的主动定位信息,可以获取某一时段特定区域内的人数,进而用于分析建筑或建筑群中的人员作息。
已有一些学者利用网络大数据获取建筑中的人员作息模式。Gu等人利用聚类分析的方法获取公共建筑中的典型日人员作息
本文研究利用的数据来源于用户使用社交媒体软件过程中发送的主动定位请求,这些定位请求经过服务器的处理,得到某一时刻在一定区域内定位的人员总数。这一数据反映了某一区域内的人员随时间变化的作息特征。
本文研究利用聚类分析的方法从人员位置大数据中获取建筑的典型人员作息,并用一系列参数描述典型作息的特征。主要创新点包括以下4个方面:
1) 采用聚类分析的方法获取典型人员作息曲线。
2) 提出一系列具体化参数描述作息曲线的特征。
3) 以典型日和典型周为例,分析人员作息曲线规律。
4) 将人员位置大数据作息与能耗标准中的作息进行对比,分析其主要差异。
1 研究方法
本文主要研究目标是提取建筑中典型日和典型周的人员作息曲线,技术路线主要包含以下3个环节。
1.1 标准化
原始数据为某医院建筑中的逐时总人数。由于总人数本身仅具有相对大小的意义,因此需要将原始数据进行标准化,得到代表人员作息的参数值。此处采用最大值标准化方法
对于典型日作息,原始数据按照每日最大人数进行标准化,公式如下:
式中 ai为i时刻建筑的人员在室率(作息参数);xi为i时刻建筑中的人数;
而对于典型周作息,原始数据按照每周最大人数进行标准化,公式如下:
式中
需要说明的是,此处最大值标准化过程中,“每日最大人数”指单日人数的最大值,不同日的最大值不同。对于典型周的分析同理。这样处理的原因是避免随时间变化而引起整体人数变化,而仅考虑1天(周)内不同时刻的人数相对大小,即反映“作息”参数。这种标准化的处理,也为后续分析作了铺垫。
1.2 聚类分析
将数据进行标准化处理以后,逐日和逐周的作息需要通过聚类分析的方法得到典型作息。本研究采用k-means聚类的方法进行聚类。k-means是一种基于距离的聚类方法
k-means聚类算法需要在聚类前给定类的个数,分别采用Calinski-Harabaz准则
式中 S(k)为Calinski-Harabaz指标;tr为矩阵的迹;Bk为类间协方差矩阵;m为样本数;k为类别数;Wk为类内协方差矩阵。
通过式(3)可以看出,S(k)越大,聚类效果越好。在一定区间内遍历所有的聚类数,S(k)最大时的聚类数即为Calinski-Harabaz准则下的最优聚类数。
图1显示了确定最佳聚类数的Calinski-Harabaz图,可以看出,当聚类数为2时S(k)最大,即Calinski-Harabaz准则下的最优聚类数为2。
Davies-Bouldin指标定义为所有类的最大相似度的平均值,其表达式为
式中 D为Davies-Bouldin指数;N为聚类数;Si为类i内各样本到聚类质心的平均距离;Sj为类j内各样本到聚类质心的平均距离;Mi,j为2个类i和j质心之间的距离。
通过式(4)可以看出,D越小,类的相似度越小,聚类效果越好。因此在一定区间内遍历所有的聚类数,D最小时对应的聚类数即为Davies-Bouldin准则下的最优聚类数。
仍以该医院建筑为例,图2显示了确定最佳聚类数的Davies-Bouldin图,可以看出,当聚类数为2时D最小,即Davies-Bouldin准则下的最优聚类数为2。
综合2项聚类指标,确定最后的最优聚类数为2。以上过程即为利用k-means算法确定聚类数的过程,该过程适用于后文中各案例的聚类过程。
用以上方法进行聚类后,可以得到若干典型人员作息曲线。在这些曲线的基础上,进行时间分布特征的分析。以典型日曲线为例,统计各典型日曲线在周一至周日及节假日的时间分布,分析各类作息的时间分布特点。对典型周曲线,同样统计其不同月份的分布,分析其月份分布特点。
1.3 参数描述
在聚类分析的基础上,引入一系列参数来定量化描述不同典型作息的特征。对于人员典型日作息的特征,引入了3个参数进行描述。
1) 高峰时段:指1天内在室率高于0.7的时间段。
2) 低谷时段:指1天内在室率低于0.3的时间段。
3) 峰谷比:指1天内在室率最大值与最小值的比率。
高峰时段和低谷时段的描述,对于建筑环境控制及能源系统的实时控制具有重要意义,而峰谷比则对制冷机选型及相应的辅助设备配置具有重要意义。高峰时段和低谷时段的阈值0.7和0.3由三分位分组法
对于典型周作息的特征,引入2个参数进行描述。
1) 峰值比:指1周内日在室率峰值的最大值与最小值的比值。
2) 日总人流比:指1周内逐日总人数最大值与最小值的比值。
描述典型周作息的参数同样对建筑设备在1周之内的设计运行具有重要意义。
基于以上方法,典型人员作息模式研究的技术路线如图3所示。
2 案例分析
以16栋公共建筑的人员位置大数据分析建筑内典型人员作息模式。该数据来源于用户使用社交媒体软件过程中向服务器主动发送的定位信息。对特定区域(建筑)的定位数进行统计,可以获得该区域(建筑)的逐时人数数据。原始数据为数据平台上直接获取的脱敏数据,数据字段包含建筑名称、时间(精确到小时)和人数。涉及的公共建筑包括交通枢纽、商业建筑和医院建筑,位于北京和上海。数据的时间跨度约为2 a,从2015年12月1日至2017年9月6日。案例建筑的基本信息如表1所示。
表1 案例建筑的基本信息
编号 |
建筑名称 | 城市 |
1 |
火车站1(高铁站) | 北京 |
2 |
火车站2(高铁站) | 北京 |
3 |
火车站3(普速站) | 北京 |
4 |
火车站4(高铁站) | 上海 |
5 |
机场1 | 北京 |
6 |
机场2 | 上海 |
7 |
机场3 | 上海 |
8 |
商业综合体1 | 北京 |
9 |
商业综合体2 | 北京 |
10 |
商业综合体3 | 北京 |
11 |
商业综合体4 | 上海 |
12 |
商业综合体5 | 上海 |
13 |
商业综合体6 | 上海 |
14 |
商业综合体7 | 上海 |
15 |
商业综合体8 | 上海 |
16 |
医院1 | 北京 |
2.1 典型日作息
2.1.1 交通枢纽类建筑
选取火车站3为代表进行分析。该火车站为普速车站,位于北京。采用上述方法进行分析,可以得到3类典型日作息(根据Calinski-Harabaz准则,得到最佳聚类数为3,以下其他案例同理):第1类作息(作息0)大部分分布于周一至周四及周六;第2类作息(作息1)大部分分布于周五及周日;第3类作息(作息2)大部分分布于节假日。火车站3典型日人员作息及时间分布如图4所示。
作息0集中分布于周一至周四及周六,高峰时段(12:00—24:00)的人员数量较大且稳定,波动较小。作息1集中分布于周五和周日,在夜间人流有明显的上升,体现了周末出行和归程的人员高峰。作息2集中分布于节假日,体现了夜间相对较高的人流水平。
由描述参数可以看出,火车站3人流作息的高峰时段基本集中在11:00—24:00左右,非节假日的低谷时段基本集中在01:00—06:00,而节假日的低谷时段分布在04:00—06:00。从峰谷比来看,周五及周日由于22:00左右人数较多,其峰谷比高于周一至周四及周六。详细的描述参数如表2所示。
2.1.2 商业建筑
选取商业综合体1为代表进行分析。按照以上方法进行同样的分析,得到2类典型日作息及其时间分布。其中,第1类作息(作息0)大部分分布于周末及节假日,第2类作息(作息1)大部分分布于周中。具体作息、参数及其时间分布如图5所示。
表2 火车站3的典型日作息描述参数
高峰时段 | 低谷时段 | 峰谷比 | |
作息0 |
10:00—24:00 | 01:00—06:00 | 8.44 |
作息1 |
11:00—24:00 | 01:00—06:00 | 10.82 |
作息2 |
11:00—24:00 | 04:00—06:00 | 3.69 |
通过聚类的时间分布可以看出,商业综合体1的2类典型人流作息体现出非常显著的时间差异。作息0集中分布于周末和节假日,在商场运营时间范围内人员数量稳定,基本呈现高人流水平。作息1集中分布于工作日(周一至周五),在中午和傍晚存在显著的尖峰,体现了午间和晚间由于人员餐饮所造成的人流尖峰。
需要说明的是,由于商业建筑1天内有固定的运营时间,低谷时段和商业建筑的关闭时间基本一致,低谷时段的参数本身不具有特征意义。同样地,峰谷比参数也不具有特征意义。因此,对于商业建筑,只有高峰时段具有特征意义。图5中也仅展示高峰时段。商业综合体1的典型日作息描述参数见表3。
表3 商业综合体1的典型日作息描述参数
高峰时段 | |
作息0 |
12:00—20:00 |
作息1 |
12:00—20:00 |
从表3可以看出,工作日和休息日的高峰时段均为12:00—20:00,虽然工作日存在午高峰和晚高峰,但非午高峰和晚高峰时段的人员数量依然很多,午高峰和晚高峰的峰谷差异并不大。
2.1.3 医院建筑
选取医院1为代表进行分析。仍采用上述方法进行分析,得到2类典型作息。其中第1类作息(作息0)主要分布于周末及节假日,第2类作息(作息1)主要分布于周一至周五。2类作息的具体参数及时间分布如图6所示。
由图6可以看出,该医院的2类典型人流作息同样体现出显著的时间差异。作息1集中分布于工作日(周一至周五),白天门诊开放客流较高,并在开始营业时刻出现人流高峰,夜间仅急诊开放,人流相对较小。作息0集中分布于休息日(周末及节假日),由于白天门诊未全部开放,导致人流降低,峰谷差异减小。表4给出了医院1典型日作息描述参数。
表4 医院1的典型日作息描述参数
高峰时段 | 低谷时段 | 峰谷比 | |
作息0 |
09:00—16:00 | 00:00—06:00 | 10.2 |
作息1 |
09:00—16:00 | 23:00—06:00 | 15.1 |
由表4中描述参数可以看出,工作日和休息日高峰时段和低谷时段的分布基本一致,高峰时段均为09:00—16:00,低谷时段大致为00:00—06:00。主要差异体现在峰谷比,工作日的峰谷比显著高于休息日,体现了周末普通门诊限流导致的峰值降低这一现象。
2.2 典型周作息
2.2.1 交通枢纽类建筑
仍选取火车站3为代表进行分析。聚类得到了2类典型周作息。第1类作息(作息0)主要分布于1—9月,第2类作息(作息1)主要分布于10—12月。2种作息的聚类结果及时间分布如图7所示。
由图7可以看出,作息0集中分布于1—9月,周五的人流大于其他日,差异不显著。作息1集中分布于10—12月,同样体现为周五的人流大于其他日,而且差异较为显著。
表5给出了火车站3的典型周作息描述参数,可以看出,典型作息0(1—9月)的峰值比和日总人流比均小于典型作息1(10—12月),表明在10—12月周五人数显著增加,以及由此导致的峰谷差异变大。
表5 火车站3的典型周作息描述参数
峰值比 | 日总人流比 | |
作息0 |
1.23 | 1.18 |
作息1 |
1.50 | 1.34 |
2.2.2 商业建筑
仍选取商业综合体1为代表进行分析。通过聚类同样得到了2类典型作息。第1类作息(作息0)主要分布于9—11月,第2类作息(作息1)主要分布于6—8月,其他月份区分不明显。2类作息的曲线及时间分布如图8所示。
通过聚类的时间分布可以看出,该商业综合体的2类典型周人流作息体现出一定的时间差异。作息0在9—11月较为突出,其他时段不明显,该作息下周五、周六的人数相对较多,尖峰值较高,周日至周四的人数相对较少。作息1在6—8月较为突出,其他时段不明显,该作息体现出工作日(周一至周五)的人数略高于周六及周日的人数,该作息的占比为50%,不容忽视。表6给出了商业综合体1的典型周作息描述参数。
表6 商业综合体1的典型周作息描述参数
峰值比 | 日总人流比 | |
作息0 |
1.21 | 1.18 |
作息1 |
1.18 | 1.23 |
通过参数分布可以看出,虽然典型作息0和作息1在峰值比和日总人流比数值上的差异并不大,但其最大值和最小值出现的时间并不一致,作息0最大值出现在周五,最小值出现在周二,而作息1最大值出现在周五,最小值出现在周日,体现了作息分布的差异性。
2.2.3 医院建筑
仍选取医院1作为代表,通过聚类得到了3类典型作息。第1类作息(作息0)主要分布于2—9月;第2类作息(作息1)主要分布于11月至次年1月;第3类作息(作息2)及其时间分布属特殊情况,2015年10月连续2周周一的人数远高于其他日。各类作息的曲线及时间分布如图9所示。
通过聚类的月份分布可以看出,该医院的3类典型人流作息同样呈现出较为显著的月份差异。作息0集中分布于2—9月,周末人流显著小于周中,周中与周末的人流差异较大。作息1集中分布于11月至次年1月,周末人流相比作息0略高,周中与周末人流差异较小。表7给出了医院1的典型周作息描述参数。
由表7可见,典型作息0相比典型作息1在峰值比和日总人流比都高,呈现出11月至次年1月周末人流的相对增大。作息2属特殊情况。
表7 医院1的典型周作息描述参数
峰值比 | 日总人流比 | |
作息0 |
1.87 | 1.65 |
作息1 |
1.55 | 1.42 |
作息2 |
2.31 | 1.83 |
2.3 典型人员作息曲线
通过聚类的方法,可以对各个区域的人流作息进行一个整体的描述,并用一条作息曲线(作息画像)显示各个区域的特征。图10显示了交通枢纽、商业中心和医院等16栋公共建筑的典型日人流作息。
从图10可以看出3类建筑的不同特征:
1) 对于火车站类建筑而言,高铁站的人流作息大体一致。火车站3为非高铁站,夜间人流比高铁站大。不同机场之间的人流作息大体一致。
2) 对于商业中心,其人流作息大致与营业时间相关,因其功能结构不同而呈现细微的差异。
3) 对于医院建筑,其特征在于存在明显的早高峰,以及与普通门诊营业时间相一致的人流高峰。
图11显示了典型周人流作息。从图11可以看出3类建筑的作息特征。
1) 对于火车站,各站的周人流作息特征基本一致,周五体现出明显的人流高峰。其他时段中高铁站夜间客流非常少,而非高铁站(火车站3)的夜间仍具有一定客流量。机场的周人流作息特征也基本一致,周中(周一至周五)的人流大于周末(周六周日),由此看出机场服务的商旅客群相对占主体。
2) 对于商业建筑,整体来看,周五至周日的人流大于周一至周四,而一周内具体的人流峰值在不同地点和功能的商业中心集群内有所不同。
3) 对于医院,周中的人流明显大于周末,且从周一至周五日人流量逐渐减小,反映出由于周末普通门诊关闭导致的周中就诊人员累积的现象。
3 对比分析
本章将对比这种基于人员位置大数据的典型人员作息与标准规范中给出的典型人员作息模式的差别。
图12显示了医院建筑基于人员位置大数据的典型日作息与ASHRAE 90.1-2016标准中给出的典型日作息的对比。可以看出主要区别有以下2点。
1) 在基于人员位置大数据的典型日作息中09:00—11:00存在一个人员尖峰,这个尖峰在ASHRAE标准的作息中并不存在。
2) 基于人员位置大数据的典型日作息中夜间仍有一定数量的人员,而ASHRAE标准的作息夜间并无人员。
图13显示了北京某商场和上海某2个商场基于人员位置大数据的典型日作息,以及其与ASHRAE 90.1-2016标准中给出的典型日作息的对比。主要有以下2点结论。
1) 开始营业时刻两者具有较高的一致性。
2) 对于商场营业的晚间时段,其差异较为明显,这主要取决于商场的营业状态,夜间商业活动较多的商场其营业时间较长,傍晚和夜间时段也具有较多的人数。而夜间商业活动较少的商场在夜间人数也相应较少。
因此,对于商场类型的建筑,在设计过程中的实际人员作息,应当根据实际的功能规划作具体的设定。
4 结语
本文提出了基于人员位置大数据获取典型人员作息模式的方法。利用社交媒体软件中的人员位置数据,通过聚类分析的方法得到典型人员作息模式,并统计了不同作息模式的时间分布。根据典型日作息和典型周作息的不同特点,提出了一系列指标定量描述不同的作息模式,给出了不同建筑的日和周人员作息,分析了基于人员位置大数据的人员作息模式与能耗标准中的人员作息模式的差异,发现其差异十分显著。
以上分析结果表明,基于人员位置大数据的典型人员作息模式提供了有别于能耗标准的更详细、更精确的人员作息信息,而这种方法获取的典型人员作息模式,能更准确地体现人员作息的实际情况,从而更好地辅助建筑设计中的能耗模拟。
参考文献
[1] 清华大学建筑节能研究中心.中国建筑节能年度发展研究报告2019[M].北京:中国建筑工业出版社,2019:10
[2] 燕达,丰晓航,王闯,等.建筑中人行为模拟研究现状和展望[J].建筑科学,2015,31(10):178-187
[10] KREYSZIG E.Advanced engineering mathematics[M].4th ed.New Jersey:Wiley,1979:2
[14] 焦振勇,李霄.三分位数的意义及计算[J].统计与信息论坛,2006,4:21-22