基于数据挖掘技术的北方寒冷地区居民用水、用气数据处理方法探讨

作者:周浩 林波荣 张仲宸 戚建强 郑立红 常晨晨
单位:清华大学 天津生态城绿色建筑研究院有限公司 中国建筑设计研究院有限公司
摘要:对于一个城市尺度的居民用气、用水数据系统, 其数据量之大通常是人力无法或难以处理与分析的, 往往需要借助于数据挖掘技术。基于天津市某城区3个小区用户2 a的用水、用气数据, 采用数据标准化、基于临近性检测、箱线图等数据挖掘方法, 对用户数据进行了用能异常、邻月用能数据变化异常等检测, 并横向比较了3个小区的总体用能水平。结合问卷调研数据, 提出了通过信息增益理论及C4.5决策树等数据挖掘算法建立用户用能水平与用户特征及用户行为间的关联关系的方法。本文的研究工作展示了从建筑用能数据中提取有效信息的过程, 可为建筑能耗数据管理平台构建和应用提供新思路。
关键词:数据挖掘 异常点检测 箱线图 信息增益率 C4.5决策树
尊敬的用户,本篇文章需要2元,点击支付交费后阅读
673 12 12
文字:     A-     A+     默认 取消