数据挖掘技术在建筑企业经营管理中的应用研究
1 引 言
目前人工智能和数据库领域都在大力研究数据挖掘技术以解决目前遇到的各种问题。从数据库的海量数据中搜索出以前未知的、隐含的、具有潜在价值的数据就是数据挖掘技术。挖掘数据的过程是一种决策支持过程,能够在分析数据时做到高度自动化,推理具有归纳性,推导规律和模式,有助于企业管理者做出正确的决策。有研究者设计基于读者行为数据挖掘的高校图书荐购模型,提出基于改进的kmeans算法的活跃书籍挖掘方法,得出活跃书籍;有研究者利用长短期记忆网络(LSTM)深度学习模型实现具有长期记忆能力的时间序列预测,形成产量预测模型。还有学者研究DEA模型实现建筑企业经营管理方法,该方法能够实现建筑企业的经营管理,但是在数据采集方面的效率较差;还有学者研究M-CM为基础的建筑企业经营管理方法,该方法在数据库占用方面存在一部分不足,有待进一步研究。
本文深入研究数据挖掘技术,通过计算分析,得出数据挖掘技术在建筑企业经营管理中的应用情况。
2 数据挖掘技术在建筑企业经营管理中的应用
企业的经营管理主要是指企业在开展商品交换和物质生产的经济活动中,需要先做好市场预测与调查,确定生产的商品,制定可长期发展的计划,为达到预定目标完成经营计划。企业经营管理为了获得更大利益,需要使用最少的物资获得更加充足的利益。近年来计划经济体制逐步向社会主义市场经济体制转变,企业的性质也发生转变,需要自主负责经营、核算,同时还需要自负盈亏。只有及时获得各类数据,及时调整产业结构才能满足市场竞争,争取利益最大化。
2.1 数据挖掘技术
在数据化进程不断加快的当下,各类企业在管理和发展中面临数据冗杂、管理困难、数据呈指数级别增长等问题。深入分析各类数据,为实现快捷的数据统计和汇总,需要深入挖掘数据。数据挖掘技术是从海量数据中使用算法搜索出隐藏的数据的过程。通过关联计算机科学,经情报检索、在线分析、机器学习等,将数据转换成有用的知识和实际应用。实行数据挖掘时需要经历获取数据信息源、搜集信息、预处理数据、智能挖掘等4个阶段。
2.2 数据挖掘技术在建筑企业经营管理中的应用
数据挖掘技术目前主要在数据库、文本、因特网中使用较多。在建筑企业经营管理中使用数据挖掘技术,构建数据智能挖掘模型,挖掘出企业所需数据,继而构建建筑企业经营管理模型,用于企业管理(包括智能管理)。
2.2.1 数据智能挖掘模型
随着信息化进程的深入,建筑企业经营管理数据不断积累,为了实现建筑企业经营管理大数据的智能分析,基于此构建以数据挖掘作为基础的数据智能挖掘模型,结构见图1。数据智能挖掘模型能够完成收集数据、预处理数据、智能挖掘,智能化获得经营数据。通过OLAP技术和数据库挖掘技术收集建筑企业内部数据(人事、财务等数据);利用语义分析技术和Web挖掘技术挖掘建筑企业外部数据(行业数据、网络数据等)。多种技术共同结合挖掘建筑企业经营管理所需要的如方案、规则、模式等数据,这些数据不但可以通过可视化技术向用户呈现,同时还能够存储到企业数据库中,以便日后使用。
由图1所示的数据智能挖掘模型包括信息源、收集信息、预处理、智能挖掘四个阶段。
信息源:由建筑企业内部和外部数据,两部分共同组成数据源。建筑企业内部数据主要来自内部文本、数据库和系统数据仓库,能够实现企业自身存在问题的分析,包括企业中建筑项目的开展情况、财务状况和人力资源情况。建筑企业外部数据来自于网络数据、互联网络、行业组织网站等途径,能够预警建筑企业可能出现的由于行业宏观数据调整影响的企业风险,或者搜索目标客户的爱好和需求,还能够获取竞争对手在市场上的占有率和项目进度与产值。
收集信息:通过网络检索、文本检索、数据库检索三种方式完成数据收集。使用查询语言SQL(Structured Query Language,结构化查询语言)建立程序,自动收集数据库数据。网络搜索引擎检索互联网上的网页数据。使用文本检索工具实现文本数据的内容与主题检索。
预处理:经数据库等途径挖掘到的数据存在噪声、不一致和空缺的情况,这些数据被称为“脏数据”。通过检索获取的各类文本资源和外部网络资源也存在主题内容不相关、过期和冗余等缺陷。在挖掘之前需要先实行预处理,目的是为了使数据能够符合数据挖掘的要求。使用数据集成、数据摘要、数据清理、数据分类、数据规约等方式实现数据预处理。
智能挖掘:数据智能挖掘中最为重要的步骤便是智能挖掘,通过智能挖掘能够把各类数据抽象成建筑企业经营管理的各项知识,设计存在差异的数据挖掘引擎用以满足多知识模式、多数据源的数据智能挖掘模型。本文使用语义分析引擎、数据库挖掘引擎、LIAP以及Web挖掘引擎完成深层数据挖掘。
2.2.2 建筑企业经营管理模型
为了高效获取建筑企业经营管理数据,以数据挖掘技术为基础的建筑企业经营管理模型包含三层,分别为集成、合成与存储,具体结构见图2。
(1)数据挖掘:
采用2.2.1节构建的数据智能挖掘模型实现建筑企业经营管理相关数据的挖掘。
(2)数据集成:
实现数据集成分为两部分,分别为企业的内部和外部数据,是整个模型的核心部分。建筑企业经营管理模型数据从数据智能挖掘模型中获取数据,通过XML数据合成与Web服务器注册完成数据集成。
(3)数据分类:
使用XML数据合成技术与Web服务器注册技术,通过数据挖掘技术所包含的模糊逻辑与粗糙集理论,利用改进神经网络对集成后的建筑企业经营管理相关数据进行分类,并将分类后的数据存储到终端数据库中。具体过程如下:
Step1:设置神经网络输入向量和输出,输入具体应该为:建筑企业经营管理相关数据,而输出具体为:建筑企业经营管理结果,并计算神经网络的输出与理想的建筑企业经营管理结果之间的误差。
Step2:通过神经网络的训练,使神经网络的输出与理想的建筑企业经营管理结果之间的误差尽量最小,并根据式(1)对神经元权系数进行更新:
wij(k+1)=wij(k)+μδiyj (1)
由于初始权值大,神经网络网络学习速率快,但是收敛精度低;而初始权值小,神经网络网络精度高,但是神经网络网络学习速率慢,为了实现收敛速率快,同时具有较高收敛精度,本文对基本神经网络的权值更新方式进行改进,具体如下:
wij(k+1)=wij(k)+μδiyj+η[wij(k)-wij(k-1)](2)
Step3:不断执行Step2,直到神经网络的输出与理想的建筑企业经营管理结果之间的误差达到以预先设置的区间内。
(4)终端数据存储。
总体建筑企业经营管理模型中的最关键的部分是终端数据存储部分,利用SAP数据库管理技术合成终端数据。依据数据库技术存在的特点,设计建筑企业经营管理方案,通过XML合成各异构数据库的大量数据,构建终端数据仓库,方便后续维护。使用OLAP将待分析的数据合成,采用查询工具、报表工具以及数据分析工具实现数据的查询、报表生成以及数据分析,研究数据趋势,有效实现建筑企业经营管理。
2.2.3 建筑企业经营管理模型的应用分析
本研究从某建筑企业财务信息系统中提取连续5年的有关资金运营的财务数据,对其进行预处理后输入建筑企业经营管理模型,进一步挖掘企业营运资金,得到数据挖掘结果如图3所示。由图3可知,企业经营活动现金流量与流动负债比率对企业营运资金运营管理至关重要,这一财务信息对预测企业营运资金是否短缺具有最直接的依据。企业可以通过密切关注企业经营活动现金流量与流动负债比率来及时预测企业的营运资金情况。
3 应用分析
为验证本文方法,将上述某建筑企业作为研究对象,利用本文方法将一个大型数据库安装在该公司的服务器上,数据库包括Oracle、SQL Server和Access。通过本文方法挖掘出有价值的数据,并实现数据合成和转换,存储至该建筑企业的终端数据库中。为对比本文方法性能,在该企业中同时使用DEA模型实现建筑企业经营管理方法和M-CM为基础的建筑企业经营管理方法,对比三种方法的各项性能。三种方法各指标的统计结果见图4。从图4中能够看出,本文方法能够保证挖掘较高数据量的同时具备较高的准确率、召回率和F值。另两种方法虽然也能具备较a高的准确率和召回率,但是挖掘数据的数量较少,综合对比后证明本文方法在数据挖掘方面具有较好的效果。
由于本文方法中使用改进神经网络结合数据挖掘技术实现数据合成,因此验证本文方法中改进神经网络性能情况。经数据挖掘技术挖掘数据后,选取5000条数据开展实验,以2500条数据作为训练数据集,另2500条数据为微测试数据,重复训练50次以上,实验结果取平均值。训练损失和迭代次数结果见图5。从图5能够看出,从神经元个数达到13个开始,迭代次数趋于稳定,迭代次数不再降低,神经元个数为11个时,训练损失较低,由此可以确定,方法实际使用时,输入层和输出层的神经元个数分别选择13个和11个时能够达到很好的迭代次数和训练损失量。
所挖掘数据的增加,将会影响终端数据库的占有率,分析三种方法随着数据增加数据库占用情况,对比结果见图6。从图6中能够看出,尽管三种方法都随着数据数目的增加而出现数据库占用率上升的情况,但是本文方法占用率比另两种方法更低,由此可以看出,使用本文方法能够具有较少的数据库占用率,同时能够降低数据库的运行负载,有利于建筑企业开展今后的经营管理活动。
4 结 语
本文以数据挖掘技术为基础构建一个数据智能挖掘模型,阐明数据挖掘、数据库和Web挖掘技术等实现数据挖掘的全过程,结合改进神经网络技术,完成数据集成,最终将数据应用于建筑企业经营管理。该方法在挖掘数据时具有较高的准确率和召回率,同时,通过深度的数据挖掘可以对企业的管理提供相应的信息参考,有利于建筑企业经营管理。
考虑到篇幅限制,本文针对数据挖掘技术在企业经营管理方面的研究还有很多不足,在今后的研究中可以从以下几个方面开展:
(1)除了数据挖掘技术,从Web技术深入研究,注重网络方面的数据挖掘,为企业发展提供条件。
(2)深入研究数据挖掘技术,扩大该技术的应用领域,尝试该技术在多个领域的使用方式。
[2]崔治国,曹勇,魏景姝,等.数据挖掘技术在建筑暖通空调领域的研究应用进展[J].建筑科学,2018(4):85-97.
[3]杨小柳,范佳慧.数据挖掘技术在节水管理中的应用[J].长江科学院院报,2019(7):1-6.
[4]王玻,彭伟.基于数据挖掘的服务企业诊断数据情报智能挖掘模型研究[J].科技管理研究,2020(1):184-192.
[5]牛文楠,鲍鹏飞,唐会东,等.基于数据挖掘的智能电网安全漏洞挖掘模型[J].电源技术,2018(4):593-596.
[6]李澎林,郏莉,李伟.一种基于数据挖掘的图书荐购模型研究[J].浙江工业大学学报,2019(1):80-85.
[7]谷建伟,周梅,李志涛,等.基于数据挖掘的长短期记忆网络模型油井产量预测方法[J].特种油气藏,2019(2):77-81+131.
[8]郑晓晓,刘伊生,时颖.基于DEA模型的北京市建筑业生产效率评价[J].北京交通大学学报(社会科学版),2017(2):76-84.
[9]赵平,刘康,黎晓东.基于M-CM的建筑施工企业现场安全管理成熟度评价[J].安全与环境学报,2018(1):182-187.
[10]尹志强.基于数据挖掘的高校图书馆图书借阅流量建模与分析[J].微电子学与计算机,2018(11):95-99.
[11]林顺富,胡飞,郝朝,等.基于数据挖掘的楼宇电力能耗分析模型研究[J].电测与仪表,2018(20):52-59.
[12]何晨炜,张云明.基于数据挖掘技术的火灾风险预警模型研究[J].消防科学与技术,2017(12):1745-1749.
[13]邱瑾,张淑楠.基于数据挖掘的互联网众筹成功进度分位数回归模型[J].统计与数据论坛,2018(2):36-45.
[14]张利利,郭淑妹,马艳琴,等.基于数据挖掘技术的银行客户定期存款认购模型研究[J].数学的实践与认识,2019(21):95-102.