基于Uptime TierⅣ等级数据中心空调系统控制架构简析

作者:张铭蕾 储君
单位:中国民生银行总行信息科技部
摘要:近年来,因数据中心基础设施的可靠性与安全性要求越来越高,而国标GB 50174-2017《数据中心设计规范》中的A级数据中心等级相对于Uptime标准中的TierⅣ等级存在一定的差距,因此金融体系数据中心的基础设施架构多采用Uptime TierⅣ等级,而空调系统的控制架构如何搭建也是设计难点之一。
关键词:数据中心Uptime空调系统控制架构
作者简介:张铭蕾,硕士研究生,工程师,注册公用设备工程师,Email:15911107867@139.com;

0 引言

在信息技术快速发展的背景下,数据中心基础设施的关键性日益凸显,对于金融系统的数据中心而言,重要业务系统连续稳定运行对基础设施安全可靠性的要求更加苛刻,大型金融数据中心如遇宕机造成的业务损失、声誉等间接损失每小时可达数亿元人民币。

为保证金融业数据中心基础设施的可靠性与安全性,目前设计标准大多采用Uptime TierⅣ等级,并满足GB 50174-2017中A级数据中心标准,本文主要从满足TierⅣ等级的数据中心空调系统控制架构展开分析。

1 满足Uptime TierⅣ等级的空调系统

Uptime Institute机构发布的标准中TierⅣ等级为其最高等级,主要从设备容错、分配路径物理隔离、可并行维护、连续制冷等角度作出要求(表1)。

表1 TierⅣ等级要求   

对于空调系统而言,要满足以上要求,并同时考虑到节能的要求,目前多采用“2N”架构的冷冻水空调系统,如图1所示,从冷源部分(包含冷水机组、冷冻水泵、冷却水泵、板式换热器、冷却塔、蓄冷罐等)到机房专用精密空调末端设备的数量均为2N,即从设备配置上满足容错的要求。

同时,对每套制冷单元,从冷源到空调末端及每套制冷单元的空调水管路,均应布置在不同的物理空间,满足防火防水的物理隔离要求。

图1 2N配置的空调系统示意图

2 控制系统简析

基于Uptime TierⅣ等级搭建的数据中心空调系统及机房环境温湿度控制系统主要包括:设备监控系统(BAS系统)、空调末端的群控系统、环境监控系统。

通过以上控制系统可以自动识别空调系统中故障设备或故障点,并自动隔离故障,同时另一套空调系统自动加载,保证机房环境温度在15min内的波动值不超过5℃,同时满足空调系统的制冷容量一直达到“N”的要求。

2.1 设备监控系统(BAS系统)

(1)针对制冷单元一、二设计两套独立的BAS系统,如图2所示,每套BAS系统接入各自制冷单元内的冷水机组、冷冻水泵、冷却水泵、冷却塔、蓄冷罐、水处理器、漏水探测器及水管路上的电动控制阀门、压力和温度传感器等设施。

(2)两套BAS系统的服务器和操作站放置于独立的自控室内,两套系统之间完全独立运行。

图2 BAS系统示意图

2.2空调末端群控系统

(1)机房专用精密空调群控管理系统采用的是模块化主从形式,如图3所示,通过RS485通讯方式来实现联网群控。选择一台精密空调机组当作主控机组,将精密空调机组联网,并将各个空调的地址分别设置在精密空调内置智能通讯接口上。

(2)精密空调采用2N架构,因此群控(1)与群控(2)对应的空调机组也独立联网。当任何一套精密空调系统出现故障时,另一套精密空调系统可正常运行,从而保证N配置的精密空调可靠运行。

2.3 环境监控系统

与空调系统相关的环境监控主要包括IT机房模块及配电用房内的温湿度采集、机房专用精密空调的状态采集、加湿机状态采集等。

图3 群控系统示意图

监控系统中的核心交换机、监视主机均为2N架构,一主用一备用,分别设置于独立的监控室内,主备机相互检测,双机热备。环境监控系统示意图如图4。

图4 环境监控系统示意图

3 设计中应该注意的问题及难点

3.1 控制原则

(1)设备监控系统(BAS系统)

1) BAS系统中的控制器用以检测室外湿球及干球温度、水流量、供回水温度、压力等参数,向制冷单元内的各设备(冷水机组、水泵、冷却塔、电动阀门等)发出控制命令,并接受各设备的状态反馈信号,即同时实现“监测与控制”的功能。

因Uptime TierⅣ等级要求“2N”配置的空调系统均需同时在线运行,当监测到任意一套制冷单元的某个设备故障的情况下,应能自动识别故障点并隔离故障设备,同时根据设定的控制逻辑,另外一套制冷单元中相应的设备自动加载运行,如:某TierⅣ等级的数据中心,冷水机组数量为1+1 (2N配置),在满负荷的情况下,两台冷水机组运行负载率均为50%+50%,在某一台冷水机组因制冷剂泄漏或其他故障的情况下,BAS系统自动识别故障的冷水机组并发出报警,按照控制逻辑自动关闭故障的冷水机组及其对应的冷冻水泵、冷却水泵、冷却塔及相应的管路电动阀;此过程中另一套制冷单元根据冷负荷的需求自动加载,直至达到100%的运行工况。

2)对于冷冻水空调系统,冷冻水或冷却水的泄漏对数据中心服务器等设备的危害极大,因此Uptime TierⅣ等级要求所有室内水管路都应探测到漏水故障,需要通过布置漏水绳及其他压力传感器等设施,保证任意位置的漏水探测器报警时,辅以管路中的压力传感器,判断水管路是否发生局部泄漏或者爆管,控制系统自动关闭相应区域的电动阀,防止出现持续性的漏水。

实际在设计过程中,则需根据空调系统冷冻水及冷却水管路环状/枝状布置的不同,设定不同的控制逻辑,枝状布置的管路可能因管路泄漏而关闭整套空调系统。

(2)空调末端群控系统

1)群控管理系统具有的功能包括群组内的空调末端自动分工、顺序加载、数据同步等,以及对各台空调机组运行参数进行精准控制,当主控机组停机后,其他从机具有主控功能,会及时接管系统,完成相应的管理控制任务。

2)群控功能应能保证精密空调所有机组运行的持续性,避免主控机组故障影响到其他机组,从而保证整体“N”配置的精密空调可靠运行。

(3)环境监控系统

1)环境监控系统主要是采集机房专用精密空调的送回风温度和湿度测量值,送回风温度和湿度设定值,偏移量、运行状态,风机转速、水阀开度、供回水温度、手/自动和故障状态等数值,以及机房模块、配电用房内的温湿度情况。

2) Uptime TierⅣ等级要求环境监控系统只能进行数据及状态采集,不能参与设备控制。

3.2 物理隔离

(1)对于设备监控系统(BAS系统),不仅要满足系统内各设备容错的要求,同时对于各自监控系统的控制器、交换机、服务器、监控器、操作站等设备及主干布线、水平布线的桥架路由等,均需布置在不同的物理空间,以保障当任何一套系统因火灾或水管路漏水导致故障时,另外一套系统仍然可以工作,监控其对应的制冷单元,保证制冷系统满足“N”容量的要求。

(2)对于空调末端群控系统,因每个IT机房模块内的精密空调为2N配置,同时已经布置在满足物理隔离要求不同的空调间内,因此空调末端的群控系统已经满足物理隔离的要求。环境监控系统“只监不控”,则其设备及桥架路由可不要求物理隔离,但建议其核心交换机及监视主机进行双机热备。

3.3 其他

(1)任意一个控制系统中的控制器及交换机、通信线路故障时,均可以直接断开该设备,其所控制的设备将继续保持当时的运行状态,不影响正常使用。

(2) BAS系统应监测控制器的“心跳”,如果检测到控制器故障,则应立即报警并维持故障之前的运行模式及状态。

(3)控制系统中应有设备的手/自动控制状态显示,冷水机组、水泵、冷却塔、机房专用空调等设备均需自带手动控制模式,在设备故障时切为手动控制模式,此时控制系统中显示设备手动控制状态,直至设备维修完成后切为自动控制模式。

(4)控制系统中的控制线连接类型需为插拔式连接头,即支持热插拔,保证可以在线检修维护。

4 结束语

通过以上分析,可知基于Uptime TierⅣ等级的数据中心空调系统控制架构与GB 50174-2017中的最高A级标准,在一些细节上,尤其设备监控系统(BAS系统),有较大的区别。本文所分析的是基于实现设备及路径的物理隔离而采用“2N”配置的架构,但其实“N+1”的配置也能实现相同的功能,但难度更大。同时,此架构需要牺牲一定的建筑面积,降低了数据中心的出机柜率,整体的投资造价也相对较高,但却可以提高数据中心的安全性与可靠性。若为了获得Uptime Institute机构颁发的设计认证证书,则需要通过该机构严苛的审核,因此国内通过TierⅣ认证的项目相对较少。

本文所总结的内容均为笔者在参与国内某金融数据中心获得Uptime TierⅣ设计认证的经验总结,若有疏漏,欢迎各位同仁沟通交流。

 

参考文献[1] GB 50174-2017数据中心设计规范[S].北京:中国计划出版社,2017.
[2] Uptime Institute. Data Center Site Infrastructure Tier Standard[S]:Topology,2018.
Analysis of Air Conditioning System Control Architecture Based on Uptime Tier Ⅳ Data Center
Zhang Minglei Chu Jun
(China Minsheng Bank Head Office Information Technology Department)
Abstract: In recent years,as the reliability and security requirements of data center infrastructure are increasingly high,and there is a certain gap between the A-level data center level in GB 50174-2017《Code for design of data center》and TierIV level in Uptime standard. Therefore,Uptime is widely used in the infrastructure architecture of data center in financial system and how to build the control architecture of air conditioning system is also one of the design difficulties.
Keywords: data center; Uptime; cooling system; control architecture;
1715 13 13
文字:     A-     A+     默认 取消