《数据中心基础设施运行维护标准》(GB/T 51314—2018)解读
李本强 刘红. 《数据中心基础设施运行维护标准》(GB/T 51314—2018)解读[J]. 建筑技艺,2019,49(10).
LI Benqiang LIU Hong. Interpretation of Operation and Maintenance Standard for Data Center Infrastructure(GB/T 51314-2018)[J]. build,2019,49(10).
1《数据中心基础设施运行维护标准》编制背景
大数据时代的到来,使数据中心的发展出现了全新的局面,国内数据中心的数量和规模在不断扩大,从2010年51万个增加到现在近100万个,拥有超过3 000个机柜的大型数据中心由2010年164个发展到现在超过300个。IDC(互联网数据中心)作为数据中心的主要构成部分,2018年中国市场总规模达到1 228亿元人民币,同比增长29.8%;预计2021年,中国IDC业务市场规模将超过2 700亿元,同比增长30%以上。
随着数据中心建设的蓬勃发展,运行维护管理已成为数据中心使用中不可缺少的重要一环,一旦出现管理不到位或者运行维护不及时的情况,就可能对业务带来不可估量的损失。要做好数据中心运行维护工作,必须建立规范、高效的运维体系,将规范和流程引入到运行环境中,使运维管理工作制度化、标准化。运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段,甚至可以说是三分建设、七分管理。在运维标准层面,国内外近年已有多项协会标准和行业标准发布,但多数偏重管理制度,且数据中心的高速发展也需要一本权威的标准从技术角度深入和全面地对运维工作予以规范。因此,我们组织数据中心相关科研院所、设计单位、设备供应商、数据中心业主、第三方运维等三十余家单位,联合编制了《数据中心基础设施运行维护标准》(GB/T51314—2018)。
1.1 国外研究现状
2005年,美国国家标准协会(ANSI)首次发布ANSI/TIA942《数据中心电信基础设施标准》,TIA942主要用于数据中心基础设施的规划和设计,从可靠性角度来指导数据中心建设,2012年此标准进行了修编。此外,ANSI与美国国际建筑业咨询服务协会(BICSI)还共同发布了数据中心标准Data Center Design and Implementation Best Practices(ANSI/BICSI002—2014),用于指导数据中心的设计和实施,此标准中设定了五种运维等级(F0~F4),并设定了各个等级对应的数据中心基础设施允许年度计划维护时间范围。
Uptime Institute是全球公认的数据中心标准组织和第三方认证机构。该机构针对数据中心基础设施可用性、可靠性及运维管理服务能力进行认证的重要依据是Data Center Site Infrastructure Tier Standard:Topology和Data Center Site Infrastructure Tier Standard:Operational Sustainability两个标准。
英国中央计算机与电信局(简称CCTA)于20世纪80年代末开发了IT服务管理标准库——信息技术基础架构库(ITIL,IT Infrastructure Library),主要用于IT服务管理。
1.2 国内研究现状
我国数据中心的设计依据最早是国家标准《电子信息系统机房设计规范》(GB50174—2008),此标准术语中没有“数据中心”的概念。在随后经过修编形成的现行国家标准《数据中心设计规范》(GB 50174—2017)中,“数据中心”的定义是:“为集中放置的电子信息设备提供运行环境的建筑场所,可以是一栋或几栋建筑物,也可以是一栋建筑物的一部分,包括主机房、辅助区、支持区和行政管理区等”;“基础设施”的定义是:“在数据中心内,为电子信息设备提供运行保障的设施”。此外,在新修订的《数据中心设计规范》(GB 50174—2017)中将第11章“监控与安全防范”更名为“智能化系统”,包括总控中心、环境和设备监控系统、安全防范系统、火灾自动报警系统等。2014年,工信部颁布《互联网数据中心运维管理技术要求》(YD/T 2727—2014),规定了互联网数据中心(IDC)运维管理的主要功能要求,包括门户管理、服务管理、资源管理及维护、监控功能、统计分析及日志管理等方面的技术要求,适用于互联网数据中心的运行维护和管理。2015年10月,工信部颁布行业标准《信息技术服务运行维护第4部分:数据中心规范》(SJ/T 11564.4—2015),其中规定了数据中心运行维护对象、服务要求、运行维护内容等,旨在规范数据中心运行维护服务供方行为、改进服务能力及提高数据中心运行维护服务的工作效率。目前,我国数据中心相关的国家标准还有
目前,我国数据中心相关的国家标准还有《互联网数据中心工程技术规范》(GB 51195—2016)、《数据中心基础设施施工及验收规范》(GB 50462—2015)、《计算机场地通用规范》(GB/T 2887—2011)等。中国工程建设标准化协会标准CECS有《数据中心建设等级评定办法》《数据中心运行维护管理规范》《数据中心网络布线技术规程》等。
近几年随着数据中心的高速发展,一些与数据中心相关的社团、民间组织和机构相继成立,如中国数据中心工作组(CDCC)、中国数据中心产业发展联盟、中国数据中心技术委员会、数据中心联盟、中国绿色数据中心推进联盟等。中国数据中心工作组发布的《数据中心运维管理技术白皮书》,主要介绍了数据中心运维管理的一些关键技术。2015年,中国数据中心产业发展联盟发布《数据中心场地基础设施运维管理标准》,注重于具有普适性的运维管理系统框架的完整性。施耐德电气数据中心科研中心发布的系列技术白皮书,也推动了整个数据中心基础设施方向的技术发展。
2《标准》编制基本原则
本标准编制遵循如下基本原则:
(1)本标准是工程建设国家标准,是一本技术标准,因此:1)运维包含一定量的定性内容,要尽量用技术条款的写法与方式表达;2)运维必须涉及制度,但制度不是本标准的重点,比重不宜过大(图1)。
(2)运行维护的对象是数据中心基础设施系统和设备,不包括电子信息系统和设备,也就是核心的IT部分。
(3)根据与电子信息系统相关的密切程度确定运行维护内容,不包括与数据中心特点相关性不强的一般性建筑运行维护内容。
3《标准》编制的主要内容
本标准正文共分6章,分别是:1总则、2术语、3基本规定、4运行、5维护、6制度。《标准》编制的主要目的是为实现数据中心基础设施系统与设备运行维护的规范性、安全性和及时性,确保电子信息设备运行环境的稳定可靠。本标准适用于已投入运行的数据中心。
3.1 基本规定
《标准》基本规定包括两方面:运行维护范围和运行维护基本要求。数据中心基础设施运行维护的范围包括四个系统:电气系统、通风空调系统、消防系统和智能化系统(图2)。其中,电气系统包括供配电系统、不间断电源和后备电源系统、照明系统、配电线路布线系统和防雷与接地系统;通风空调系统包括冷源和水系统、机房空调和风系统;消防系统包括火灾自动报警系统、消防联动系统和自动灭火系统;智能化系统包括环境和设备监控系统、安全防范系统。除运行维护范围外,在基本规定一章中针对综合系统测试、运行维护管理基本目标、运行维护等级等规定了运行维护的基本要求。
3.2 运行
运行章节分别针对电气系统、通风空调系统、消防系统和智能化系统的监控内容、日常巡检内容、报警内容和运行控制主要原则进行了规定。电气系统和通风空调系统运行内容较多,主要包括监控内容、报警内容、日常巡检内容(图3,4);消防系统和智能化系统运行内容相对较少(表1)。
运行中环境参数一节主要针对数据中心的温度和相对湿度、正压、结露、空气含尘浓度、无线电骚扰环境场强、工频磁场场强、地板表面振动、静电、噪声、照度、室内CO2浓度、空气污染物浓度等进行了规定。
3.3 维护
维护章节分别针对电气系统、通风空调系统、消防系统和智能化系统的预防性维护周期和内容、预测性维护依据和内容进行了规定(图5,6,表2)。
3.4 制度
制度对于运维工作至关重要,整个运维工作都要在制度管控之下进行,但具体到不同的数据中心,具体制度内容的个体性和差异性非常之强,很难进行细致的规定。本标准主要规定了数据中心运行维护的制度体系,包括安全管理、运行维护管理、质量管理、应急管理、能效管理、人力资源管理、财务管理、文件管理、绩效管理、合规管理十个大类(图7)。
3.5 部分重要条文内容解读
(1)2.0.3、2.0.4条,“运行”和“维护”的定义。“运行”和“维护”的定义是本标准编制的基础,必须进行明确的定义。“运行”是对数据中心基础设施系统和设备进行的日常巡检、启停控制、参数设置、状态监控和优化调节。“维护”是为达到提高可靠性、排除隐患、延长寿命期目的所进行的工作,包括预防性维护、预测性维护和维修。“预防性维护”和“预测性维护”采用了国际上比较通行的名词,“维修”也可称为“纠正性维护”。这里要注意“日常巡检”界定为运行范畴,这一点在日常认知中容易模糊,本标准对此进行了明确的规定。
(2)3.2.4条,运行维护等级。在不同的标准中对数据中心有不同的分级,我国现行国家标准《数据中心设计规范》(GB 50174—2017)按照数据中心的可靠性和可用性将数据中心分为A、B、C三级,美国Uptime Institute《数据中心场地设施等级标准》将数据中心划分为四级。本标准中部分条款,如运行维护的频次与内容、值班时间的规定,与数据中心分级有关,考虑本标准目前主要针对国内,故编制中采用了《数据中心设计规范》(GB 50174—2017)的分级。
(3)4.1.6~4.1.8、4.3.1~4.3.5、4.3.11~4.3.14条,运行管理策略。数据中心由于其高能耗的特点,近年来已成为节能政策和节能技术关注的重点,而运行是实现节能效果的关键环节,同时安全又是整个数据中心运行的首要任务。基于安全与节能要求,本标准在运行一章中对电气与通风空调系统整体运行策略优化、冷水机组供水温度调节、自然冷量利用、水泵风机变频控制、冬季防冻等内容设置了专门的条款。
(4)4.6.1条,主机房温湿度参数。温度和湿度是保证电子信息设备正常工作的重要环境指标,需要控制在一定范围内。本标准的温度数值根据现行国家标准《数据中心设计规范》(GB 50174—2017)确定,18~27℃的温度范围是综合考虑暖通系统运行能耗、电子信息设备维修费用等各种因素而提出的。在空气湿度方面,相对湿度过高会影响数据中心设备的安全运行与设备使用寿命;而相对湿度过低时,可能导致静电充电,进而损坏设备或影响其正常运行。现行国家标准《数据中心设计规范》(GB 50174—2017)规定了露点温度与相对湿度,现行国家标准《计算机场地通用规范》(GB/T 2887—2011)中对B级机房的相对湿度规定为35%~65%。考虑到数据中心空气湿度的在线监测多为相对湿度,而非露点温度,故本条规定了建议相对湿度范围。结合调研,考虑到全国范围适用性,本标准推荐相对湿度采用35%~65%的范围。
4 创新点
本标准主要创新点如下:
(1)首次对数据中心的“运行”和“维护”进行了定义,明确了“运行”和“维护”的工作界线。
(2)结合国际运行维护工作研究经验和国内工作习惯,将“维护”内容划分为“预防性维护”“预测性维护”和“维修”三项。
(3)对电气系统、通风空调系统、消防系统、智能化系统的巡检频次与内容、监控与报警内容、维护频次和内容做出了明确规定。
(4)运行策略相关规定充分考虑了设备系统节能高效运行要求,突出了数据中心高能耗特点下的高能效需求。
(5)对数据中心运维所需的基本制度体系给出了明确的规定。
5 结语
2018年9月11日,住房城乡建设部正式发布公告,批准《数据中心基础设施运行维护标准》为国家标准,编号为GB/T 51314—2018,自2019年3月1日起实施。本标准弥补了我国在数据中心基础设施运行维护领域中国家标准的空白,内容全面、层次鲜明、技术要求清晰合理,具有较强的可操作性。《标准》的编制完成及时响应了我国数据中心高速发展的行业需求,对数据中心运维团队高效地进行运维工作具有重要的指导意义,有助于全面提升全国数据中心行业的发展水平,并走向国际市场。