数据中心PDU使用现状和技术创新研究

作者:肖鑫
单位:成方金融信息技术服务有限公司
摘要:针对数据中心PDU使用的若干问题,本文比较分析了PDU设备选型和部署的优选方案,讨论增加软件功能、强化信息安全、整合硬件功能等技术创新的价值。
关键词:智能PDU色彩管理兼容性故障录波信息安全
作者简介:肖鑫,硕士研究生,工程师,Email:xxin@pbc.gov.cn。

0 引言

电源分配单元(Power Distribution Unit,PDU)是数据中心配电系统的最末端一级设备和最基本供电单元。近年来,随着数据中心基础设施设备的迭代发展,PDU也从最初的普通型逐渐升级为智能型,给机柜微环境监测和数据中心精细化管理提供了新的技术支撑。但是PDU选型和使用过程中也存在一些问题,给数据中心供电安全带来了新的挑战,本文对当前数据中心PDU使用情况、存在的问题进行了剖析,并对PDU技术创新内容进行了研究。

1 数据中心PDU使用现状

1.1 智能PDU应用快速增加

许多数据中心同时运行着普通PDU和智能P DU,但存量中普通P DU在逐渐被智能P DU替换,近几年新建设的机房则普遍选择配置智能P DU。虽然智能P DU较普通P DU成本要高,但是智能PDU具备端口级电量监控的显著优势,有助于规模化部署设备的运行功率监视分析及电量精细化管理,银行、通信、互联网等向全社会提供高并发实时服务的行业快速接受了智能P DU产品。

1.2 定制PDU成为常态化需求

定制符合机房特质的PDU并规模化部署在新落成的数据中心屡见不鲜,已经成为数据中心建设的常态化需求。客户往往根据数据中心单机柜功率设计值、机柜型号和外形尺寸、电缆走线方式、拟上架IT设备的电源线插头数量与规格、供电安全性级别等因素提出定制化PDU的具体技术指标要求。

1.3 PDU主流品牌优势明显

近年来新建数据中心数量和规模迅猛扩展,老机房电源更新改造情况也较为普遍,PDU市场需求旺盛,众多PDU品牌激烈竞争。在产品质量方面,市场占有率高的头部企业产品质量口碑较好,品牌优势明显,带动整个行业的产品质量水平持续不断提升。

2 数据中心PDU选型和使用的一些问题

2.1 PDU的开关选择

PDU本体开关的配置一般由采购方的使用习惯和使用场景决定,开关的选择本质上是一个管理问题:对于业主自用的机房而言,不选配PDU开关既可以节约成本又可以解决误操作问题;但对于IDC机房而言,同一台列头柜后端的机柜可能承租给不同用户,这种情况下配置PDU本体开关便于用户自主控制机柜的电源,减少对列头柜开关操作的频率,避免客户间的相互影响。

2.2 PDU系统的色彩管理

数据中心规模化、标准化发展趋势下,基础设施设计过程中色彩管理的原则和方法运用具有区分空间、强化辨识度和提升管理效率的作用,而智能PDU系统的色彩管理往往被忽视。通过两路智能PDU本体及其相关网线采用不同的明亮度和颜色,不仅使机房内部整体感观规范有序,还有助于运维人员快速确认电气故障信息,在数据中心设计和设备选型过程中应优先在智能PDU系统应用色彩管理。

2.3 PDU的兼容性

同一个机房区域内可能存在多个品牌的普通PDU,但很难同时存在多个品牌的智能PDU,因为智能PDU的联网监测涉及到通信数据包的一致性问题,各品牌都有自己的监控管理系统,不同品牌的设备很难在一个监控系统下完美融合。另外,同一品牌不同型号的智能PDU混用时,也有可能存在软、硬件版本变化导致的通信故障。未来兼容性问题可能随着产品的进一步发展、通信数据格式的逐渐统一而减少,但使用方不应忽视这一情况。

2.4 智能PDU与动环监控平台的对接

对于直接将智能PDU接入动环监控平台的设计方案,如需管理2个以上品牌的智能PDU,则需在前期确定好数据接口开放事宜,避免在施工阶段出现无法对接的情况。大型数据中心在设计阶段必须考虑智能PDU监控数据规模的问题,确保动环监控主机性能满足要求。

2.5 PDU附属功能模块的选择

常见的PDU附属功能模块包括温湿度、烟雾感应、水浸感应、门禁管理、资产管理等模块,可根据机房管理的具体需求进行选配。以温湿度模块为例,机柜级的温湿度探测数据对机房整体而言作用有限,因为基本上机房投产前都会对气流组织进行专业的CFD模拟分析,机房内各处的温湿度应处在合理水平,但是在出现局部热点或者个别位置湿度偏高的特殊情况下,利用PDU附属功能模块可实现近距离及时探测,所以总体没有为全部PDU统一配置温湿度模块的必要性。其他附属模块同样也应根据实际使用需求和场地具体情况综合评估选配种类和数量。

2.6 PDU的组网与级联

智能PDU需通过网线实现组网管理,若采用每条PDU单独引网线直接连接至交换机的方式,不仅对交换机的需求量非常大,对网线的数量需求和敷设工作量也会成倍增加,所以一般采取“手拉手”级联的方式进行组网:使用1台智能PDU作为主机,3台智能PDU作为从机,通过网线将4台智能PDU串联起来即可将2台机柜的配电信息最终通过1条网线传输至交换机。通过级联方式可以串联多个机柜,但串联的机柜数量增加会使得监控信息更新时间变慢,且一旦串联路径上某个PDU出现故障,会导致后端PDU的信息无法上传,因此在智能PDU组网过程中应根据实际情况合理选择组网方式和级联数量。

2.7 PDU的插口数量不足问题

由于智能PDU每个插口都增加了电气参数采集模块,而且智能PDU集成的网口、USB口等硬件也占用了一定位置,所以智能PDU的电源插口数量比同长度的普通PDU要少,导致在当前IT设备普遍配置4路电源的情况下,机柜内智能PDU电源插口数量越来越紧张,甚至不得不配置“一拖二”电源线和插口转换电源线以满足插口数量不足的需求。

3 数据中心PDU技术创新

3.1 实现故障录波功能

当IT设备电源故障引发列头柜分闸开关跳闸使整条PDU停电时,若不能及时判定机柜内具体电源故障位置,只能先维持单路电源供电,存在一定的运行风险。智能PDU具备故障录波功能,可以将开关跳闸前每个电源插口的电压和电流波形进行记录,有助于及时精准判定故障点位,大幅缩短故障处置时间。在智能PDU已有信号采集硬件基础上,故障录波功能依靠软件改进即可实现。

3.2 采用信息安全防护技术

相较于普通PDU彼此独立没有互联互通的网络关系,智能PDU通过网线连接进行组网集中管理后就形成了一个局域网,可实现配电信息精细化管理,但这也带来了信息安全的挑战。大型数据中心数万条智能PDU组成的局域网应强化防病毒、防攻击、防控制的信息安全防护能力,通过增加防火墙、配置网络访问策略等措施提升信息安全防护水平。

3.3 整合智能PDU与列头柜功能

考虑到当前智能PDU通过网线进行组网方式的施工难度和施工成本,可以从供电侧进行技术革新:首先,保留智能PDU网口,仅作为设备调试使用;其次,智能PDU连接线在火线、零线和地线基础上增加1条信号线,监控信息通过信号线直接传输给列头柜,列头柜初步处理后上传给动环监控系统;最后,对配电柜的中央处理器进行升级,确保其可以满足十几条智能PDU监控数据的快速处置。按照这一思路将列头柜和智能PDU设备进行配套改造,省去交换机和网线配置,避免接入动环系统的二次开发,可大幅降低施工成本,减轻运维压力,提升数据中心末端供电管理的可靠性和安全性。

4 结束语

本文根据数据中心PDU使用现状对PDU选型过程中存在的问题进行了分析,从技术角度和管理角度综合提出了优选方案,并在PDU技术发展和功能完善方面提出了创新建议。另外,如何利用智能PDU采集的端口级数据进行数据发掘和深入分析也值得积极研究,供PDU设备生产商和使用者参考。

 

参考文献[1] GB 50174-2017数据中心设计规范[S].北京:中国计划出版社,2017.
[2] GB/T 513-2018数据中心基础设施运行维护标准[S].北京:中国计划出版社,2018.
[3]沈巍,丁聪,姜聿.色彩管理在数据中心设计中的应用[J].电信工程技术与标准化,2017(01):21-24.
[4] 邓军民,滕建,杜彬.数据中心机房管理与运维[C].第二十四届网络新技术与应用年会论文集:2020.
[5]陈烛彬.数据中心机房电源配置分析[J].中国新通信,2020(09):22-23.
[6]高林娥.基于神经网络的数据中心故障预测方法研究[J].智能计算机与应用,2020(05):10-12.
[7]连少华.数据中心机房监控系统的设计与实现[D].哈尔滨:哈尔滨工业大学:2020.
[8]孙桥.PDU在数据中心的应用及发展趋势[J].山东工业技术,2016(06):18-19.
Research on the Current Situation and Technological Innovation of PDU in Data Center
Xiao Xin
(CHENGFANG Financial Information Technology Service Co.,Ltd.)
Abstract: In view of some problems in the use of PDU in data center,this paper compares the optimal scheme of PDU equipment selection and deployment,and discusses the value of technological innovation such as increasing software function, strengthening information security and integrating hardware function.
Keywords: smart PDU; color management; compatibility; fault recording; information security;
1624 13 13
文字:     A-     A+     默认 取消