本站小编为你精心准备了数据中心环境管理研究参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
数据中心的各类基础设施为IT设备的可靠运行提供了必不可少的条件,例如提供了满足IT设备需求的温湿度、气流组织等环境条件。随着企业IT设备的不断增加以及云计算、虚拟化的应用,数据中心的环境管理要求变得越来越高,并且比过去具有更强的动态变化的特性。同时,数据中心的数量和规模也在不断扩大,正面临着日益严重的能源消耗问题。传统的数据中心环境监控/检测已越来越难以满足复杂、动态的环境管理需求。
1数据中心的环境管理与优化
数据中心环境管理的目的是为了满足IT设备对环境的要求,从这一目的出发,通常数据中心的环境管理会重点关注以下部分:温度环境管理:由于IT设备在工作时会产生大量热量,为了将电子元器件控制在合理的温度范围,必须对数据中心的环境温度进行严格的控制和管理。湿度环境管理:数据中心的湿度环境直接或间接地影响着机房的静电水平、结露风险、腐蚀速率等,这些因素都对IT设备工作的可靠性和寿命起着至关重要的作用。气流组织管理:由IT设备散发的大量热量必须通过适当的途径带出机房。对于目前绝大多数的数据中心,IT设备的发热量是通过空气气流被带到机房精密空调,再由空调系统带出计算机房,因此机房内的气流组织管理就变得尤为重要。
1.1数据中心的温度环境控制在数据中心的环境控制参数中,IT设备要求最高也是最严格的就是环境温度参数,因为环境温度的高低直接影响着IT设备工作的可靠性、运算性能、能源消耗、使用寿命等。(1)IT设备的温度环境要求目前,国内大部分数据中心使用GB/T2887《计算机场地通用规范》做为机房的环境控制标准。该规范要求A级数据中心的主机房在设备运转时温度:夏天为(24±1)℃,冬天为(20±1)℃。也有数据中心借鉴国际上较为通用的TIA-942《数据中心电信基础设施标准》,将机房温度控制在(20~25)℃。而ASHRAE(美国暖通制冷工程师协会)的《数据中心环境散热指南》中则建议数据中心的环境温度控制在(18~27)℃,并明确指出控制温度的测量位置应在IT设备的入风口处。当下很多数据中心的从业人员建议在我国数据中心国家标准层面对机房的温度要求也做类似于ASHRAE的温度范围(18~27)℃调整,但是数据中心作为一个综合性IT服务基础设施,其任何一方面变化都需要考虑全局变量的影响。如机房内的温湿度的升高、对服务器能耗的影响、环境温度的增加会引起服务器能耗的增加。如果服务器进风温度从15℃提高到30℃,则服务器的能耗预期增加4%~8%;如果提高到35℃则服务器的能耗预期可能会增加7%~20%。服务器环境温度的增加会引起服务器内部某些组件的性能发生变化,从而导致服务器性能的变化或设备故障。通常在设计上IT设备允许的最高环境温度上限余地很小,不建议服务器在超过其环境温度许可上限的环境下长时间运行,服务器的环境温度直接影响到IT设备的故障率。当提高数据中心机房温度时,应综合考虑设备工作的可靠性、能源成本、IT设备购置成本、故障对IT服务的影响等多重因素,为数据中心确定合理的运行环境参数。从GB/T2887、TIA-942和ASHRAE的标准都可以明显看出,数据中心的环境温度并非仅指机房内个别点的温度,当柜或机架采用冷热通道分离方式布置时,主机房的环境温度和露点温度应以冷通道的测量参数为准;当电子信息设备未采用冷热通道分离方式布置时,主机房的环境温度和露点温度应以送风区域的测量参数为准。为了更好地对机房温度进行控制和优化,需要全面了解机房温度的整体情况和具体分布状况。如图1所示显示了某数据中心的3D温度分布测量结果,可以从中计算出机房温度的分布范围、平均温度值、分布标准方差等,从总体上了解机房温度情况。通过对3D测量温度的进一步分析,还可以更多发现数据中心具体温度分布的规律和特点。如图2所示,可以通过不同的切平面观察不同高度、不同位置的温度分布,也可以根据测量数据画出温度等值线后,更方便地找到机房内的冷热区域或某些特定的温度分布位置。(2)温度环境的热点分析除了了解数据中心整体温度数据和分布外,更重要的是分析IT设备入风口处的温度情况。根据实际测量的温度场与机房中机柜和IT设备的位置关系,通过数学和图像信息的特定算法,可以提取出每台机柜在不同高度位置处的空气进出口温度,即所有IT设备的空气入/出口温度。有了IT设备的空气入/出口温度数据,便可以对IT设备的散热状况进行详细的定量分析,常用的分析方法有入风口热点分析、水平热点分析、垂直热点分析、RCI分析、进出口温差分析等。入风口热点分析是将所有IT设备的入风口温度进行统计分析,找出数据中心中IT设备入口温度偏高的数量和位置区域。入风口热点可以分为绝对入口热点(IHα)和相对入口热点(IHγ)两种。绝对入口热点的定义为:绝对热点因子反应了设备入口温度超过规范建议的程度,相对热点因子则反映了部分设备入口相对整体偏高的程度。除了数值描述外,更重要的是找出这些热点的位置,以便采取适当的改善措施。如图4、图5分别是该机房绝对热点和相对热点的位置,图中红色线条位置为发生入口热点所在机柜的位置。水平热点因子反应了机房内机柜平均入口温度分布的离散情况,水平热点因子越小,说明温度分布越集中,而落在水平热点因子区间之外的位置则分别是机柜整体入口温度偏低(冷点)和偏高(热点)的位置。机柜平均入口温度偏低或偏高,往往是由于提供的制冷量过剩或不足造成的。较合理的水平热点因子应控制在5℃以内,否则说明机房温度差异较大,不利于环境控制,也容易造成制冷能耗的浪费。垂直热点分析是对机柜在不同高度上的入口温度差异情况进行分析,因为是在不同高度上进行比较分析,所以将其称为垂直热点分析。垂直热点分析中用到的垂直热点因子(VH)定义为。对于很多IT设备机柜,随着高度的增加,入口温度成上升的趋势。及时发现这些垂直热点机柜和它的温度分布差异,可以很好地评估高度方向温度的不均匀性和产生原因。垂直热点往往是由于机柜顶部(或内部)热空气回流到冷通道造成的。通过适当的气流组织管理,可以很好地将垂直热点因子控制在1℃以内。
1.2数据中心的湿度环境控制较高的相对湿度容易使数据中心内的设备发生电气短路、磁带介质出错和电路腐蚀现象。在极端情况下,相对湿度过高还会使设备的冷表面出现冷凝现象,这对设备的威胁很大。较低的相对湿度将容易产生设备静电现象,造成元器件的击穿、短路等故障,甚至可能损坏设备,磁带和存储介质在低相对湿度下也会产生过度磨损,所以数据中心环境湿度应控制在合适的湿度范围内。《计算机场地通用规范》中推荐A级机房的湿度控制范围为40~60%。ASHRAE标准中推荐的湿度控制范围并未完全用相对湿度来定义,其湿度控制下限为露点温度5.5℃,上限为相对湿度60%。参照上文中提出的温度入口热点的分析方法,可以同样使用入口、水平、垂直三个维度的湿度分析。
1.3数据中心的气流组织管理IT设备散热是通过机房内的空气流动将设备发热量传输至精密空调进行换热,再通过精密空调以不同的形式将热量输送至室外,所以气流组织的管理对数据中心的环境温湿度控制尤为重要。目前,较多的数据中心采用架高地板下送风上回风设计,送风地板的使用是影响气流组织管理的关键因素。通过测量可用获得机房送风地板送风流量的统计分布情况和位置分布云图。从统计情况可看出平均送风量、送风量范围等信息,从送风量分布云图可以查找出送风量过剩或不足的区域。冷空气利用率越高,说明气流组织管理中的冷空气浪费量越少,理想的冷空气利用率为100%。偏低的冷空气利用率往往是由于走线开孔、地板缝隙等处的冷空气泄露造成的。通常机房如果对气流组织进行较好的管理,冷空气利用率可用控制在80%以上。
2数据中心的能源管理与优化
数据中心电能使用效率是行业内通用的衡量数据中心电能利用情况的指标。对于很多未采取适当节能措施的数据中心,约有50%或50%以上的能耗用在了非IT设备的外围基础设施上,而在这些基础设施中,能耗最大的是数据中心的制冷系统。制冷系统的能耗主要分为冷量输送能耗和制冷能耗两部分。冷量输送能耗主要消耗在冷媒的输送设备上,如精密空调的风机、水冷系统管路中的水泵等;制冷能耗则是指用于产生所需的冷量而消耗的能源,大多消耗在冷水机组或膨胀式空调压缩机上。制冷能耗的降低可以通过使用更节能的制冷技术,如直接或间接自然冷却,也可以在现有制冷系统的基础上通过设备设定参数的优化达到节能的目的。本文主要讨论实施较为方便的后一种节能方法。要在现有的制冷系统上做优化,首先要了解目前机房精密空调的工作性能和状态。最直接描述空调工作状态的参数是空调制冷利用率。当数据中心的空调制冷利用率较低时,可以适当关闭不必要的空调,这样可以大幅度地提高制冷利用率,并节约响应的能耗。节约的能耗由以下部分组成:关闭空调节约的对应风机的功耗;风机关闭的同时减少了机房的发热量,从而减少了相应的制冷能耗;部分空调关闭后,更容易使所有空调的送风温度保持一致,从而改善了制冷系统平均送风温度。在关闭不必要空调、提高机房制冷利用率后,如果通过热点分析,确定IT设备的入口温度仍有一定的余量,制冷系统的送风温度则可以进一步提高。有研究表明,制冷系统的送风温度每提高1℃,制冷能耗可节约5%左右。
3技术应用的实现手段
要实现以上的技术分析方法,其基础是获得数据中心真实、全面的环境和能耗参数,其中包括3D温湿度分布数据、送风地板送风量、空调工作状态参数、各设备/部件的耗电量等。对于能耗数据,可以使用供电系统中的电量仪或智能电表,也可以从部分设备上直接读取;对于温湿度、送风量等环控数据,可以从环控系统中部分读取,也可以采用人工的方法在机房中收集,但通过上述方式采集的数据量往往达不到模型分析的要求。如图6所示,移动测量系统能够很好地解决数据中心快速、大量环境数据采集的问题,该系统可以在机房内移动,并将布置在系统各层上传感器采集到的环境数据与位置信息对应起来,从而获得整个数据中心的环境参数分布情况。以金融行业某数据中心为例,机房安装有99台机柜,12台冷冻水精密空调。机房温度范围在(9~36)℃之间,IT设备入口处温度范围在(11.1~29.1)℃之间。通过上文介绍的热点分析,可以发现该机房存在入口温度超出(18~27)℃温度范围的入口冷/热点,并且整个机房入口温度跨度较大,在高度方向入口温度分布也不均匀,最大的垂直高度温差有7.1℃。通过对风量数据的分析,计算出该机房的冷空气利用率为79.6%,属于较合理的水平,但仍有进一步改善的空间。机房IT设备耗电量390kW,空调系统耗电量253kW,所以该机房的冷却效率为390/253=1.54,属于较低的水平,存在较大的能效改进空间。主要原因是由于机房的制冷冗余过高,导致平均空调的制冷利用率偏低,只有30%。在对测量数据进行分析后,根据分析结果对该机房进行了节能优化改造。优化的措施包括调整送风地板布局、封闭冷通道、安装机柜盲板、封堵走线开孔、关闭不必要空调、优化制冷系统设定参数等。优化后,机房的温度环境得到了改善,消除了设备的入口热点。由于关闭了不必要的空调,并对制冷系统参数进行了优化,所以制冷能耗也大幅度减少。在该项目中,关闭空调可节省风机能耗25.5kW,减少相应的制冷能耗5.7kW;对空调设定参数进行优化,适当提高空调送风温度,可节省制冷能耗16.5kW。所以优化后总共可以节约制冷系统能耗47.7kW,全年节电约417852。通过在数据中心的运维中对本文介绍的分析方法进行实际应用,可以有效治理数据中心的环境问题,如局部热点、气流组织等问题。针对问题采取有效措施,在确保安全运行的同时,可大幅度减少数据中心的运行能耗,尤其是制冷系统的能耗。在数据中心的运行维护中,可深入地应用数据分析模型,克服目前节能措施针对性与适用性亟待强化的不足,促进节能减排和资源综合利用从单纯的“绩效考核、能效要求”向“节能目标可实现、可测量、可衡量”转变,使节能措施更具针对性。同时,还应形成对数据中心进行能效、能耗、健康等方面的年度性检测,并且加强利用标准化手段推动数据中心节能技术创新的机制。
作者:刘宇 陈文鑫 高书辰 张林锋 单位:热领(上海)科技有限公司 国家电网公司信息通信分公司 工业和信息化部电子工业标准化研究院