其他分享
首页 > 其他分享> > Uptime ATD技术论文系列:连续制冷-翻译 孙长青

Uptime ATD技术论文系列:连续制冷-翻译 孙长青

作者:互联网

摘要
本技术论文阐明了Uptime Institute的Tier Standard:Topology背景下的连续冷却要求。 Tier IV是唯一需要连续冷却的等级。 但是,Uptime Institute建议在每个机架的密度超过4千瓦(kW)的情况下进行连续冷却,而不管等级如何。
连续冷却的作用
随着数据中心的电力密度不断增加,对持续冷却的需求变得更加迫切。在不间断电源(UPS)中断事件中失去冷却的风险和相关的影响可能对企业是灾难性的。IT设备可能出现故障或损坏。
根据设备中部署的冷却或UPS技术,连续冷却的要求可能会有很大的不同。本文阐明了连续冷却的定义,并详细阐述了各种冷却技术的部署注意事项。
连续冷却是指为关键的IT设备提供稳定的热环境而不发生任何中断的能力。持续冷却需要一个稳定的服务器入口温度,在任何冷却系统电源中断后,机械系统重新启动所需要的时间(包括转到发动机发电机的时间(如果适用))。它还需要对设计好的冷通道温度进行适当的维护。
保持一个稳定的热环境有助于减少UPS输出负载突然增加的情况发生。负载的增加可能是由于服务器风扇功耗的增加,以帮助弥补暂时的冷却损失。如果负荷管理不善,增加的负荷会使UPS超负荷运转,影响整个设备的运行。
美国供暖、制冷和空调工程师协会(ASHRAE)与主要IT设备制造商合作,制定了数据处理环境的热指南,其中包括推荐的计算机设备入口空气温度,以保证服务器、存储设备和网络设备的可靠运行。截至2015年,ASHRAE指南(接受全球)建议设备入口干球温度保持18-27°C(66 - 81°F) 之间,与露点温度9°C到15°C(阶等级°F)和相对湿度低于60%,以满足制造商的标准。需要注意的是,对于实际服务器入口温度,连续冷却的要求与ASHRAE指南无关。服务器入口温度遵循ASHRAE指南是基于组织个人需求的所有者决策。
然而,正常运行时间研究所的连续冷却要求与ASHRAE的允许变化率指南相联系,因为它涉及到一个稳定的热环境的定义。ASHRAE指南规定了IT设备入口温度的最大允许变化。磁带存储的数据中心(专门)典型的IT设备的最大允许温度变化是限制在每小时5°C。所有其他设备是有限的最大允许温度变化为20°C/小时。数据中心与任何类型的设备,ASHRAE限制了这种变化的速度在任意15分钟内5°C。需要注意的是,这不是一个变化率,而是一个离散的温度上下区间。

一个连续冷却的解决方案必须能够提供稳定的热环境,在整个机械冷却系统重启所需要的时间内。

这些参数在实际应用中有很多影响。举一个例子:
考虑一个带有冷通道密封的数据中心,其中冷冻水计算机房空气处理(CRAH)装置使用供气温度控制方法并且正常设定点为20°C。 如果控制死区设置为1°C,这意味着在正常操作期间,假设CRAH单元和IT设备之间没有空气混合,则设备将提供19-21°C的IT设备入口温度。
如果当设备向关键环境供应19°C空气时发生故障或市电功率损失,并且故障导致CRAH设备在其峰值处将其温度升高至24°C,那么入口温度不能在15分钟偏离19-24°C。这意味着如果设备在15分钟内恢复,则设备不能过冷到供气温度降至19°C以下的程度。
保持该温度范围需要密切关注用于指导CRAH单元冷却的控制算法。使用相同的示例,如果在恢复之前故障导致峰值供气温度为22°C,则恢复可以冷却至17°C,以便在任何15分钟的时间内保持在5°C的限制范围内。
还必须考虑恢复机械冷却所需的时间。虽然ASHRAE使用15分钟的周期来定义允许的最大温度变化,但是《标准:拓扑结构》还要求,在任何冷却生产中断或市电中断之后,连续冷却解决方案能够在机械冷却系统重启所需的整个时间内,提供稳定的热环境。机械系统重启时间,是从失去市电的时刻开始,直到发动机发电机(或其他现场发电系统)启动并关闭到关键负载,当机械系统恢复供电运行,并能在稳态运行条件下提供额定冷量。例如,在重新启动并运行正常供水和回水条件和流量之前,冷水机组不能算作正式运行。
虽然制造商正在减少设备重启时间,但是在确定穿越时间时,需要将功率损失与恢复系统产生稳定冷却的能力之间的间隔作为数据点。例如,如果在断电后恢复稳定的机械冷却需要10分钟,那么蓄冷罐(TES)必须能够提供10分钟的冷冻水储存。
虽然Tier IV是唯一需要连续冷却的Tier级别,但IT负载密度高于平均值的数据中心,应考虑,使用连续供冷来缓解由于公用电源或组件故障导致的大幅温度升高。作为参考,Uptime Institute进行了一次6千瓦/机架平均功率机房的演示。在冷却失效后,甚至仅仅在空气失去流动后,60秒内,计算机房内的进气温度,即超过计算机房规定范围的最高值。此外,该演示表明,1分钟的冷却损失需要20分钟才能恢复。

考虑市电断电的情况,在此期间UPS继续为IT设备供电,但机械设备运行中断。根据部署的冷却技术,这种中断可能会持续几分钟。在此期间,计算机房的任何温度升高都可能损坏IT设备。连续冷却提供了桥梁,使热环境保持稳定,直到机械或其他冷却系统恢复。正确设计的连续冷却解决方案可以防止平均服务器进气温度的任何增加。

连续冷却提供了桥梁,使热环境保持稳定,直到机械或其他冷却系统恢复。

应用连续冷却要求
T4是唯一需要持续冷却的等级。下面是一些实现连续冷却的方法示例。等级标准不是规范性的,而是提供基于结果和性能的标准,因此可能存在其他方法来实现在下面描述的基础上持续冷却的目标。
例1:
用于冷冻水系统的连续冷却通常利用TES能力(也称为冷冻水储存)来完成。二级泵和CRAH也需要安装在容错UPS电源上。电源可以是IT UPS或专用于机械系统的单独的,可并行维护和容错的UPS系统。如果冷却系统处于一次泵系统,则主泵需要安装在UPS上。此外,必须考虑蓄冷罐以及它们如何连接到冷冻水分配。根据罐与冷冻水分配系统的连接,可以混合供应和返回(因此更温暖)的冷冻水,从而可能减少冷冻水储罐可以为IT设备提供稳定的热环境的时间。
例2:
直接膨胀(DX)系统的连续冷却,要求计算机房空调(CRAC)和外部冷凝器在可同时维护和容错的UPS系统上。此外,DX系统可能需要一些额外的工程分析来满足连续冷却要求。在CRAC正常运行期间压缩机循环可使压缩机暂停运行几分钟以保护压缩机。在高于平均密度的环境中,这些间隙可能在正常操作期间和故障期间失去公用电力,引起大的温度波动,使得稳定的热环境更难以实现。

例3:
对于蒸发系统(如直接蒸发式或间接式蒸发式热交换器)的连续冷却,需要水泵(二次或系统循环)和分配风扇在容错UPS电源上。
例4:
对于可以全年提供冷却的100%外部空气系统的连续冷却要求风扇(或将空气输送到计算机房的系统)安装在容错UPS电源上。
当转轮式UPS系统作为IT UPS部署(转轮式UPS应该是处在柴发上),并且冷却系统位于不间断总线上时,可能不需要额外的连续冷却措施,因为机械系统在从公用设施到发动机 - 发电机的转换期间不会出现中断(或其他现场电力。如果冷却水系统与没有电池的旋转式UPS一起部署,则现场必须证明如果没有安装TES,平均服务器入口温度不会超过之前规定的限制。应对每个具体案例进行审查,以确保在失去电力事件期间满足对稳定热环境的要求。

鉴于设施及资讯科技资产可能受损,持续冷却对任何平均密度在4千瓦以上的设施来说,都是合理的保障。

结论
通过在冷却系统的任何中断期间为IT环境提供热稳定性,例如从公用事业中断到发动机 - 发电机功率的过渡,连续冷却确保公用事业不会导致对IT硬件或关键设备的高成本热损坏, 也不要将UPS输出负载增加到过载点。 连续冷却仅是Tier IV认证的要求,但对于设施和IT资产可能受到的损害来说,连续冷却对平均密度超过4 kW的任何设施都是合理的保障。

修改
ATD技术论文系列:连续冷却,版本b。本版本的所有更新均于2017年10月生效。
相关的出版物
拓扑等级标准:
认证级设计师技术论文系列

对正常运行时间研究所
Uptime Institute是一个公正的咨询组织,致力于通过创新、协作和独立认证来提高关键业务基础设施的性能、效率和可靠性。
Uptime Institute通过行业领先标准、教育、对等网络、咨询和向企业组织和第三方运营商、制造商和供应商提供的奖励计划,为负责IT服务可用性的所有利益相关者提供服务。Uptime Institute是全球公认的数据中心设计、建设和运营可持续性一级标准和认证的创建和管理机构评论,FORCSS®方法,有效的认可。

标签:Uptime,ATD,ASHRAE,长青,冷却,连续,设备,UPS,温度
来源: https://blog.51cto.com/14514357/2435016