冷负荷计算确定了数据中心需要多少冷量,但冷量本身并不能直接转化为IT设备的有效散热,数据中心空气管理,或者说冷热通道与气流组织的设计,是解决“冷量如何送到设备”这一问题的关键技术。
一、为什么空气管理比制冷主机更重要
在数据中心制冷系统中,制冷主机的能效决定了“产生冷量的效率”,而空气管理决定了“冷量利用的效率”。一台能效比6.0的冷机配合良好的气流组织,其实际散热效果可能优于能效比7.0的冷机配合糟糕的气流组织。
气流组织失效的后果是直接的。冷热空气短路是最常见的问题——空调送出的冷风未经IT设备直接返回空调回风口,导致服务器入风口温度远高于空调送风温度。据实测,在未进行通道封闭的数据中心中,冷热空气短路可导致空调送风温度与服务器入风口温度的差值高达5至8℃。这意味着空调需要将送风温度额外降低5至8℃才能满足服务器需求,而送风温度每降低1℃,冷机能耗约增加2%至3%。
热点是另一个突出问题。由于气流分布不均,同一机柜不同高度的服务器入风口温度差异可达10℃以上,机柜顶部的服务器可能因过热而宕机,而底部的服务器却在过冷状态下运行。为解决热点,运维人员往往采取全局降低送风温度的粗暴手段,进一步加剧了能耗浪费。
因此,一个在行业内被反复验证的结论是:在数据中心制冷设计中,气流组织的合理性往往比制冷主机的能效更重要。优化的气流组织可以在不增加冷机能耗的前提下,将服务器入风口温度降低3至5℃,或将现有制冷能力下可支撑的机柜功率密度提升30%以上。
二、冷热通道的基本原理
冷热通道分离是数据中心气流组织的原则。这一原则的物理基础非常直接:空调送出的冷风应先经过IT设备、吸收热量后变为热风,热风应返回空调进行再冷却,冷热风不应在路径中混合。
在传统的机房布局中,机柜采用“面对面、背对背”的排列方式。机柜正面(进风口)朝向冷通道,机柜背面(出风口)朝向热通道。空调布置在机房两侧或采用地板下送风方式,冷风从冷通道地板上的送风口送出,服务器风扇将冷风吸入机柜,热风从机柜背面排入热通道,终返回空调回风口。
这一布局的巧妙之处在于:冷通道内全部是冷风,热通道内全部是热风,冷热风在空间上被机柜列自然分隔。只要冷通道与热通道之间没有直接的开放路径,冷热空气就不会短路混合。
然而,在实际运行中,机柜之间、机柜与地板之间、机柜顶部与吊顶之间的缝隙,都会成为冷热空气短路的通道。这正是通道封闭技术要解决的问题。
三、冷热通道封闭的三种典型形式
通道封闭是在冷热通道分离的基础上,通过物理围挡将冷通道或热通道与机房其他空间隔离,从根本上杜绝冷热空气短路。
3.1 冷通道封闭
冷通道封闭是目前主流的方案。做法是将两排机柜面对面之间的冷通道顶部和两端用透明门板封闭,形成一个密闭的冷空间。空调送风直接送入封闭冷通道内,通道内保持正压,冷风被服务器风扇吸入后,热风排入开放的机房空间,终返回空调回风口。
冷通道封闭的优势在于:封闭空间体积小,冷量集中,可以支撑较高的机柜功率密度(通常8至15kW);服务器入风口温度均匀,温差可控制在2℃以内;对现有机房改造友好,只需在冷通道内加装封闭组件,不改变原有空调回风路径。
冷通道封闭的局限在于:封闭通道内的人员工作环境较差,冷风直吹可能造成不适,需要配备防护装备;通道两端需要设置消防联动门,在火灾时自动开启以满足气体灭火系统的要求;对于功率密度超过15kW的场景,冷通道封闭可能不足以解决机柜顶部与底部温差过大的问题。
3.2 热通道封闭
热通道封闭是将机柜背对背之间的热通道进行封闭。空调送风送入开放的机房空间,冷风从机柜正面吸入,热风排入封闭热通道,热通道内的热风通过吊顶或管道返回空调回风口。
热通道封闭的优势在于:人员工作区域(冷通道)环境舒适,运维体验好;热通道内温度较高(可达35至40℃),有利于提高空调回风温度,从而提升冷机能效(冷机能效随蒸发温度升高而提高);消防安全性较好,因为热通道内没有人员常驻,火灾风险相对可控。
热通道封闭的局限在于:封闭空间体积大(整个热通道),对密封性要求更高;空调送风需要覆盖整个机房空间,冷量分布不如冷通道封闭集中;对于功率密度较低的场景,可能存在冷量浪费。
3.3 全封闭(机柜级密封)
全封闭方案将冷热通道同时封闭,形成一个完全隔离的气流循环系统。空调送风直接送入封闭冷通道,服务器吸入冷风后排入封闭热通道,热通道内的热风通过管道或静压箱直接返回空调回风口,与机房环境完全隔离。
全封闭方案的优势在于:气流路径完全受控,冷量利用率接近100%;可支撑极高的机柜功率密度(20kW以上);对机房环境温湿度要求降低,可节省机房空调能耗。
全封闭方案的局限在于:实施成本比较高,需要定制化的密封组件;运维复杂,进入机柜区域需要通过多道门;消防设计困难,封闭空间内气体灭火剂难以均匀分布。
3.4 方案选择建议
不同功率密度场景下,通道封闭形式的选择有明确的分界线。
机柜功率密度3至6kW时,可以不进行通道封闭,依靠合理的机柜布局和充足的空地比即可满足散热需求。但即便如此,采用冷通道封闭仍有助于降低风机能耗。
机柜功率密度6至10kW时,冷通道封闭是经济有效的选择。这一区间覆盖了绝大多数企业数据中心和托管机房。
机柜功率密度10至15kW时,冷通道封闭仍可适用,但需要配合更高的送风风量和更精确的气流组织设计。部分项目开始转向热通道封闭。
机柜功率密度15kW以上时,热通道封闭或全封闭成为必要。同时需要考虑从房间级制冷向行级制冷或液冷过渡。
四、气流组织的关键参数
气流组织的设计效果通过一系列关键参数来表征和控制。
4.1 送风温度与回风温度
送风温度是指空调出风口的空气温度,回风温度是指空调回风口的空气温度。两者的差值反映了空调从机房中移除热量的能力。
GB 50174推荐的送风温度为18至27℃,回风温度不高于40℃。ASHRAE(美国暖通空调工程师学会)推荐的送风温度范围为18至27℃,A1级服务器允许的进风温度上限为32℃。
送风温度的设定需要权衡。提高送风温度可以提升冷机能效(每提高1℃,冷机能效提升约2-3%),但过高的送风温度可能导致服务器风扇转速增加、噪音和能耗上升。实践中,22至24℃是较为平衡的送风温度选择。
4.2 风量与压差
风量决定了单位时间内送入机房的冷空气总量。所需总风量可按以下公式估算:
总风量 = IT设备显热 / (空气密度 × 空气比热容 × 送回风温差)
以300kW IT负载、送风温度22℃、回风温度32℃(温差10℃)为例,所需总风量约为300×1000 / (1.2 × 1.005 × 10) ≈ 24,900 m³/h,约相当于每千瓦IT负载需83 m³/h风量。
压差是驱动空气流动的动力。在地板下送风系统中,地板下静压是控制参数,通常要求保持在30至60Pa之间。静压过低会导致送风量不足,静压过高则可能造成地板起拱或冷风分布不均。
在封闭冷通道中,通道内外压差通常保持在5至15Pa的正压状态,确保冷风不会从缝隙逸出,同时热风不会倒灌。
4.3 气流分布均匀性
气流分布均匀性是衡量空气管理质量的关键指标,通常用同一冷通道内不同机柜入风口温度的极差或标准差来表征。优良的设计应使温差控制在2℃以内。
导致气流分布不均的常见原因包括:地板送风口开度不一致、地板下存在线缆或管道阻碍气流、机柜内设备填充率差异大、以及空调布置不对称。
五、典型问题与解决方案
问题一:机柜顶部与底部温差过大。 在高功率密度的冷通道封闭方案中,由于冷风从地板送出,底部服务器吸入冷风后温度升高,顶部服务器吸入的已经是经过底部加热的空气。这一现象称为“温度分层”。解决方案包括:增大送风风量以降低温差;采用行级空调缩短送风距离;在机柜内安装盲板,防止热风在机柜内部回流。
问题二:空调送风距离过长。 在大型机房中,远离空调的机柜可能出现送风不足。解决方案包括:采用分布式空调布置(如行间空调替代房间级空调);优化地板送风口布局,将更多送风口布置在远端区域;采用高架地板静压箱设计,确保地板下压力分布均匀。
问题三:电缆和管道阻碍送风。 地板下线缆杂乱无章会严重阻碍送风通道。解决方案包括:采用架空地板时设置的线缆槽道,避免线缆散落;在送风路径上预留足够的气流通道;采用吊顶走线方式,减少地板下线缆。
总结来说,空气管理是数据中心制冷系统从“有冷量”到“有效散热”的桥梁。冷热通道分离与封闭是这一领域基本也是的技术手段。从冷通道封闭到热通道封闭再到全封闭,不同方案对应着不同的功率密度和投资预算,设计人员需要根据项目实际情况做出合理选择。
来源:机电空间
弱电工程