-40℃~70℃,挑战边缘服务器环境适应极限!
-40℃~70℃,挑战边缘服务器环境适应极限!没有什么事情是不可能的,不可能的意思,就是“不,可能。”刚刚过去的今年夏天格外炎热,中国多地最高气温超过40℃
没有什么事情是不可能的,不可能的意思,就是“不,可能。”
刚刚过去的今年夏天格外炎热,中国多地最高气温超过40℃,令很多人心有余悸。但很多人并不知道的是,并非血肉之躯才有环境极限,钢铁之躯的智算设备也有。面对户外夏季70℃的极热、冬季-40℃的酷寒、雷电暴雨和大漠风沙的“魔法攻击”,如何保证安放在各种边缘环境下的服务器能正常运作不会停摆?
作为中国边缘服务器市场第一的厂商,浪潮边缘服务器的研发工程师跟极限环境“硬刚”,硬生生是把“不可能”变成了“不,可能。”
▌一群不停“找虐”的人
就像旅人们热衷于追逐美景用脚步丈量如画山河,边缘服务器的产品经理也步履不停地去寻找各种极限环境主动“找虐”并“宣战”。
边缘计算,简单来说就是指在靠近数据产生的一侧,采用网络、计算、存储、应用核心能力为一体的平台,就近提供服务。简单打个比方,每天路上的交通摄像头、工厂里的高端制造设备等等会产生巨量的数据,而且越来越复杂,协同程度也越来越难,如何“就近”处理这些数据,然后进行云边协同,提升大数据计算效率,就是边缘计算服务器要做的。
做到海量计算不难,难的是,怎样能让这些边缘智算设备在各种极限环境下也能扛起重任,稳定在线。与数据中心常年恒温恒湿的环境不同,边缘计算的场景复杂多样,这些看上去并不起眼的边缘设备,需要放置在城市路口的信控箱、电信机房、油井现场的控制箱、边缘电气柜、工业现场控制柜、车载等等各类恶劣的环境中。这类环境有的空间狭小常年闷热逼仄,有的却要经历雨淋雪埋沙尘漫卷,这样的环境对边缘服务器的环境适应性、算力性能都提出了很高的要求。
比如在智慧路口,边缘设备需要放置在几乎密不透风的信控箱中,一些南方城市夏季最热的时候,信控箱内部最高温度能达到60-70度。而从一般路口几路视频,到复杂道路路口的20路视频,对边缘算力的需求不断提升,这就导致设备的功耗也在提升。而因为室外粉尘过重、空气中的水蒸气、酸性气体、微生物也会侵蚀服务器内部元器件,设备不能用传统的风扇设计,这让散热设计面临很大的挑战。
用脚做调研,用心做设计。浪潮信息产品研发人员们在最热的夏天打开过三亚路口的信控箱,在极寒的天气里勘察过漠河油田的服务器,专门去找让服务器极度“不适”的场景。服务器在雷暴中要能扛住多大的雷击,在阴雨连绵中需要达到怎样的防水等级,这些都需要“技术猿”们亲自到达现场,以此在服务器上岗前完善设计,确保它们能“扛住”边缘环境的重重挑战。
▌一块三明治触发的灵感
散落在各个地方各种环境下的的边缘服务器,是智算力延伸到数字世界各个角落的末梢神经元,需要练就钢筋铁骨。而极端高温下的散热,是钢筋铁骨也不能承受之重,更是横亘在研发人员面前的拦路虎。产品经理在实地勘察后敲黑板划出重点:边缘服务器必须保证在70℃的高温下也不会罢工。但反复实验改进下的边缘服务器,仍然差了那么一点点意思。
在户外场景,边缘服务器散热设计的方向是,通过无风扇设计,让设备和环境之间的热量通过热对流和热辐射传递到空气中。在边缘服务器内部,CPU一旦高速运作,温度最高可达90℃,要让90℃高温快速传导到大约70℃的环境空气中,就需要在散热上盖和热源之间增加高导热系数的导热材料,让热量快速传递出去,工程师们做了很多尝试,却始终无法突破60℃的散热极限。
与70℃“死磕”却求而不得,让技术研发一度陷入了僵局。转机来自于一块加班中用来充饥的三明治。
一层层食材叠加的灵感,启发工程师们将服务器散热上盖底部压铸出导热凸台,通过导热凸台与导热界面材料、热源部件依次贴合的结构,可以排出热源上方的空气,大大消除内部界面热阻。
从上到下,散热盖、凸台、界面材料、热源这一酷似“三明治”的结构中,还针对边缘服务器的百变需求,设计了不同的铝挤工艺上盖,让导热凸台、界面材料的位置、大小随着内部器件的变化而变化,实现产品的灵活百变和高效散热。同时,研发人员还发现,界面材料厚度的微小差异,都会影响散热的效率,据仿真模拟数据显示,材料厚度缩小0.6毫米,CPU的温度就可以降低2.1℃,因此,需要在CPU、内存等等部件凸台最小结构公差下,设计出最小厚度的界面材料。
经过多次仿真和实测,研发人员最终采用高导热和高压缩性的界面材料和凸台填充在热源与散热外壳之间,导热效率达到10W/m·K,是空气导热效率的435倍,让服务器适应的极限环温从原来的60℃提升到67℃。
还差了最后的3℃,努力仍在继续。
除了提升内部的热传导效率,散热工程师还要考虑设备与环境之间如何进行高效的导热,才能实现极限环境的适应。研发人员结合热仿真软件对多组参数组合进行对比分析,并绘制响应面优化曲线,最终确定出一组关于鳍片厚度、间隙和高度的最优组合,在有限体积内形成超过3000cm2的散热面积,达到了最佳散热能力。
同时,为了进一步减小上盖散热器内部的扩散热阻,散热上盖中设计了2D热管网络,热管走向经过反复优化仿真,精准布局,有效规避局部热点的产生,提升整机均温能力。
终于,一台在无风条件下,70℃极限环境也能高效运转的边缘服务器横空出世,站上C位。据研发测试,在无风扇的边缘服务器上,三明治架构可将被动散热能力较上一代产品提升近100%。
▌一份智造的极致匠心
适应所有不适应,让小的积累构成大的改变,浪潮信息研发员们精工细作的服务器远不止解决了散热这一痛点。
边缘服务器无限靠近数据产生的第一现场,不仅可能面对极热的环境,还会有极寒、风沙、尘土、雷击等等恶劣场景,每一类场景都需要进行针对性的设计,以保障服务器的稳定运行。例如在东北油田,考虑到一些低温条件下电子设备难以启动的情况,边缘服务器设计了低温热启动装置,当环境温度低于-40℃时,自适应调节系统会加热服务器,让内部每一个芯片满足温度要求后再开机启动。
另外,很多边缘服务器会被放置于高山塔、深山灯等环境中,研发人员就在寸土寸金的边缘服务器中,塞进了一个远程运维管理模块,让运维人员可以远程勘查设备,大大减少了人力运维成本。
书痴者文必工,艺痴者技必良。很多事情并不是看到了希望才去坚持,而是因为坚持才有了希望,正如研发工程师追求极致智造的匠心。每一处微小的设计,都是基于边缘场景做出的最适改变,不啻微芒终能造炬成阳,浪潮信息研发人员的不断创新,为更多场景提供安全、稳定的极致边缘算力创造了可能,也为云边协同的不断破圈缔造了希望。