“在 AI 算力爆发的时代,数据中心正经历着前所未有的电力考验。当单台 AI 服务器功率突破 10kW,GPU 瞬时负载波动超过 200A 时,电源保护方案也要随之升级。电子保险丝(eFuse)作为新一代保护器件,正凭借智能化、集成化优势,成为服务器电源的 “智能保镖”。日前,德州仪器系统经理游声扬结合TI的创新eFuse高集成产品,解析这一关键技术如何重塑数据中心的电力安全体系。
”在 AI 算力爆发的时代,数据中心正经历着前所未有的电力考验。当单台 AI 服务器功率突破 10kW,GPU 瞬时负载波动超过 200A 时,电源保护方案也要随之升级。电子保险丝(eFuse)作为新一代保护器件,正凭借智能化、集成化优势,成为服务器电源的 “智能保镖”。日前,德州仪器系统经理游声扬结合TI的创新eFuse高集成产品,解析这一关键技术如何重塑数据中心的电力安全体系。
数据中心电力保护的 “不可能任务”
现代 AI 数据中心,服务器机架正面临三大颠覆性挑战:
功率密度爆炸式增长:单机架功率从传统的 15kW 飙升至 100kW+,部分 AI 专用机架已向兆瓦级(1000kW)迈进。当 NVIDIA H100 GPU 集群启动时,瞬时浪涌电流可达额定值的 10 倍,传统保险丝根本来不及响应。
动态负载剧烈震荡:大语言模型训练时,GPU 负载电流以 50A/μs 的速率波动,传统保护方案无法精准捕捉异常,在负载突变时可能会造成误触发。
电压架构跨越式升级:为降低铜损,服务器电源正在从 12V 母线转向 48V,未来将迈向 400V 高压直流(HVDC)。这要求保护器件在承受更高电压的同时,实现更小体积 ——12V 时代的分立式方案在 48V 系统中体积将增大 300%,根本无法适配高密度机架。
一次意外短路就能让整个机架瘫痪,而排查故障往往需要数小时。因此,需要可靠的电源保护器件。
熔断型保险丝需人工更换,不能应对AI服务器7*24小时在线的要求,而传统分立器件构成的热插拔模块无论在体积、可靠性、成本等方面要逊色于集成方案,也就是本文的主角eFuse。
eFuse:重新定义电源保护的 “智能基因”
eFuse并非简单的 “电子版保险丝”,而是融合了功率控制、传感监测、逻辑决策的系统级方案。TI 的 TPS1685 等产品,更将其带入 “智能化 2.0 时代”。
eFuse是集成式电源保护开关,可在故障事件期间提供电压和电流保护。这些故障事件包括可能损坏下游负载的短路、过流、过压、欠压和温度异常。在短路瞬态事件中,流经eFuse的电流会迅速增加,此时eFuse会触发快速触发电流阈值,在 200 ns内终止电流的快速上升,从而保护电源。若输入侧 (VIN) 发生过压事件,eFuse会监测内部FET两端的电压,并箝位输出电压,直至输入电压降至过压阈值以下。eFuse还内置过温保护功能,当结温超过典型值 150°C 时,会关闭场效应晶体管。根据型号不同,eFuse会在结温降低后保持关闭状态 (锁断版本) 或尝试重启 (自动重试版本)。
eFuse还具备许多类似负载开关的附加功能,包括可调浪涌电流控制和反向电流保护。管理从有源电源总线到子系统的电流流动是一项具有挑战性的任务,当设备插入或移除带电电源时,初始电容充电过程中可能会出现巨大的电流尖峰。热插拔控制器可确保这些系统的安全插入和运行。不过与热插拔控制器不同,eFuse集成了场效应晶体管,可最小化整体解决方案尺寸,使其适用于电源多路复用等应用。通过使用两个eFuse,每个eFuse可控制一条电源轨,同时为各自的电源提供反向电流保护。此外,eFuse通过了 UL 2367 认证,可缩短系统测试时间。
eFuse 的核心是集成了 MOSFET 的智能开关,具备三重控制逻辑:
预限流保护:当检测到电流超过阈值(如 1.5 倍额定值),先通过动态调节 MOSFET 导通程度,将电流斜率控制在安全范围,从而降低启动浪涌。
短路极速响应:在输出端短路时,200 纳秒内快速关断。
热失控防御:内置温度传感器实时监测结温,超过 150℃时自动进入 “休眠模式”,待温度下降后智能重启。
常见的电源开关框架
如图所示,几种电路保护或者开关原件对比,此图为2019年制,如今TI已经将eFuse所支持的最大电压提升至80V,且最大耐受值达92V。
全场景保护矩阵:构建多维防护网
德州仪器最新推出的TPS1685x是一款集成式大电流电路保护和电源管理器件。该器件只需很少的外部元件即可提供多种保护模式,能够非常有效地抵御过载、短路和过多浪涌电流。
如图所示,从分立器件到如今的热插拔控制器+FET模式,再到TPS1685x高集成方案,整个系统尺寸从380mm2缩小到了30mm2,从而为高密度机架释放宝贵空间。
TI 的 eFuse 产品线针对数据中心需求,打造了立体化保护体系,游声扬总结了TPS1685x的优势如下:
准确快速地响应故障事件,确保系统可靠运行
集成式黑匣子用于记录故障
用户可配置过流消隐计时器,避免在出现峰值浪涌电流时误跳闸
主动的 Rdson 调节机制,可提高精度并优化并联器件之间的电流平衡
FET 安全工作区有保障,具备 FET 运行状况监测功能
游声扬特别提到了过流消隐计时器,由于GPU的动态负载比CPU更剧烈,所以常常会有过载的情况,面对这种瞬时过载,需要确保eFuse不能误触发保护。
另外,游声扬还提到了针对更高的功率负载,TPS1685x集成了电流传感器,可以确保并联时的电流平衡。“分立式的eFuse容易造成阻抗不匹配从而造成电流不均衡,而TPS1685x通过IMON引脚确保电流均衡。”游声扬表示。
革命性的数据中心保护措施
从传统保险丝的 “事后止损”,到 eFuse 的 “实时智控”,数据中心的电源保护正在经历一场静悄悄的革命。TI 的 TPS1685不仅解决了 48V 架构下的具体挑战,更预示着电力保护的未来方向 —— 更集成、更智能、更可靠。
当 AI 正在重塑人类社会的数字基建,数据中心的电力安全已成为技术竞争的核心战场。eFuse 技术的成熟,如同为数据中心装上 “智能心脏”,让兆瓦级电力系统的可靠运行成为可能。服务器的电源,不仅在能源的转换过程中需要管理,同时在能源的安全使用过程中同样需要管理。而eFuse,正是开启这场革命的关键钥匙。
分享到:
猜你喜欢