|
||||||
|
|
|
在 NVIDIA GTC 2025 大会上,台湾技嘉展位上展示了许多炫酷的系统。其中两款重磅产品是 GIGAPOD 和 NVL72 机架式系统。GIGAPOD 将 NVIDIA HGX 平台集成到一个带有液冷功能的机架中,适用于预配置的高密度机架。当然,NVIDIA GB300 NVL72 则是下一代高端机架式系统。为此,我们对 GigaPOD 和 GB300 节点进行了简要介绍。
技嘉 GIGAPOD 技嘉 GIGAPOD 的理念是,该公司将高密度 AI 机架作为完整的解决方案出售。略有不同的是,技嘉同时提供液冷和风冷两种选择。
液冷型号是技嘉 G4L3-SD1。添加液冷功能使这款机型与众不同。它不再采用高大的散热器,而是采用了散热板和散热管。
冷却板由 CoolIT 制造,看上去非常光滑。 技嘉GTC25 Gigapod液冷04
技嘉GTC25 Gigapod液冷06 液冷的优势在于省电和高密度。通过使用冷却板代替散热器,机箱高度可以仅为 4U,从而实现极高的密度。
将底部 CPU 托盘拉出,我们可以看到前面的 I/O 以及 SSD 和 DDR5 插槽。
技嘉还拥有与系统配套的液体冷却歧管,并且具有适合这种集配置的正确数量和尺寸的连接器。
技嘉 NVIDIA GB300 NVL72 计算节点
在前面,我们得到了 E1.S SSD 以及与 BlueField-3 DPU 一起进行液体冷却的能力。
然而,最引人注目的是计算托盘上的 GB300 CPU 和 GPU 组合体。它们全部采用液冷。
CPU、GPU、NIC 等液体冷却组件非常多,因此有一个用于冷热连接的大型内部manifold。
在后面,有导销、电源输入和 NVLink 电缆连接器。 当然,这样的设计使得 18 个计算托盘可以与 NVLink 交换机托盘、CDU 和电源一起安装,从而创建一个 GB300 NVL72 机架。 Gigapod 同时提供风冷和水冷两种选择,这是许多供应商尚未采用的。技嘉不出售单独的系统,也不只销售风冷或水冷系统,而是同时提供这两种选择。许多组织根本没有足够的功率密度来处理当今的 4U GPU 计算服务器,因此他们使用风冷服务器也无妨。除此之外,能够看到用于 PCIe GPU 的 MGX 平台和 GB200 NVL72 计算托盘也是一件令人欣喜的事。这四个系统结合在一起,可以覆盖广泛的 GPU 计算场景。
人工智能(AI)盛世的致胜关键,是透过先进冷却技术帮AI服务器解热,确保机台稳定运作,并且发挥芯片最大算力。技嘉科技是服务器及服务器解热方案的指标性品牌,所推出的直接液体冷却(DLC)和浸没式冷却产品,技嘉的液体冷却服务器产品线从单纯的「产品」,摇身一变成为「All -in-one全方位解决方案」,协助客户掌握突破性算力及先进冷却技术,在AI浪潮下立于不败之地。 直接液体冷却带来长远效益,成为业界主流选择
问题:依你们的观察,IT客户导入液体冷却的脚步,这几年为什么有加快的迹象? 回答:液体冷却需要一些空气冷却用不上的元件,包括水冷循环板(cold plate),将热能从服务器的零组件,例如CPU与GPU,传输到冷却液当中;密封管线,或称封闭式冷却回路(cold loop),将冷却液导入和导出服务器机台;液冷防护感测板(leak sensor board),用来侦测冷却液是否外漏;机架冷热水通道分歧管(rack manifold),将密封管线连接到冷却液分配装置(CDU);而CDU本身则是负责排热,可能安装在机柜上方或下方,亦有可能安装在机柜以外,一台大型CDU可帮一整排液冷机柜进行散热。 上述元件当中,水冷循环板和机架冷热水通道分歧管的选择,和服务器机种有直接关联,因此需要新设计与开发,料件生产及品质可靠度的验证都需要时间。 CDU虽然是共用机种,但料件生产交期及安装测试也需要时间,这些都是开发和导入液体冷却方案时必须评估的准备工作。 尽管如此,IT业界还是积极导入液冷,因为液冷有三大好处:一、提高TDP与运算密度,为服务器带来更大算力;二、改善电力使用效率(PUE),减少机房碳足迹,达到绿色运算的理想境界;三、长期下来降低机房营业费用(OpEx)与总体拥有成本(TCO),尤其在生成式AI与高效能运算(HPC)盛行的当下,处理器厂商纷纷推出算力超前、用电和排热也相对可观的超级运算芯片,因此客户购入AMD Instinct? MI300系列加速器、Intel? Gaudi? 3加速器或NVIDIA Hopper/Blackwell加速器的同时,也会评估导入先进冷却技术,让顶级芯片发挥最大功效,加强AI资料中心的投资报酬率。
以客为本的核心主轴,是掌握客户实际需求 问:技嘉液体冷却解决方案,最首要的「以客为本」产品策略为何? 答:导入液体冷却需要克服不少技术上的门槛,因此,技嘉为了开发全方位的解决方案,不仅钻研科技研究与产品设计,还投入很多时间与客户沟通,确保百分之百了解使用者的实际需求。 根据与客户的沟通,我们会配合客户需求、电力限制、空间限制和希望达成的算力目标,开始重新设计整体的资料中心,从限制条件展开可选用的技嘉DLC服务器,以及攸关服务器配置、机房供电与散热方案的各种不同选项。唯有透过这样的来回、协商与确认,我们才能确保PUE的优化及整体效益的最佳化,给我们客户完善与全面性的机房设备升级。 完成这一步,我们才会进行到下一个阶段,开始为客户量身打造最合适的液体冷却解决方案。
设计力与制造力,是建造完美液冷方案的必备条件 问:技嘉液体冷却的第二个「以客为本」产品策略是什么? 答:刚才提到,水冷循环板的设计因服务器机种而异,而技嘉的长处,就是依照客户需求提供弹性选择,例如针对CPU、GPU和记忆体,水冷循环板都会有不同的配置,使用不同芯片或芯片的layout,也有不一样的对应方案。技嘉有能力整合各家厂商的水冷循环板产品,也能自己投入产品设计与生产,我们根据芯片属性提供客制元件,才能贴紧客户的需求。我们用这个案例来说明打造全方位DLC解决方案的第二个产品策略:我们必须掌握设计力与制造力,才有办法解决问题,让客户在技嘉得到别的地方找不到的完整服务。技嘉不会要求客户配合我们,是我们要尽量follow客人。我们再用机架冷热水通道分歧管来举例。分歧管的设计,重点是品质稳定,平衡供应冷却液,但除此之外,技嘉也针对不同空间配置提供客户多元的选项,分歧管可以装在机柜前侧或后侧,甚至可装在服务器机台内,技嘉采用不锈钢金属及100%防漏快速拆卸接头,让工作人员能快速针对单一节点进行维护,多通道平行设计则有助于加强散热功效。液冷防护感测板是另一个以客户为中心的设计,不幸遇到冷却液泄漏时将会立即发出警讯,通用于不同服务器机种,并且易于安装,可改善风险控管,提升资料中心导入液冷的安全性,协助客人解除采用先进冷却技术的心理障碍。全盘掌握客户需求,也有助于技嘉开发产品,例如我们自家设计的DLC机柜,可搭配前侧或后侧安装的分歧管布建,并弹性提供尺寸选择,从22U(22机架单位)「半柜设计」的DL90-ST0液冷机柜,解热功效达14.5kW,到支援四座配电装置(PDU)的大电流全机柜产品,结构强度稳定且提供L11出货模式。 AI飞跃性成长的当下,技嘉推出整合式丛集运算解决方案GIGAPOD,也是藉由液体冷却造就颠覆性的运算密度与超级算力,适合巨量参数规模的人工智慧训练与人工智慧推论工作,是结合AI与先进冷却技术的巅峰巨作。 技嘉科技不仅提供DLC产品,还帮客户准备全方位的解决方案,服务范围至小是单一服务器,至大是整座服务器机柜,或是由多数机柜组成的运算丛集,让不同规模的企业级客户,都能在技嘉找到合适的total solution。
发挥价值链管理,才能确保客人拿到顶尖IT产品 问:第三个「以客为本」的产品策略是什么? 答:技嘉掌握强大的研发力、设计力与制造力,只不过在液体冷却领域,每位客户的需求都不一样,适用的解决方案也有所不同。因此,技嘉携手领先业界的合作伙伴,用最短时间将最理想的产品组合送达到客户手上;技嘉所拥有的制造力与整合力,也有助于加快解决方案交期,并且节省费用。举例来说,我们采用业界龙头史陶比尔St?ubli的快速接头,不仅稳定性高,同时拥有高度弹性,可自由搭配认证品牌之零组件。我们和冷却液分配装置的代表性品牌台达电、Motivair及nVent合作,伙伴供应的高密度、高效率散热设计,让一座4U规格的CDU足以协助装满GPU协同运算服务器的一整座机柜解热。依照客户需求,技嘉可将CDU安装在机柜上方或下方,还可以调整分歧管的位置。 CDU的挑选、安装与服务,都是技嘉提供完整data center solution的一部分。可想而知,整合不同厂商生产的水冷循环板、分歧管和CDU等元件,不是一件简单的事。技嘉是直接面对客户的国际性服务器品牌,因此要扮演价值链管理者的角色,选择料件皆由技嘉定义使用相容控管,例如快接头及密封管线的材料选择,须由技嘉主导才可避免冷却液与元件不相容所导致的腐蚀问题。唯有严格控管品质,才能拍胸脯向客户保证会拿到最高规、最顶尖的IT解决方案。每个月,技嘉和供应商举办数次会议,讨论产品设计、品质管理等各项议题,透过价值链上下游的沟通与管理,确认液冷系统符合业界最高标准,同时推进DLC解决方案的顺利制造、安装与运作。 技嘉全方位液冷解决方案,让散热问题迎刃而解
问:完成以上三步骤,液冷解决方案的布建是否终于大功告成? 答:设计、生产及检验DLC解决方案之后,还要将其安装在客户的资料中心或是服务器机房,透过定期服务与贴心的客户支援,确保客人对技嘉产品感到百分之百的满意。技嘉有完整data center设计与安装经验,如先前提到,我们会针对需求提供适当的解决方案,并透过与多家配合厂商的合作,支援各区的安装、服务与支援。如果客人在使用上碰到状况,不但能向技嘉的R&D和FAE团队求助,技嘉也是串联各家供应商的主体,能在第一时间找到对应窗口,让客户沟通更有效率,即时满足客户需求。唯有在液体冷却解决方案安装完成,顺利开始运作之后;唯有在解决所有问题,客人向我们点头的时候──我们才敢说,专案已经大功告成,我们又新增一则为客户顺利部署先进冷却技术的成功案例!
|
|