2025-09-15 23:58 广东
Q:液冷芯片方案冷却路径?GB200和300的冷却路径差别?A:单个GPU功率近1000瓦了,原来的风冷散热方案满足不了需求。全面转向液冷,微通道技术测试中。目前还是液冷为主,GB300用小的,GB200用大的液冷板。Q:液冷板大小区别?A:大冷板和单个水冷头区别。Q:200和300在冷板结构、通道、材料上有差异吗?A:大同小异,材料找的固定的人买的,流道增加散热面积在冷板内水冷头里完成热量交换再把热量带出去。Q:材料用的石墨烯和硅片?A:目前还是硅基为主,在测试端有用到石墨片,它把多层石墨烯石墨片叠加在一起,像切云糕一样,利用它石墨的那种单向导热性,用它来做新材料,石墨材料可以在测试环节多次的重复的使用,比较好进行自动化。Q:英伟达新出微通道盖板?A:微通道盖板是一个前端的技术,目前还是在测试验证当中,微通道它目前有三种方向,一种是像台积电推出的在芯片上面,用激光雕刻的办法去做出微通道,然后再用金属盖板形成一个流道,然后冷水进热水出,每分钟会有大概5~6升的一个水流量,通过这样一个大流量把热量带走。目前遇到大的技术挑战,水和金属接触,金属离子进入水中有短路风险,密封和芯片绝缘涂层要求也较高。普遍看法是3000w之上不得不用微通道;第二种是英特尔相对成熟技术,含用铟片来作为一种旱季焊料把微通道的金属盖板跟真正的芯片焊接在一起,因为带铟片的熔点比较低,而且它有一定的柔性能克服它;第三种是微喷射装置,不断的朝芯片表面去喷射液体,利用液体的流动蒸发来吸收热量,这种目前在研究,但是对于第二种的话,它成熟度要弱一点。微通道有几个技术难点,首先微通道非常细,零点零几毫米的宽度和深度;第二是洁净要求高,当下液冷对环境的要求和自身管控洁净度的要求,比如说是10万级,到了微通道,它的管控又要升级,又要更进一层,因为但凡一点点小小的灰尘都有可能会发生堵塞。Q:三种方案都没定?A:对,第二种小批量验证,在cooler master。Q:第三种现在主要谁在尝试?A:各大科研机构和高校,它有一个水路,然后保证热水进冷水出,然后在喷射的装置里面它有一些微控制阀,然后去实时的去监控芯片的温度,然后去控制流量。Q:国内案例?A:厦大。Q:精度上什么技术?A:激光雕刻。Q:目前主流方案?A:量产的300用水冷头。用铲齿工艺,在铜的表面上用铲子也产出一排排的细密的这种并列的齿,然后齿跟齿之间有一些流道,然后有一定的冷水,从一头进去另外一头出来,然后在这些流道之间做一个充分的换热。这个技术相当于空腔中用齿增大换热面积,相比于微通道它直径大很多,流量比微通道大。Q:GB200和300 tim材料不会太大变化?A:是的。Q:石墨烯对比硅片差异大吗?A:测出来相差不大,石墨烯单次成本高,但石墨片可以多次使用,方便做自动化设计。Q:rubin系列整体架构和材料?A:不会有根本性变化,都是用水冷头。液体金属方案在测试。Q:液冷版铜铝合金?A:铜为主,在应用端是极力避免铜跟铝在同一个管路上面的,因为铜跟铝之间它们是有电势差,有电势差以后,那就很容易产生这种加速的这种电化学腐蚀,这样就会对系统里面时间久了以后,系统里面可能会出现杂质,发生堵塞什么的,所以说基本上目前是用铜。Q:单独用铝方案?A:不大会,铝一般用在新能源行业,电池多一点。Q:供应商在材料里成本占比?A:一个gpu对应材料加起来10美金左右价值量。水冷头加周围管理,100美金/gpu价值量。大板子里有2个gpu一个cpu。Q:微通道从产业进展角度量产难度大吗?A:相当难度,它会有相当的难度,就刚刚才讲的,首先这个行业行业现有的产能要对现有的这种生产设备做一些升级换代,然后对这种生产工艺,对生产工艺也要重新去做一个梳理,来做一些优化。另外对这种焊接,谁能怎么样去把微通道焊接到芯片上,包括洁净度,精密度,能源的要求,设备的要求都是一个比较大的挑战。Q:单在一个区域里价值量?A:3000-5000美金价值量,一个托板/一层。Q:单个板在机柜里3w美金价值量?A:差不多。Q:一个液冷版里gpu的tim材料价值量是10x2=20美金?A:对的。Q:下一代价值量会提升吗?A:应该会有提升,但是它不会明显,因为功率增加了一点,它对应的材料的用量铜和铝会增加一点,但其实它本身它的工艺什么都是接近的,所以说它不会有一个非常很大的一个提升。Q:水冷头价值量为什么200美金这么贵?A:首先它对铜它材料它占有一部分,另外它有一些加工,然后后面还有涉及到一些焊接组装,然后还有一些的测试验证,测试验证另外一个厂商里面它有一定也抓了相当厚的利润。Q:微通道在别的地方有用到过这个技术吗?A:没有特别关注。Q:大陆和台湾/美国差距大不大?A:工艺区别,原理大家都懂。台积电他们可能做了三两年,他们手上也积累了很多的参数,比如说我接触到的一些大学研究机构,可能它只是基于一些几个样品的这样验证,这样对你的可能对数据的积累会有差异,然后再产业上比如说像台积电和英特尔他们他们做这个的话,已经有做过也一两年的这种单个样品的,然后拿小批量的,他在这个过程中也是经过多次反复出现各种各样的问题,然后再逐一去克服。国内这一块其实也有了,但我不知道比如说像华为公司他们做到哪一个程度了,他内部也是严格保密的,我相信他们也有在做这方面的研究。Q:微通道两种技术方案最终供应商会完全不一样?A:对,是这样的,就是说第一种我刚才一开始讲的第一种它落地的难度更大一点,因为它跟潜在的风险大得多,现在还在持续优化当中,像它有一个分界点,就是说3000瓦我芯片在发热功率在3000瓦以内,大家都不愿意去碰在量产中去用这种工艺,可能这2000多瓦用第二种方案也能解决了,大家觉得第二种方法在量产的,比如它的难易程度,它的可靠性会比第一种高得多。Q:铜的焊接技术头部公司?A:铜的水冷头的焊接,目前用钎焊技术,它其实也是通过做一个上下盖板的方式,用电焊的方式把它焊成一个整体。目前各家散热器厂商,比如说什么讯强,激活ABC他们都有自己他们自己买了焊接炉,在自己厂内焊接,然后有一些因为整个行业内产能是不够的,所以说尤其这种头也有也有找一些外发厂商来合作,基本上也是用的是钎焊的技术。
