开yun体育网因为国内有许多GPU厂商-开云「中国内陆」官方网站 更高效、更智能、更环保
跟着大模子参数鸿沟迈向万亿开yun体育网,算力集群跑步进入千卡、万卡协同期代。
从英伟达前年重磅发布NVL 72超节点处分决策,到华为本年高调推出CloudMatrix 384,“超节点”火了。用网罗才智将稠密芯片高效贯串、协同责任,以集群性能取代单一芯片性能比拼,成为行业共鸣。
在“超节点”的新赛场上,具备入局才智的选手还三三两两,曦智科技(下简称“曦智”)还是率先跑出最初身位。
在刚以前的2025全国东说念主工智能大会(WAIC)上,曦智发布了具有行业调动真谛的“光互连光交换”决策——“光跃LightSphere X”漫步式全光互连芯片及超节点处分决策。
该决策聚焦纵向扩张(Scale-Up)网罗,立异引入光互连技艺,冲突了传统决策中物理机柜截至,实现更大鸿沟、跨机柜的Scale-Up网罗。基于该决策的几千卡算力集群正在上海落地,而光跃LightSphere X“的”X,试验上意味着超节点的鸿沟不错莫得上限。
曦智有近250东说念主的团队,研发东说念主员占比超80%,中枢成员有来自MIT的顶尖科学家,也有领有丰富行业训导的业界著名东说念主士。
曦智科技首创东说念主兼CEO沈亦晨在接纳21世纪经济报说念记者的专访时清楚,在2023年ChatGPT刚兴起不久、“超节点”倡导尚未酿成时,曦智就订立到这是遑急契机,于是把我方的光互连产物线切入了超节点领域。
他坦率地默示,现时超节点对曦智而言是一个止境好的契机,要诓骗好超节点这波契机,尽快地实施公司产物。
曦智遴荐走英伟达、华为等公司没走过的立异技艺阶梯,同期遴荐走一条敞开生态的说念路。“在此生态中,咱们的计谋定位明晰:聚焦于光互连及光芯片关连的中枢技艺产物立异。面前,咱们已在该领域占据成心生态位。”沈亦晨说。
在对话中,沈亦晨先容了曦智在超节点领域的技艺和产物阶梯,长远共享了他关于智算行业趋势及市集契机的看法,以及曦智的贸易计谋及策画。
(以下为采访实录)
2023年切入超节点:“光互连是势必的趋势”
《21世纪经济报说念》:你是从什么时候决定切入超节点的?
沈亦晨:咱们在2023年下半年就启看成念超节点了,最早它是为咱们的光狡计芯片就业的。
咱们最启动是作念光狡计的,2021年、2022年咱们的光狡计芯片还是出来了,在策画异日产物的时候,咱们发现互连会是一个很大的瓶颈。因为当狡计芯片的算力越作念越大,如果数据进不去,就会像一个很利弊的引擎拖了一个破车轮,是跑不起来的。是以,咱们里面启动了互连的阵势。
到了2022年底、2023年的时候ChatGPT爆发,催生了更大算力的需求。阿谁时候咱们就思到了超节点。
因为一方面,在咱们光狡计芯片自己的产物策画里,就需要将远远卓著8颗,可能几十、上百颗的狡计芯片通过咱们的互连技艺贯串在全部。
另一方面,那时一颗英伟达最佳的GPU的算力可能等于10颗以致20颗国产GPU的算力。是以其时咱们判断,关于国产GPU而言,一个节点要贯串的远远不啻8卡。
2023年的时候其实还莫得“超节点”的倡导,其时通盘的机柜等于8卡是一个就业器,一个就业器是一个节点。2024年,逐渐的学界启动讲卓著8卡的等于超节点了,才有了这个倡导。
是以咱们其实2023年就启看成念超节点了,不外考究把它定名为“光互连超节点”是在2024年咱们第一个千卡集群落地的时候。
《21世纪经济报说念》:曦智最新公布了一个与沐曦联结的光互连电交换超节点决策。在技艺上与NVL 72和CloudMatrix 384有什么不同?
沈亦晨:咱们此次在WAIC发布了两个超节点决策:一个是光互连电交换,另一个是光互连光交换。前者是比较熟悉的决策,后者是一个立异的决策。
咱们与沐曦联结的光互连电交换超节点决策与英伟达、华为一样齐是用电交换,不同点在于第一,在互连左券层面,咱们用的是敞开的PCIe左券,基本上不错用于上海通盘GPU公司。
而英伟达和华为分袂是用我方的专有左券NVLink和UB去通话的,也等于说他们的GPU之间在说一个它们我方的说话,别的公司的GPU是没法跟它疏通的。
第二,英伟达的决策是用全电互连了72张GB200,华为的决策是把384张卡漫步在十几个机柜,机柜间用华为的光互连技艺贯串起来。
咱们和华为一样亦然用光互连的阵势,但咱们光互连的模组是特意定制的,况且咱们去掉了里面的DSP芯片(数字信号处理芯片),因此传输速率会具有上风。
在与沐曦联结落地决策里,咱们突破了跨机柜贯串的截至,能够维持8台程序就业器共64张xPU卡的高速互连,为大模子测验及推理提供更天真、更高效的并行策略维持。
《21世纪经济报说念》:用PCIe左券的带宽会比华为UB左券的低一些吗?
沈亦晨:华为这一代UB单通说念的带宽如实比PCIe高一些,这个决策里PCIe的单通说念带宽是32G,但它的通说念数目更多,是以总带宽是一个可比的情况。
《21世纪经济报说念》:“光跃LightSphere X”漫步式光互连光交换GPU超节点处分决策草创性地遴选了光互连光交换,光交换比较电交换有什么上风?
沈亦晨:光互连光交换是一个立异的决策。咱们把电交换机去掉了,用光来作念交换和互连,这是全球草创的。
咱们用光交换有几个原因。我常常会把电互连和光互连比作公路交通和轨说念交通,电是公路交通,光是轨说念交通,光在长距离搬运数据时效果更高,但在短距离上可能是公路交通效果更高。
光互连电交换就好比你坐火车(光纤)到了一个中转站,要下火车换乘下一班火车再走,中间是有比较大的延长的,而且它的资本和功耗会比较高。光互连光交换就好比你无谓再下火车(光纤)了,不错用最短的延长到达方针地。这是光交换的一大优点。
第二个优点是光交换的资本比电交换低,因为电交换双方要连两个光模块(火车站),而光交换不错免却一半的光芯片。
第三个优点是一朝用轨说念后,就不需要一个红绿灯说话,也等于不需要左券了,是以光交换对左券是无感的。
这三块其实齐很安妥国内市集的趋势。因为国内有许多GPU厂商,每家齐有我方的左券,其实要定制一个电交换芯片是很穷苦的。
另外,国内要作念超节点就不得无谓光互连,这个是势必的趋势。但光互连的资本比电互连贵一些,是以若何能够显赫诽谤光互连和光模块的资本就成了要道,光交换也能在一定进度上匡助处分资本问题。
把万卡集群作念成一个超节点
《21世纪经济报说念》:在漫步式光交换决策下,超节点的鸿沟能有多大?
沈亦晨:在漫步式光交换决策下,超节点的鸿沟莫得上限,这意味着万卡集群也全部不错作念成一个超节点。是以漫步式光交换决策咱们叫“光跃LightSphere X”,因为不需要一个指定的数字,它是无穷的。
天然超节点的鸿沟不是越大越好,有点像是杀鸡不需要用牛刀。越大的超节点会在测验越大的模子时确认更大的作用,但在止境小的模子上反而是花费资源。
是以收获于漫步式联想,光跃LightSphere X可天真设立超节点的鸿沟,并可突破传统交换芯片对贯串数目截至,因而是比较恰当面前的市集算力需求的。
《21世纪经济报说念》:把万卡集群全部作念成一个超节点,意味着即便互连进步机柜,曦智作念的仍是Scale-Up(纵向扩张)网罗?在纵向扩张与横向扩张上,曦智若何看面前超节点的发展趋势?
沈亦晨:光跃LightSphere X的中枢方针仍是扩张Scale-Up网罗。咱们认为超节点将日益增大,Scale-Up网罗也需随之扩张,但传统Scale-Up网罗频频受限于物理机柜的鸿沟。
咱们的立异在于引入光互连技艺,突破了机柜的物理截至。这使得Scale-Up成为一个逻辑倡导——你不错将多个机柜内的GPU整合为一个逻辑上和洽的大型超节点。因此,咱们以立异的光互连决策,实现了鸿沟更大、进步物理机柜的Scale-Up 网罗。
《21世纪经济报说念》:曦智正在与上海仪电落地的超节点算力集群鸿沟有多大?有莫得落地更大鸿沟超节点的谋划?
沈亦晨:几千卡。咱们的方针是在年内落地万卡集群。
《21世纪经济报说念》:曦智与阶跃星辰在基于漫步式光交换的万亿参数大模子测验基础才智培植上有联结。有莫得测算或估算过对测验如Step-2、DeepSeek-V3等大模子在效用和资本上有多大的优化?
沈亦晨:咱们和上海仪电几千卡的算力集群还在落地经过中,还莫得实测过。但表面数据是有的,咱们在SIGCOMM上发表了一篇论文,炫夸收益是曲常显赫的。基于漫步式光交换超节点的单元资本仅为NVL72的31%,GPU冗余率比NVL72和TPUv4低一个数目级,且与NVIDIA DGX(单机8卡)比较,模子算力诓骗率最高普及3.37倍。
(注:曦智科技联手北京大学、阶跃星辰的商议团队建议了一种以光交换(OCS)模组为中心的高带宽域架构InfiniteHBD,该决策以论文学式被外洋通讯网罗领域顶级会议SIGCOMM 2025吸收。)
《21世纪经济报说念》:面前国内GPU厂商关于超节点齐有若何的思法?
沈亦晨:面前,咱们已与国内头部芯片厂商建立了深度联结关系。各厂商凭据自身需求遴荐适配的技艺旅途:有些GPU厂商会优先遴选电互连决策,追求单机柜内的密度最大化;而另一些则更倾向于尝试新技艺,以构建更大鸿沟的超节点。此外,新兴的非传统GPU架构厂商也为咱们提供了遑急机遇,联袂探索立异的处分决策。
光电交融这块,因为英伟达赶快要推出下一代CPO了,是以举座上本年的关爱度比前年高许多,但我认为市集还莫得到等闲接纳的地步。这毕竟是一个新的东西,各人会惦记光模块的透露性、资本和生态。
但面前国内的CPO产业链已熟悉,止境是在上游厂商启动纷繁入局以后,CPO的全面落地是班师在望的。
《21世纪经济报说念》:光互连光交换GPU超节点的部署难度若何样?
沈亦晨:面前,咱们在数千张GPU卡鸿沟集群的试验部署中,光互连决策确认精采无比,其部署复杂度以致低于传统电互连决策。原因在于:举例英伟达的电互连超节点,其机柜、承重、散热及供电均需高度定制化,与程序数据中心计房存在显赫相反,频频需要为此特意新建机房。
而光互连决策则能无缝兼容现存数据中心基础才智。通过部署光缆,即可快速组建超节点。因此在总体资本方面,光互连并不势必高于电互连。另外,尽管系统总发烧量邻近,但将功耗分散至多个机柜的决策,比较将通盘高功耗开发集合在一个机柜内,显赫诽谤了散热难度。
“降维打击”:作念光狡计时已积聚CPO技艺
《21世纪经济报说念》:光互连在超节点领域会成为趋势,能谈谈原因?
沈亦晨:我校服异日国内的超节点一定是进步一个机柜的,因为国产GPU无法在单个机柜内实现对标NVL 72的算力。光与电的实质区别在于光不错连得更远,铜导线受物理定律截至,传输相似的高带宽信号时,能传输的距离较短,最多只可维持一个机柜内GPU的互连。是以一朝要进步一个机柜,就会不得无谓光。
英伟达本年GTC也推出了两款CPO(共封装光学)交换机,是以咱们认为英伟达以后也会切到光互连上。天然黄仁勋一直说咱们会尽量用电(互连)直到“we have to”(咱们不得不),但他们赶快也会到“have to”用光(互连)的阶段。
面前博通、英伟达、AMD、英特尔等主流厂商齐在作念光互连,因为单颗芯片所需要的带宽越来越大,就必须极大裁减铜导线的距离,而这还是赶快到极限了,是以一定会转成光出来,去维持更大的算力。
《21世纪经济报说念》:黄仁勋认为英伟达在CPO技艺上至少有二十年的责任不错作念。你认为CPO技艺的发展会是一个多长周期?
沈亦晨:如实,我认为异日20年芯片全部会用光来贯串。但光互连技艺也会有一个进阶旅途:最启动是把光电调度的光芯片放在电芯片边上(NPO/OBO),往后把它们放在兼并封装内(CPO),临了可能会变成“高下楼”(3D CPO),再往后可能会在上头再叠多样东西,比如激光器。
是以光电交融技艺的发展和半导体技艺的发展其实是一样,齐有一个止境长的时间节律,不休地去迭代。我认为CPO的互连带宽至少还会有1-2个数目级的普及空间。应该从下一代芯片启动,CPO就会成为一个共鸣。
《21世纪经济报说念》:曦智最近结合燧原科技推出了国内首款xPU-CPO光电共封装原型系统,是国内初次遴选CPO技艺实现GPU径直出光的案例。技艺上的难点与立异点在那儿?
沈亦晨:这是国内第一个使用短距离SerDes技艺,将光学引擎与狡计芯片(xPU)在基板上实现光电共封装的系统。短距离SerDes技艺能把电芯片与光芯片的传输距离裁减,从而大大增多了出口带宽密度。
不管是光互连电交换照旧光互连光交换,光芯片与GPU芯片一般齐在一个板卡上,但不在一个封装里,中间贯串的铜导线简略有几十厘米。而这个CPO系统是在兼并封装里、两颗芯片靠在全部联想出来的。这对芯片的集成才智和共同联想才智建议了很高的条件。
《21世纪经济报说念》:瞻望这款xPU-CPO光电共封装原型系统将在什么时候实现贸易化落地?
沈亦晨:这一代芯片主如果为了确认咱们能够作念CPO,不会量产,量产谋划会放鄙人一代芯片里。
《21世纪经济报说念》:你们原先作念光狡计时就还是作念出了3D CPO,面前在xPU光互连里作念CPO是不是有些降维打击?
沈亦晨:从技艺上来说是的,咱们在光狡计上还是实现了电芯片与光芯片的3D共封装,是以在作念光互连的时候,许多技艺咱们齐还是具备了。天然有的光互连产物单通说念的带宽需要高一些,但凭借咱们的技艺累积,咱们能更快地切入。
闭源以外:在敞开生态里建造“护城河”
《21世纪经济报说念》:在现时举座的算力市集中,你认为有哪些契机?
沈亦晨:我认为在专用领域,光狡计是有契机的。在先进互连这块,超节点是一个止境好的契机,这是一个行业势必的趋势。是以咱们要诓骗好超节点这波契机,尽快地实施咱们的产物,让更多的东说念主用起来。
《21世纪经济报说念》:曦智“开源”的超节点决策有契机对英伟达或者华为组成多大的挑战?
沈亦晨:国内GPU市集呈现高度繁盛,企业稠密。咱们预见,一个立异敞开的全重生态正在国内智算领域助长。在此生态中,咱们的计谋定位明晰:聚焦于光互连及光芯片关连的中枢技艺产物立异。面前,咱们已在该领域占据成心生态位。
《21世纪经济报说念》:在英伟达构筑的禁闭生态里,NVLink技艺、Cuda生态等是英伟达的“护城河”。曦智遴荐在超节点上走一条敞开生态的说念路,在构筑自身的“护城河”方面有若何的辩论?
沈亦晨:首先,鼓励敞开生态培植,势必条件咱们显赫诽谤技艺使用门槛。对此,咱们秉握高度敞开的联结理念。
天然,在底层中枢技艺方面,咱们构筑了坚实壁垒。以光交换模块为例,其中枢芯片咱们均实现自主研发。芯片联想与仿真波及复杂的光电协同联想与先进封装才智,面前国内同期具备如斯全面才智的企业历历。
同期,在系统级适配与工程化落地层面,咱们进入了多数资源。与系统厂商及GPU厂商的深度适配责任至关遑急。许多工程挑战惟有在部署千卡乃至万卡鸿沟集群时才会败露,收获于咱们在大型集群部署上的最初实践,咱们得以更早预见并处分这些问题,握续优化决策。
因此,转头而言,握续的工程迭代才智与底层中枢技艺的自主立异才智,共同组成了咱们的确的、难以复制的护城河。
《21世纪经济报说念》:面前曦智中枢成员的组成如何?
沈亦晨:咱们的结合首创东说念主、首席技艺官孟怀宇博士是我在MIT的同学。他也曾参与研发了MIT的全球首个片上光互连技艺,我是在光狡计阵势上。同批课题组的同学里还有几个也在咱们公司。2017年,咱们设立了曦智,光狡计和光互连成为咱们的两条主产物线。
咱们面前有近250东说念主的团队,中枢成员由来自麻省理工学院(MIT)的顶尖科学家开yun体育网,也有领有丰富半导体行业训导的业界著名东说念主士,研发东说念主员占比超80%。