2025WAIC:國產(chǎn)算力破局之戰(zhàn),開打?
關(guān)鍵詞: 國產(chǎn)算力 超節(jié)點 光互連 AI芯片 智算集群
中國算力產(chǎn)業(yè)正經(jīng)歷一場前所未有的從“受制于人”到“自主可控”的破局之戰(zhàn)。2025 WAIC展會集中展現(xiàn)了國產(chǎn)算力在超節(jié)點架構(gòu)、光互連、異構(gòu)協(xié)同以及算力集群化、全鏈路國產(chǎn)化等方面的重大突破,這是一場由底層硬件創(chuàng)新驅(qū)動、產(chǎn)業(yè)協(xié)同賦能的生態(tài)系統(tǒng)性突圍。
其中核心技術(shù)路線包括曦智科技聯(lián)合壁仞科技、中興推出全球首款分布式光交換(dOCS)超節(jié)點,通過采用硅光芯片實現(xiàn)GPU間光互連,以及華為昇騰384超節(jié)點打破英偉達NVLink的私有協(xié)議壟斷,為國產(chǎn)萬卡集群提供可擴展架構(gòu)新范式,同時更多國內(nèi)AI芯片企業(yè)展示的系統(tǒng)級創(chuàng)新、軟硬協(xié)同,打通了從技術(shù)攻堅到商業(yè)落地的正循環(huán)“最后一公里”。
這體現(xiàn)出國產(chǎn)算力逐漸從“替代備份”走向“技術(shù)引領(lǐng)”,其中關(guān)鍵勝負(fù)手在于超節(jié)點集群打破算力密度天花板,光互連/液冷等技術(shù)破解物理限制,以及開放異構(gòu)生態(tài)化解碎片化困局。而以智能計算超節(jié)點應(yīng)運而生并成為解決算力瓶頸的關(guān)鍵方案為代表,這場國產(chǎn)算力破局之戰(zhàn)不僅是技術(shù)維度的創(chuàng)新突破,更是中國AI產(chǎn)業(yè)從“硬件依賴”到“系統(tǒng)定義”的范式躍升。
AI超節(jié)點成解決算力瓶頸關(guān)鍵路徑
在大模型參數(shù)指數(shù)級增長推動下,業(yè)界對GPU集群的規(guī)模需求也在快速擴大,從千卡級、萬卡級再到十萬卡級等,這體現(xiàn)出對算力的需求增長速度逐步遠(yuǎn)超芯片性能提升曲線。
對于未來如何構(gòu)建越來越大規(guī)模的GPU算力集群?解決路徑是Scale Up和Scale Out。其中,Scale Up(縱向擴展)增加單節(jié)點資源數(shù)量,Scale Out(橫向擴展)增加節(jié)點的數(shù)量。簡單理解,每臺服務(wù)器里面多塞幾塊GPU,這時一臺服務(wù)器就是一個節(jié)點,即Scale Up。而通過網(wǎng)絡(luò)將多臺電腦(節(jié)點)連接起來就是Scale Out。
據(jù)了解,Scale Out考驗的是節(jié)點之間通信能力,而Scale Up在性能、成本、組網(wǎng)和運維等方面具有重要優(yōu)勢。在AI訓(xùn)練過程中,通常包括多種并行計算方式,其中PP(流水線并行)和DP(數(shù)據(jù)并行)的通信量較小,一般交由Scale Out處理。而TP(張量并行)、 EP(專家并行)的通信量大,這就需要交由Scale Up(超節(jié)點內(nèi)部)處理。
當(dāng)前,超節(jié)點作為Scale Up的最優(yōu)解,通過內(nèi)部高速總線互連,能夠有效支撐并行計算任務(wù),加速GPU之間的參數(shù)交換和數(shù)據(jù)同步,縮短大模型的訓(xùn)練周期。其核心技術(shù)優(yōu)勢在于突破單服務(wù)器限制,數(shù)十塊甚至數(shù)百塊GPU集成在一個機架內(nèi);超帶寬域(HBD)技術(shù)可將GPU間通信時延壓縮至百納秒級,實現(xiàn)GPU間數(shù)據(jù)交換的無縫銜接,并大幅降低組網(wǎng)復(fù)雜度;以及支持Scale Up與Scale Out融合,實現(xiàn)“樂高式”靈活搭建。
超節(jié)點最初是英偉達提出的概念,并將以超大帶寬互聯(lián)16卡以上GPU-GPU的Scale Up系統(tǒng)稱為超節(jié)點。歷經(jīng)多年發(fā)展和數(shù)次迭代,2024年3月,英偉達發(fā)布NVL72超節(jié)點,可以將36個Grace CPU和72個Blackwell GPU集成到一個液冷機柜中,實現(xiàn)總計720 PFLOPs的AI訓(xùn)練性能,或1440 PFLOPs的推理性能。
從NVL72開始,超節(jié)點概念在算力行業(yè)內(nèi)被頻繁提及,并逐漸從藍圖走向現(xiàn)實。在2025WAIC現(xiàn)場,中國企業(yè)也帶來了超節(jié)點技術(shù)方案,而且成為大會最大看點之一。
國內(nèi)首個光互連光交換GPU超節(jié)點亮相
在2025WAIC“智算云啟,共繪生態(tài)”論壇上,上海儀電聯(lián)合曦智科技、壁仞科技、中興通訊正式發(fā)布國內(nèi)首個光互連光交換GPU超節(jié)點解決方案——光躍LightSphere X。
據(jù)悉,該超節(jié)點以曦智科技全球首創(chuàng)的分布式光交換(dOCS)芯片為核心,通過基于壁仞科技自主原創(chuàng)架構(gòu)的大算力通用GPU液冷模組壁勵166L與全新載板互連,并搭載中興通訊高性能AI國產(chǎn)服務(wù)器及儀電開放智算云平臺軟件,構(gòu)建起高帶寬、低延遲、靈活可擴展的自主可控智算集群生態(tài),即將于上海儀電智算中心落地。
鑒于算力集群邁入“萬卡協(xié)同”時代,當(dāng)前業(yè)界一種常見方案是通過提升單機柜功耗來部署更多GPU,但受限于數(shù)據(jù)中心單機柜的功耗天花板,單機柜GPU密度提升存在瓶頸。
對此,光躍LightSphere X采用光互連技術(shù),通過增加機柜數(shù)量構(gòu)建超節(jié)點,突破傳統(tǒng)互連方式下超節(jié)點的物理限制。相比銅纜,光纜的遠(yuǎn)距離傳輸優(yōu)勢可實現(xiàn)交付與機柜解耦,其核心價值在于:突破單機柜功耗束縛,支持萬卡級彈性擴展,兼容現(xiàn)有機房設(shè)施降低部署成本,并可按算力需求動態(tài)調(diào)整超節(jié)點規(guī)模,實現(xiàn)分階段建設(shè)。
同時,光躍LightSphere X的曦智科技分布式光交換(dOCS)技術(shù)進一步提升了超節(jié)點的靈活度和系統(tǒng)可擴展性,從而達到提升系統(tǒng)性價比的目的。得益于多計算Chiplet與CoWoS 2.5D封裝協(xié)同設(shè)計的GPU模組,光躍LightSphere X擁有強大算力。該模組基于壁仞科技的大算力(單卡1P級)通用GPU液冷模組,極大增強了集群訓(xùn)推性能。
未來,光躍LightSphere X將成為儀電首個采用該方案的超節(jié)點國產(chǎn)算力集群,其靈活的拓?fù)浣Y(jié)構(gòu)和規(guī)模適應(yīng)不同模型的通信需求,開放的協(xié)議架構(gòu)打破廠商壁壘,構(gòu)建了從光芯片、GPU模組、到液冷服務(wù)器及高速域算力集群的全棧自主可控生態(tài),可全面賦能千億級參數(shù)大模型訓(xùn)練與推理需求,為我國人工智能跨越式發(fā)展提供澎湃動力。
各大AI芯片企業(yè)向“系統(tǒng)化”奮進
在算力基礎(chǔ)設(shè)施的務(wù)實轉(zhuǎn)型浪潮中,系統(tǒng)化創(chuàng)新、全鏈路國產(chǎn)化的推進節(jié)奏成為新焦點。因為大模型的快速發(fā)展和迭代,不僅改變了以往模型碎片化的產(chǎn)業(yè)生態(tài),更驅(qū)動算力基礎(chǔ)設(shè)施朝著系統(tǒng)化和集群化發(fā)展。對此,國產(chǎn)AI芯片企業(yè)均在不同維度的系統(tǒng)化攻堅奮進。
其中,摩爾線程以全功能GPU為核心底座構(gòu)建的“云邊端”全棧AI產(chǎn)品和解決方案亮相2025WAIC展覽區(qū),包括KUAE2智算集群解決方案面向大規(guī)模智算中心,集成計算、存儲、網(wǎng)絡(luò)硬件及分布式計算軟件,最高支持10240個全功能GPU部署。
摩爾線程還提出,公司將通過系統(tǒng)級工程創(chuàng)新,打造生產(chǎn)先進模型的“AI工廠”,實現(xiàn)先進架構(gòu)、芯片算力、單節(jié)點效率、集群效率優(yōu)化與可靠性等協(xié)同躍升的深度技術(shù)創(chuàng)新。
目前,芯片、超節(jié)點、網(wǎng)絡(luò)、并行計算以及云架構(gòu)下的大模型適配環(huán)環(huán)相扣,為算力與大模型的協(xié)同創(chuàng)新與發(fā)展提供了巨大空間。鑒于此,燧原科技打出“組合拳”,在大會期間首次展出燧原S60高性能人工智能推理加速卡和DeepSeek一體機系列產(chǎn)品,同時還發(fā)布第四代訓(xùn)推一體產(chǎn)品燧原L600,以及推出全新計算系統(tǒng)——云燧OGX系列產(chǎn)品。
沐曦集成在大會上首次展示了旗艦訓(xùn)推一體GPU曦云C600以及從芯片到集群的立體化呈現(xiàn)。據(jù)悉,曦云C600性能全面對標(biāo)國際旗艦GPU產(chǎn)品,包括搭載當(dāng)前業(yè)界前沿的HBM3e顯存等。而基于上代產(chǎn)品曦云C500系列芯片,沐曦在現(xiàn)場展示了PCIe服務(wù)器、OAM服務(wù)器和光互連服務(wù)器解決方案,這些服務(wù)器基本都實現(xiàn)了“全鏈路國產(chǎn)化”。
此外,無問芯穹首次發(fā)布展示了三大“操作系統(tǒng)級”產(chǎn)品——“無穹AI云”“無界智算平臺”與“無垠終端智能解決方案”,分別面向跨地域智算網(wǎng)絡(luò)、智算集群與多形態(tài)智能終端等全規(guī)模場景,統(tǒng)一適配多元算力,提供從模型調(diào)度、性能優(yōu)化到AI應(yīng)用部署的全鏈路支持。
據(jù)了解,無問芯穹展示的全球首創(chuàng)單任務(wù)千卡異構(gòu)混訓(xùn)系統(tǒng)及Infini-AI異構(gòu)云平臺,突破異構(gòu)芯片、異地集群、異屬算力統(tǒng)一管理的技術(shù)瓶頸,算力利用率高達97.6%。
中國智算超節(jié)點首度上演“集體秀”
伴隨著國內(nèi)智算集群建設(shè)從單點突破邁向系統(tǒng)攻堅階段,國產(chǎn)AI超節(jié)點無疑是系統(tǒng)級創(chuàng)新的重要體現(xiàn),不僅要設(shè)計好底層芯片以及將大量芯片連接起來的“神經(jīng)網(wǎng)絡(luò)”,還需通過優(yōu)化節(jié)點內(nèi)的高速互聯(lián)、存儲架構(gòu)和軟件棧,最大化發(fā)揮國產(chǎn)芯片集群的整體效能。
在2025WAIC上,尤為受關(guān)注的是耗費數(shù)十億元的華為昇騰384超節(jié)點真機。作為展區(qū)“鎮(zhèn)館之寶”,其通過總線技術(shù)達成384個NPU之間的大帶寬低時延互聯(lián),有效解決集群內(nèi)計算、存儲等各資源之間通信瓶頸。同時,昇騰384超節(jié)點單卡推理性能提升4倍,Decoding吞吐達到2300+Tokens,通訊時延降低至50ms以下,MFU算力使用率達50%,在業(yè)界位居領(lǐng)先水平。
據(jù)官方公告,華為AI算力集群解決方案CloudMatrix 384,通過全互連拓?fù)浼軜?gòu)實現(xiàn)芯片間的高效協(xié)同,可提供達300 PFLOPs密集BF16算力,性能接近英偉達NVL72系統(tǒng)兩倍。按照國外投行觀點,華為的規(guī)?;鉀Q方案“領(lǐng)先于英偉達和AMD目前市場上的產(chǎn)品一代”,并且認(rèn)為中國在AI基礎(chǔ)設(shè)施上取得的突破,將對全球AI產(chǎn)業(yè)格局產(chǎn)生深遠(yuǎn)影響。
同時,中興展示了架構(gòu)代際領(lǐng)先的智算超節(jié)點服務(wù)器,算力高密集成、高效互聯(lián),為超大參數(shù)規(guī)模的模型訓(xùn)練和推理打造高算效的硬件底座。其單機柜可搭載64個GPU,內(nèi)置16個計算節(jié)點,8個交換節(jié)點,機內(nèi)Scale up可擴展至2048張算力卡,機間支持Scale out拓展至萬卡規(guī)模。據(jù)了解,相比起華為單機搭載32卡,中興可以做到單機搭載64卡。
此外,新華三展出的是超節(jié)點產(chǎn)品H3C UniPod S80000全球首秀。這是專為萬億級大模型的訓(xùn)練與推理需求量身打造的核心設(shè)備,支持單機柜、多機柜等多種形態(tài),Scale-up互聯(lián)規(guī)模提升300%;依托以太互聯(lián)協(xié)議,可實現(xiàn)Scale-up南向互聯(lián);以及能夠?qū)崿F(xiàn)單機柜64卡(與中興一樣)高密部署及互聯(lián)互通,并同時具備向1024卡互聯(lián)演進的能力。
超聚變則帶來了全球首個多元智算即插即用超級集群系統(tǒng),實現(xiàn)全面軟硬件基礎(chǔ)設(shè)施技術(shù)和算力生態(tài),能夠兼容10+加速卡,提供雙生態(tài)南北向安全異構(gòu)算力。同時,其做到單柜128個AI加速卡,112G/224G的高速互連;使用第5代100%原生液冷,可實現(xiàn)節(jié)能超20%。
結(jié)語
在大模型時代,面對算力的需求增長速度逐步遠(yuǎn)超芯片性能提升曲線,單芯片性能差異的重要性逐漸讓位于整個集群的總體效能。鑒于芯片性能、開發(fā)成本和國際限制等因素,國內(nèi)要達到與國際主流方案相當(dāng)?shù)目偹懔π琛耙粤垦a質(zhì)”。這使得AI超節(jié)點成為勢必被催生的高效、可擴展、標(biāo)準(zhǔn)化的算力集群架構(gòu),并且是我國構(gòu)建大規(guī)模算力基礎(chǔ)設(shè)施的現(xiàn)實可行方向。
可喜的是,2025WAIC顯示出以壁仞科技、華為為代表的中國AI智算企業(yè)正在不斷努力,攻堅從人工智能產(chǎn)業(yè)的核心底座——以芯片、板卡、服務(wù)器、計算集群等為核心構(gòu)成的算力基礎(chǔ)設(shè)施,再到與本土行業(yè)應(yīng)用的深度創(chuàng)新協(xié)同,促使一條貫穿大模型生態(tài)的國產(chǎn)化鏈條加速成型。而這場中國智算超節(jié)點的“集體秀”,不僅是技術(shù)路線選擇,更關(guān)乎整個產(chǎn)業(yè)發(fā)展命脈。
