2025WAIC：國產(chǎn)算力破局之戰(zhàn)，開打？

2025-07-31 來源：愛集微原創(chuàng)文章

163

關(guān)鍵詞：國產(chǎn)算力超節(jié)點光互連 AI芯片智算集群

中國算力產(chǎn)業(yè)正經(jīng)歷一場前所未有的從“受制于人”到“自主可控”的破局之戰(zhàn)。2025 WAIC展會集中展現(xiàn)了國產(chǎn)算力在超節(jié)點架構(gòu)、光互連、異構(gòu)協(xié)同以及算力集群化、全鏈路國產(chǎn)化等方面的重大突破，這是一場由底層硬件創(chuàng)新驅(qū)動、產(chǎn)業(yè)協(xié)同賦能的生態(tài)系統(tǒng)性突圍。

其中核心技術(shù)路線包括曦智科技聯(lián)合壁仞科技、中興推出全球首款分布式光交換（dOCS）超節(jié)點，通過采用硅光芯片實現(xiàn)GPU間光互連，以及華為昇騰384超節(jié)點打破英偉達NVLink的私有協(xié)議壟斷，為國產(chǎn)萬卡集群提供可擴展架構(gòu)新范式，同時更多國內(nèi)AI芯片企業(yè)展示的系統(tǒng)級創(chuàng)新、軟硬協(xié)同，打通了從技術(shù)攻堅到商業(yè)落地的正循環(huán)“最后一公里”。

這體現(xiàn)出國產(chǎn)算力逐漸從“替代備份”走向“技術(shù)引領(lǐng)”，其中關(guān)鍵勝負(fù)手在于超節(jié)點集群打破算力密度天花板，光互連/液冷等技術(shù)破解物理限制，以及開放異構(gòu)生態(tài)化解碎片化困局。而以智能計算超節(jié)點應(yīng)運而生并成為解決算力瓶頸的關(guān)鍵方案為代表，這場國產(chǎn)算力破局之戰(zhàn)不僅是技術(shù)維度的創(chuàng)新突破，更是中國AI產(chǎn)業(yè)從“硬件依賴”到“系統(tǒng)定義”的范式躍升。

AI超節(jié)點成解決算力瓶頸關(guān)鍵路徑

在大模型參數(shù)指數(shù)級增長推動下，業(yè)界對GPU集群的規(guī)模需求也在快速擴大，從千卡級、萬卡級再到十萬卡級等，這體現(xiàn)出對算力的需求增長速度逐步遠(yuǎn)超芯片性能提升曲線。

對于未來如何構(gòu)建越來越大規(guī)模的GPU算力集群？解決路徑是Scale Up和Scale Out。其中，Scale Up（縱向擴展）增加單節(jié)點資源數(shù)量，Scale Out（橫向擴展）增加節(jié)點的數(shù)量。簡單理解，每臺服務(wù)器里面多塞幾塊GPU，這時一臺服務(wù)器就是一個節(jié)點，即Scale Up。而通過網(wǎng)絡(luò)將多臺電腦（節(jié)點）連接起來就是Scale Out。

據(jù)了解，Scale Out考驗的是節(jié)點之間通信能力，而Scale Up在性能、成本、組網(wǎng)和運維等方面具有重要優(yōu)勢。在AI訓(xùn)練過程中，通常包括多種并行計算方式，其中PP（流水線并行）和DP（數(shù)據(jù)并行）的通信量較小，一般交由Scale Out處理。而TP（張量并行）、 EP（專家并行）的通信量大，這就需要交由Scale Up（超節(jié)點內(nèi)部）處理。

當(dāng)前，超節(jié)點作為Scale Up的最優(yōu)解，通過內(nèi)部高速總線互連，能夠有效支撐并行計算任務(wù)，加速GPU之間的參數(shù)交換和數(shù)據(jù)同步，縮短大模型的訓(xùn)練周期。其核心技術(shù)優(yōu)勢在于突破單服務(wù)器限制，數(shù)十塊甚至數(shù)百塊GPU集成在一個機架內(nèi)；超帶寬域（HBD）技術(shù)可將GPU間通信時延壓縮至百納秒級，實現(xiàn)GPU間數(shù)據(jù)交換的無縫銜接，并大幅降低組網(wǎng)復(fù)雜度；以及支持Scale Up與Scale Out融合，實現(xiàn)“樂高式”靈活搭建。

超節(jié)點最初是英偉達提出的概念，并將以超大帶寬互聯(lián)16卡以上GPU-GPU的Scale Up系統(tǒng)稱為超節(jié)點。歷經(jīng)多年發(fā)展和數(shù)次迭代，2024年3月，英偉達發(fā)布NVL72超節(jié)點，可以將36個Grace CPU和72個Blackwell GPU集成到一個液冷機柜中，實現(xiàn)總計720 PFLOPs的AI訓(xùn)練性能，或1440 PFLOPs的推理性能。

從NVL72開始，超節(jié)點概念在算力行業(yè)內(nèi)被頻繁提及，并逐漸從藍圖走向現(xiàn)實。在2025WAIC現(xiàn)場，中國企業(yè)也帶來了超節(jié)點技術(shù)方案，而且成為大會最大看點之一。

國內(nèi)首個光互連光交換GPU超節(jié)點亮相

在2025WAIC“智算云啟，共繪生態(tài)”論壇上，上海儀電聯(lián)合曦智科技、壁仞科技、中興通訊正式發(fā)布國內(nèi)首個光互連光交換GPU超節(jié)點解決方案——光躍LightSphere X。

據(jù)悉，該超節(jié)點以曦智科技全球首創(chuàng)的分布式光交換（dOCS）芯片為核心，通過基于壁仞科技自主原創(chuàng)架構(gòu)的大算力通用GPU液冷模組壁勵166L與全新載板互連，并搭載中興通訊高性能AI國產(chǎn)服務(wù)器及儀電開放智算云平臺軟件，構(gòu)建起高帶寬、低延遲、靈活可擴展的自主可控智算集群生態(tài)，即將于上海儀電智算中心落地。

鑒于算力集群邁入“萬卡協(xié)同”時代，當(dāng)前業(yè)界一種常見方案是通過提升單機柜功耗來部署更多GPU，但受限于數(shù)據(jù)中心單機柜的功耗天花板，單機柜GPU密度提升存在瓶頸。

對此，光躍LightSphere X采用光互連技術(shù)，通過增加機柜數(shù)量構(gòu)建超節(jié)點，突破傳統(tǒng)互連方式下超節(jié)點的物理限制。相比銅纜，光纜的遠(yuǎn)距離傳輸優(yōu)勢可實現(xiàn)交付與機柜解耦，其核心價值在于：突破單機柜功耗束縛，支持萬卡級彈性擴展，兼容現(xiàn)有機房設(shè)施降低部署成本，并可按算力需求動態(tài)調(diào)整超節(jié)點規(guī)模，實現(xiàn)分階段建設(shè)。

同時，光躍LightSphere X的曦智科技分布式光交換（dOCS）技術(shù)進一步提升了超節(jié)點的靈活度和系統(tǒng)可擴展性，從而達到提升系統(tǒng)性價比的目的。得益于多計算Chiplet與CoWoS 2.5D封裝協(xié)同設(shè)計的GPU模組，光躍LightSphere X擁有強大算力。該模組基于壁仞科技的大算力（單卡1P級）通用GPU液冷模組，極大增強了集群訓(xùn)推性能。

未來，光躍LightSphere X將成為儀電首個采用該方案的超節(jié)點國產(chǎn)算力集群，其靈活的拓?fù)浣Y(jié)構(gòu)和規(guī)模適應(yīng)不同模型的通信需求，開放的協(xié)議架構(gòu)打破廠商壁壘，構(gòu)建了從光芯片、GPU模組、到液冷服務(wù)器及高速域算力集群的全棧自主可控生態(tài)，可全面賦能千億級參數(shù)大模型訓(xùn)練與推理需求，為我國人工智能跨越式發(fā)展提供澎湃動力。

各大AI芯片企業(yè)向“系統(tǒng)化”奮進

在算力基礎(chǔ)設(shè)施的務(wù)實轉(zhuǎn)型浪潮中，系統(tǒng)化創(chuàng)新、全鏈路國產(chǎn)化的推進節(jié)奏成為新焦點。因為大模型的快速發(fā)展和迭代，不僅改變了以往模型碎片化的產(chǎn)業(yè)生態(tài)，更驅(qū)動算力基礎(chǔ)設(shè)施朝著系統(tǒng)化和集群化發(fā)展。對此，國產(chǎn)AI芯片企業(yè)均在不同維度的系統(tǒng)化攻堅奮進。

其中，摩爾線程以全功能GPU為核心底座構(gòu)建的“云邊端”全棧AI產(chǎn)品和解決方案亮相2025WAIC展覽區(qū)，包括KUAE2智算集群解決方案面向大規(guī)模智算中心，集成計算、存儲、網(wǎng)絡(luò)硬件及分布式計算軟件，最高支持10240個全功能GPU部署。

摩爾線程還提出，公司將通過系統(tǒng)級工程創(chuàng)新，打造生產(chǎn)先進模型的“AI工廠”，實現(xiàn)先進架構(gòu)、芯片算力、單節(jié)點效率、集群效率優(yōu)化與可靠性等協(xié)同躍升的深度技術(shù)創(chuàng)新。

目前，芯片、超節(jié)點、網(wǎng)絡(luò)、并行計算以及云架構(gòu)下的大模型適配環(huán)環(huán)相扣，為算力與大模型的協(xié)同創(chuàng)新與發(fā)展提供了巨大空間。鑒于此，燧原科技打出“組合拳”，在大會期間首次展出燧原S60高性能人工智能推理加速卡和DeepSeek一體機系列產(chǎn)品，同時還發(fā)布第四代訓(xùn)推一體產(chǎn)品燧原L600，以及推出全新計算系統(tǒng)——云燧OGX系列產(chǎn)品。

沐曦集成在大會上首次展示了旗艦訓(xùn)推一體GPU曦云C600以及從芯片到集群的立體化呈現(xiàn)。據(jù)悉，曦云C600性能全面對標(biāo)國際旗艦GPU產(chǎn)品，包括搭載當(dāng)前業(yè)界前沿的HBM3e顯存等。而基于上代產(chǎn)品曦云C500系列芯片，沐曦在現(xiàn)場展示了PCIe服務(wù)器、OAM服務(wù)器和光互連服務(wù)器解決方案，這些服務(wù)器基本都實現(xiàn)了“全鏈路國產(chǎn)化”。

此外，無問芯穹首次發(fā)布展示了三大“操作系統(tǒng)級”產(chǎn)品——“無穹AI云”“無界智算平臺”與“無垠終端智能解決方案”，分別面向跨地域智算網(wǎng)絡(luò)、智算集群與多形態(tài)智能終端等全規(guī)模場景，統(tǒng)一適配多元算力，提供從模型調(diào)度、性能優(yōu)化到AI應(yīng)用部署的全鏈路支持。

據(jù)了解，無問芯穹展示的全球首創(chuàng)單任務(wù)千卡異構(gòu)混訓(xùn)系統(tǒng)及Infini-AI異構(gòu)云平臺，突破異構(gòu)芯片、異地集群、異屬算力統(tǒng)一管理的技術(shù)瓶頸，算力利用率高達97.6%。

中國智算超節(jié)點首度上演“集體秀”

伴隨著國內(nèi)智算集群建設(shè)從單點突破邁向系統(tǒng)攻堅階段，國產(chǎn)AI超節(jié)點無疑是系統(tǒng)級創(chuàng)新的重要體現(xiàn)，不僅要設(shè)計好底層芯片以及將大量芯片連接起來的“神經(jīng)網(wǎng)絡(luò)”，還需通過優(yōu)化節(jié)點內(nèi)的高速互聯(lián)、存儲架構(gòu)和軟件棧，最大化發(fā)揮國產(chǎn)芯片集群的整體效能。

在2025WAIC上，尤為受關(guān)注的是耗費數(shù)十億元的華為昇騰384超節(jié)點真機。作為展區(qū)“鎮(zhèn)館之寶”，其通過總線技術(shù)達成384個NPU之間的大帶寬低時延互聯(lián)，有效解決集群內(nèi)計算、存儲等各資源之間通信瓶頸。同時，昇騰384超節(jié)點單卡推理性能提升4倍，Decoding吞吐達到2300+Tokens，通訊時延降低至50ms以下，MFU算力使用率達50%，在業(yè)界位居領(lǐng)先水平。

據(jù)官方公告，華為AI算力集群解決方案CloudMatrix 384，通過全互連拓?fù)浼軜?gòu)實現(xiàn)芯片間的高效協(xié)同，可提供達300 PFLOPs密集BF16算力，性能接近英偉達NVL72系統(tǒng)兩倍。按照國外投行觀點，華為的規(guī)?；鉀Q方案“領(lǐng)先于英偉達和AMD目前市場上的產(chǎn)品一代”，并且認(rèn)為中國在AI基礎(chǔ)設(shè)施上取得的突破，將對全球AI產(chǎn)業(yè)格局產(chǎn)生深遠(yuǎn)影響。

同時，中興展示了架構(gòu)代際領(lǐng)先的智算超節(jié)點服務(wù)器，算力高密集成、高效互聯(lián)，為超大參數(shù)規(guī)模的模型訓(xùn)練和推理打造高算效的硬件底座。其單機柜可搭載64個GPU，內(nèi)置16個計算節(jié)點，8個交換節(jié)點，機內(nèi)Scale up可擴展至2048張算力卡，機間支持Scale out拓展至萬卡規(guī)模。據(jù)了解，相比起華為單機搭載32卡，中興可以做到單機搭載64卡。

此外，新華三展出的是超節(jié)點產(chǎn)品H3C UniPod S80000全球首秀。這是專為萬億級大模型的訓(xùn)練與推理需求量身打造的核心設(shè)備，支持單機柜、多機柜等多種形態(tài)，Scale-up互聯(lián)規(guī)模提升300%；依托以太互聯(lián)協(xié)議，可實現(xiàn)Scale-up南向互聯(lián)；以及能夠?qū)崿F(xiàn)單機柜64卡（與中興一樣）高密部署及互聯(lián)互通，并同時具備向1024卡互聯(lián)演進的能力。

超聚變則帶來了全球首個多元智算即插即用超級集群系統(tǒng)，實現(xiàn)全面軟硬件基礎(chǔ)設(shè)施技術(shù)和算力生態(tài)，能夠兼容10+加速卡，提供雙生態(tài)南北向安全異構(gòu)算力。同時，其做到單柜128個AI加速卡，112G/224G的高速互連；使用第5代100%原生液冷，可實現(xiàn)節(jié)能超20%。

結(jié)語

在大模型時代，面對算力的需求增長速度逐步遠(yuǎn)超芯片性能提升曲線，單芯片性能差異的重要性逐漸讓位于整個集群的總體效能。鑒于芯片性能、開發(fā)成本和國際限制等因素，國內(nèi)要達到與國際主流方案相當(dāng)?shù)目偹懔π琛耙粤垦a質(zhì)”。這使得AI超節(jié)點成為勢必被催生的高效、可擴展、標(biāo)準(zhǔn)化的算力集群架構(gòu)，并且是我國構(gòu)建大規(guī)模算力基礎(chǔ)設(shè)施的現(xiàn)實可行方向。

可喜的是，2025WAIC顯示出以壁仞科技、華為為代表的中國AI智算企業(yè)正在不斷努力，攻堅從人工智能產(chǎn)業(yè)的核心底座——以芯片、板卡、服務(wù)器、計算集群等為核心構(gòu)成的算力基礎(chǔ)設(shè)施，再到與本土行業(yè)應(yīng)用的深度創(chuàng)新協(xié)同，促使一條貫穿大模型生態(tài)的國產(chǎn)化鏈條加速成型。而這場中國智算超節(jié)點的“集體秀”，不僅是技術(shù)路線選擇，更關(guān)乎整個產(chǎn)業(yè)發(fā)展命脈。

相關(guān)文章

行業(yè)動態(tài)

納米光子器件中實現(xiàn)光信號跨結(jié)構(gòu)“穿梭”

芯海科技盧國建：用“芯片+AI+數(shù)據(jù)”重新定義健康管理

Arm要自制芯片 IC設(shè)計警戒：將直接與客戶搶地盤

熱讀文章

苗圩出席統(tǒng)籌推進疫情防控和產(chǎn)業(yè)轉(zhuǎn)型升級促進制造業(yè)通信業(yè)穩(wěn)定發(fā)展發(fā)布會

一圖讀懂2020年《政府工作報告》

工業(yè)富聯(lián)：擬7763萬美元收購鴻海精密美國子公司相關(guān)資產(chǎn)

亚洲国产精品久久久久婷蜜芽,caoporn国产精品免费视频,久久久久久久久免费看无码,国产精品一区在线观看你懂的

2025WAIC：國產(chǎn)算力破局之戰(zhàn)，開打？