在AI熱潮席卷全球的當下,大模型參數規模正以驚人的速度突破萬億級大關。這不僅驅動著算法創新的狂飆,更引發了對AI基礎設施全面升級的迫切需求。業界掀起了大規模智算中心的建設浪潮,但多數目光聚焦于以GPU為代表的算力上,忽視了網絡聯接的價值。
作為網絡產業的領軍者,近日,新華三集團交換機產品線首席產品經理張鴻凌、新華三集團交換機產品管理部總監陳伯超在接受C114采訪時指出,盡管網絡投資占比相對較小,但其對整體算力效能和經濟收益的影響至關重要,已成為推動智算中心升級的關鍵變量。相關數據顯示,網絡性能波動可導致訓練效率下降30%,訓練時長增加25%。
秉持“算力x聯接”理念,新華三集團通過多維度技術創新深化端網協同,為多元智算發展構建開放、高效、智能的聯接基礎,助力百行百業智能化轉型。從推出基于DDC(Diversity Dynamic-Connectivity,多元動態聯接)架構的新一代無損網絡解決方案,到傳統RoCE領域的創新布局,再到全場景定制化智算方案的打造,新華三正以全棧技術能力與開放生態思維,全方位賦能智算發展。
DDC多元+動態聯接:構建開放智算生態
當前,DeepSeek、Grok3等開源大模型的參數規模呈指數級躍升,其引發的算力集群通信壓力正突破傳統網絡架構極限。張鴻凌表示,開源戰略對網絡提出支持多元算力挑戰,流量模型對網絡沖擊加劇,端網協同能力將成為關鍵支撐。
新華三集團交換機產品線首席產品經理張鴻凌
新華三集團推出基于DDC(Diversity Dynamic-Connectivity,多元動態聯接)架構的新一代無損網絡解決方案,面萬卡級算力互聯場景需求,重塑智算中心網絡架構。其聚焦“超大規模、極致性能、開放解耦、智能運維”四大技術突破,高效解決智算網絡中流量擁塞與調度難題,全面提升智算網絡效能。
張鴻凌介紹,DDC架構具備強大的多元算力承載能力,采用端到端調度機制,能根據網絡變化迅速、無感知切換,動態聯接適配能力出色,高度契合智算場景需求。實測數據顯示,基于DDC架構的組網方案相比傳統方案有效帶寬提升達107%,帶寬利用率可媲美InfiniBand網絡,且可靈活適配1K至70K節點的多樣化集群部署需求。
“對DDC架構的持續探索和升級,不僅代表了技術的革新,更是新華三對智算網絡范式的全新定義。其開放解耦的架構突破了傳統封閉系統的局限,支持多元算力生態的無縫接入,為AI產業提供可持續發展的聯接基礎。”張鴻凌表示。
在標準方面,新華三秉持開放共建的理念,攜手業界生態伙伴基于OSF(人工智能網絡開放調度架構)制定DDC核心框架標準,采用BGP協議發布隧道出口點(TEP),優化AI網絡的流量調度能力,重點解決負載均衡、擁塞控制、網絡可靠性三大核心問題。“不同設備只要遵循其標準即可實現互聯互通,突破傳統架構的束縛,構建開放智算生態。”陳伯超補充道。
多維度技術創新:端網協同破智算困局
除DDC架構外,新華三正以多點開花的探索實踐,編織更完善的智算網絡。張鴻凌提到,在傳統RoCE領域,新華三多方面創新布局。在國產算力生態方面,基于多元芯片路線打造包含AI服務器、RoCE交換機及存儲全生態的全國產化智算方案。
在端網流量有序協同方面,推出增強CBRC算法,并通過AD-DC智算版智能管控分析平臺實現對于智算網絡全生命周期運維管理。其核心理念是網絡與網卡協同,整合全局信息,進行統一調度,實現更好的流量均衡效果,提高訓練效率,減少通信擁塞,保障業務連續性,為智算網絡提供更穩定、更智能、更高效的管理體驗。
在“算力x聯接”融合實踐方面,基于端網協同的智算方案,采用新華三全國產智算平臺,并結合AD-DC智算版,在實驗室進行了測試驗證。測試模型基于LIama370B,與傳統網絡相比,在All to All方面平均性能提升16%以上,效果跟IB網絡非常接近。
除了集群內的無損傳輸外,跨域算力流動同樣對網絡穩定性提出更嚴苛挑戰。例如,長距傳輸延遲大、降速周期長導致業務易出現波動等。對此,新華三推出長距RDMA優化方案,加速算力跨域流動。以交換機入口和出口處理為例,在Ingress方向建立RoCE會話流表,出現擁塞時代發擁塞通知報文(CNP);在Egress方向基于流表隊列深度檢測,發現擁塞事件觸發CNP發送。測試表明,在500QP場景下,響應時間可提高超80%,吞吐量提升超10%。代發CNP機制實現了降速周期縮短,快速避免擁塞,且接收端無感知,不影響整體業務的開展。
全場景賦能:提供定制化智算方案矩陣
在百行百業的智能化轉型進程中,應用場景的碎片化催生出對算力網絡的差異化訴求。從百卡到萬卡、從自建到租賃、從專業到入門,既要應對超大規模集群的精密調度,也要實現輕量化部署。這要求廠商具備全棧技術縱深與場景化橫向貫通的“柔性能力”。
張鴻凌表示,新華三擁有廣泛的客戶基礎,覆蓋數字政府、教育、企業、醫療、互聯網等多個行業,客戶業務規模涵蓋小型、中型及超萬卡集群等大型組網場景。針對不同規模客戶,新華三提供定制化解決方案:對于大規模客戶,依托強大的網元設備能力、優化調優技術及運維管理軟件,構建全流程管理機制與快速響應體系,助力高效運維,降低網絡中斷風險;對于小型客戶,則配備專業化整體解決方案及交付團隊,提供“交鑰匙”式全棧服務,實現一站式高效交付。
同時,根據客戶專業程度,新華三實現分級精準賦能。面向具備完整技術團隊的專業級客戶,提供網絡控制平臺與設備組合方案,實現網絡配置與業務系統的自動化對接,打造“無感化”網絡;對于擁有基礎運維能力的準專業級客戶,可在設備基礎上疊加算力調度平臺,實現算力與網絡資源協同管理;針對入門級客戶,提供分析器、基礎網管軟件及可選的智算版服務。除“自用型”客戶,針對租賃型業務客戶,新華三基于業務需求提供個性化網絡配置,實現靈活的租戶分配功能。
采訪最后,張鴻凌表示,新華三會繼續深耕全域智算產品研發,堅持多元芯片戰略,致力于建設開放標準,為行業的智能演進構筑基石。未來,新華三將持續推動智算網絡技術創新,加速AI賦能各行各業。
不難看出,當網絡從數據通道蛻變為系統級調度中樞,端網協同成為解鎖AI生產力的關鍵。新華三正以開放思維,憑借一系列技術創新與解決方案,不斷踐行著“算力x 聯接”理念。不僅突破了傳統技術局限,更構建起開放多元的智算生態,為百行百業的智能化轉型鋪就一條“無擁塞、無損耗”的智算高速路。