4月9日至11日,2025中國移動云智算大會在蘇州金雞湖國際會議中心盛大開幕。中興通訊承載網產品副總經理李新雙受邀出席“云智算原創技術策源”論壇活動并發表《星云智算網絡,實現AI算力無界互聯》主題演講。演講聚焦AI算力網絡的技術革新與產業實踐,深入解讀中興星云智算網絡如何通過全調度以太網(GSE)技術解決DeepSeek 創新技術帶來的AI網絡的流量擁塞、流量均衡、時延等問題,助力中國移動構建“算力無界”的智算生態。
論壇上,李新雙參與了由中國移動主導的“智算互聯GSE產業鏈攻堅計劃”發布儀式,與產業鏈十余家合作伙伴共同啟動這一國家級技術攻關行動,標志著GSE技術從標準制定向產業落地邁出了關鍵一步。
AI普惠浪潮下的算力網絡挑戰
李新雙指出,以DeepSeek為代表的AI技術通過算法創新(如MoE混合專家架構、雙向流水線并行架構)實現了從“拼算力”到“拼算法”的跨越,推動AI應用成本大幅降低,但同時也對算力網絡提出了更高要求。他提到,在訓練場景中,DeepSeek模型因使用專家并行(EP,Expert Parallelism)技術導致的機間All-to-all通信流量翻倍,從而引發網絡擁塞增加;而推理場景中,PD分離的分布式處理對網絡時延提出了更高的要求。
星云智算網絡:GSE技術驅動無界互聯
針對上述挑戰,中國移動與產業伙伴聯合研發了GSE技術。該技術針對流量均衡、流量擁塞、低時延的需求提出了創新的解決思路:
容器化負載均衡:將數據封裝為固定長度的“容器”均勻噴灑,鏈路利用率趨近100%,較傳統方案大幅提升;
主動流控機制:引入“CREDIT授權”模式,將流量推送變為流量拉取,從根源上避免多打一擁塞問題;
智能糾錯優化:通過靈活前向糾錯(FlexFEC)技術動態適配鏈路誤碼率,在保證傳輸可靠性的同時減少糾錯時延。
中興星云智算網絡已通過軟件升級實現GSE E2E功能,并計劃在2025年推進現網驗證。此外,中興星云智算網絡方案的99X系列設備憑借60倍于盒式設備的緩存容量,可高效應對DeepSeek等模型高All-to-all流量場景,顯著提升突發流量吸收能力,降低網絡擁塞程度,是DeepSeek等模型的最佳網絡方案選擇。
GSE技術突破:從標準驗證到超大規模組網
“最終我們的目標是實現GSE N2N方案,不依賴于網卡、GPU能力,從網絡層面解決智算場景流量大、擁塞多等問題。這兩年,中國移動牽頭業界同仁一起發布了GSE標準并進行了相關能力驗證;下一步,我們將把驗證確認的技術固化到智算網絡方案中。”該GSE N2N方案兩層組網的情況下可鏈接2萬張400GE接口GPU卡,三層組網的情況可支持最大50萬卡以上集群互聯,大大超車傳統ROCE技術的組網規模,為智算網絡提供高吞吐、全均衡、低時延的底座支撐。
展望:技術協同推動產業升級
GSE技術不僅是網絡協議的革新,更是算力網絡從“可用”向“高效”躍遷的關鍵。中興通訊將與中國移動攜手并肩,秉承“星云智算網絡,自主領航、解耦共生”理念,積極推進GSE技術商用落地,通過"算法+算力+網絡"的協同創新加速AI普惠進程,共推國產智算生態加速繁榮。