C114訊 4月17日消息(九九)過去幾年,大模型掀起算力基礎設施建設的“軍備競賽”,對用于數據中心光互聯的高速數通光模塊需求顯著增長,且速率從400G迅速迭代到800G,再到1.6T。在此背景下,“超大規模智算中心:1.6T時代的全光互聯”研討會于4月17日下午舉辦,就智算中心內光互聯進行深入探討,展示光互連技術的最新進展情況,介紹未來發展趨勢, 推動智算中心互聯技術的創新發展。
中國移動研究院基礎網絡技術研究所副所長程偉強在會議演講中表示,大規模智算集群時代,高性能訓練和推理服務需要超大規模算力支撐,網絡成為算力效率的瓶頸。隨著智算網絡卡間互聯提升單點算力、機間互聯擴展集群規模、集群間互聯拓展分布式算力集群能力,1.6T以太網成為業內關注的焦點。
1.6Tb/s以太網成為智算中心互聯關鍵布局方向
當前,AI推動全球基礎設施廠商加速1.6T技術驗證和產品研發,國際標準組織IEEE、OIF等也已開展1.6TE標準制定工作。
聚焦智算中心內互聯,IEEE802.3dj正在制定D1.5版本草案,覆蓋單通道200G的1.6TE DR8/DR8-2單模標準,支持FECo和FECi兩種FEC模式,2025年5月進入D2.0工作組階段,預計2026年中發布;802.3NEA目前正在討論200G/L MMF光接口、400G/L SMF光接口等技術,支持1.6TE的架構優化和技術演進。
200G/lane多模光技術是傳統DC、智算中心內的1.6TE 100m內短距互聯優選解決方案;目前802.3NEA已開展200G/lane MMF Optical PMDs討論,中國移動正在參與200G/lane MMF CFI,后續將聯合推動成立SG或TF。400G單通道技術對優化1.6TE系統架構、提升系統性能和降低整體功耗有重要意義,是1.6TE技術標準的演進方向。
聚焦智算中心間互聯,簡化相干技術在IEEE 800GE速率已下沉至10km,同時新增ER1-20標準,支持ER1-20、ER1、ZR/ZR+接口的互操作。OIF已領跑1.6T相干,同步開展1600ZR和1600ZR+標準化研究,IEEE暫未開展1.6TE相干標準研究;從技術可行性、互操作和共產業平臺等方面考慮,1.6TE相干覆蓋2km~40km場景并采用統一方案將會是標準化和產業化的優選方案。
目前,國內外多個OTT正逐步構建跨智算中心分布式訓練環境,已開始部署彩光方案以優化網絡性能,這一領域正成為業界關注的焦點。OIF 800ZR標準已于2024年底發布,將在2025年迎來試點驗證元年;1.6T ZR/ZR+在智算互聯帶動下將進入快速發展期。
GSE-N2N和GSE-E2E滿足不同GPU服務器組網需求
面向智算中心內和智算中心間組網,中國移動分別推出GSE和UDCI技術體系。
其中,全調度以太網(GSE)采用統一設計理念及技術架構,構建GSE-N2N和GSE-E2E兩大場景,滿足不同GPU服務器組網需求。GSE-N2N是純網側優化方案,在網側運行GSE,網卡不感知網絡行為,無額外功能要求,適配華為昇騰GPU等直出網卡服務器;GSE-E2E是端網協同優化方案,部分功能下沉網卡,實現端網協同,適配英偉達GPU等配置獨立網卡服務器。
目前,中國移動已經完成現網百卡級GSE-N2N中試平臺中試驗證,網絡性能較傳統RoCE網絡提升50%以上;并發布GSE-N2N首套千卡級商用方案和全套技術標準及GSE網卡芯片—“智算琢光”。后續希望聯合合作伙伴推動GSE-N2N萬卡級驗證系統發布。針對GSE-E2E場景,計劃年內將200G GSE網卡芯片推向商用。
隨著1.6T ZR/ZR+被廣泛采用,光和IP的融合是必然趨勢。中國移動基于IP+光融合打造的超級數據中心互聯技術體系,面向跨智算中心高突發、多并發“大象流”傳輸帶來的網絡運力受損、算效下降等問題,突破3大創新技術,打造具備超大帶寬、超精細流控、超高安全的智算互聯網絡基礎設施,助力AI大模型分布式訓練、AI普惠推理、存算分離等新型智算業務的創新及應用。
一是創新提出10T級聚合通道SuperPipe技術,基于報文組分發的廣域網以太網端口聚合機制,實現單通道400G-32T自適應帶寬調整,解決傳統鏈路聚合技術(LAG、ECMP)無法滿足跨智算中心出口收斂情況下的負載均衡難題。
二是創新提出微流級精準流控MicroPFC,切片ID標識微流,將擁塞情況在網絡內部逐跳反壓,支持百萬級微流,突破傳統網絡僅支持端口級8隊列反壓瓶頸,實現長距離精準擁塞控制。
三是原創以太網物理層比特流加密機制——物理層安全PHYSec,解決傳統IPSec、MACSec基于報文加密大開銷、高時延問題,實現0開銷、全加密、納秒級時延的線速加解密。
截至目前,中國移動已經發布《新型智算中心以太網物理層安全(PHYSec)架構白皮書》,在CCSA完成PHYSec總體技術要求和高速直檢鏈路數據面技術要求立項,已推動芯片和光模塊廠家開始技術驗證和芯片開發,下一步計劃推出原型芯片和原型光模塊,完成多廠家互通測試。