C114訊 7月19日消息(岳明)昨日,“2024中國高質量發展論壇”的第六場線上論壇——“智能光網絡技術專場”順利舉行。論壇邀請來自產業界及學術界的多位重磅嘉賓,圍繞智算時代下光網絡的架構和關鍵技術,AI大模型在DCN和DCI等多種場景中的應用實踐,光網絡通感一體/光算一體等熱點話題,進行深入探討。
會上,諾基亞貝爾基礎網絡業務集團光網絡事業部總經理張寒崢應邀作了題為《面向AI的新型光底座》的主題演講。張寒崢指出,任何技術的演進都離不開市場環境和需求的驅動,新質生產力正全面推動網絡演進和技術創新,算力成為新的基礎能源,而目前炙手可熱的AI人工智能則成為了新的生產工具。
張寒崢表示,人工智能大模型的技術快速迭代,帶來算力需求的激增,其中除GPU滿足的數據計算需求外,還有海量數據傳輸需求,數據能否高效傳輸決定了算力的上限。應對AI浪潮所帶來的新趨勢與新需求,諾基亞貝爾給出的答案可以用8個字來概括“大道至簡,芯智合一”。所謂大道至簡,諾基亞貝爾的理解是客戶和應用對光網絡的最根本的需求是提速降本;所謂芯智合一,意味著基于芯片的超強感知能力和最新應用技術的開發,比如通感一體、數字孿生、AI等的賦能,最終將賦予光網絡前所未有的自智能力。
四大特性:AI革命重新定義數據中心架構
隨著人工智能和大數據技術的快速發展,算力特別是智算需求,呈現爆炸性增長,但主要由GPU服務器聯網構成的智算中心需要完全不同的網絡架構。張寒崢指出,作為承載上層業務的重要基礎設施,在AI時代,光網絡應該具備強大性能、低碳節能、極簡運維和快速創新四大特性。
以DCN場景為例,相關數據顯示,數據中心內部數據中心交換機AI networking 總帶寬2021~2027 CAGR 高達126%,特別是2023年同比增長超過400%。從能耗角度來看,AI服務器產生的熱量是CPU服務器的5倍,冷卻請求是10倍。2022年,數據中心用電量占美國總用電量(約1300億千瓦時)的2.5%,預計到2030年將增加兩倍,達到7.5%。
不僅是在DCN場景,面對超級大模型的算力需求,分布式(Scale-out)智算中心是必選項,這就需要大帶寬、低時延、高可靠的光傳送網;而在某些特定場景下,邊緣智能則將成為用戶的首選,開放解耦、網絡可編程就成為了用戶關注的重點。
更重要的是,在大模型應用中,AI算法中的梯度同步要求最小的時延以便降低GPU的等待時間;RoCE v2采用的go-back-N的重傳方式,不支持亂序接收,0.01%的丟包率就會讓RDMA吞吐率下降為0,網絡必須要具備無阻塞、低延遲、無損、安全的特性。
多層自智光網絡:實現感知、思考和行動閉環
張寒崢表示,客戶和應用對光網絡的最根本的需求是提速降本,隨著速度的提升,每比特功耗和成本也會不斷降低,而這正是諾基亞貝爾的發力點。
在光網絡性能方面,特別是在超400G方面,諾基亞貝爾已經走在行業前列。在今年5月份,諾基亞貝爾聯合聯通研究院、長飛光纖聯合發布800G超長距光傳輸紀錄,實現單載波800G [email protected]光纜的傳輸距離3000公里。
在張寒崢看來,諾基亞貝爾能夠實現網絡性能的持續領先,其核心競爭力在于一直堅持自研芯片,從2010年開始持續推出不斷創新的光子業務引擎PSE系列芯片,去年發布了基于5納米技術的PSE-6s,今年發布基于3納米技術的PSE-6c。“正因為有了這種自研芯片能力,才使得我們能夠把網絡最終能力發揮到極致。”
“諾基亞貝爾既考慮了長距大容量傳輸的要求,也會考慮網絡靈活可插拔的需要。”張寒崢指出。比如在海纜傳輸中,諾基亞貝爾是率先采用概率星座整形的廠家之一,支持按照0.1G波特率來進行精細微調,可以靈活地在編碼、調制方式、波特率、距離容量之間做一個完美的平衡,最大限度地釋放硬件和光纖能力。
張寒崢表示,隨著AI應用的逐步深入,網絡架構會越來越復雜,如何實現全程全網的端到端管理是非常關鍵的,諾基亞貝爾通過引入基于AI/ML的網絡自動化和數字孿生,支持客戶構建多層自智的光網絡,實現感知、思考和行動的端到端閉環。安全性也是諾基亞貝爾重點關注的領域。隨著AI技術的快速發展,網絡威脅也相應增加,安全變得更加重要。張寒崢表示,世界正在向量子安全經濟(Quantum-Secure Economy)過渡,傳輸通道也確實存在數據安全方面的要求。諾基亞提供了目前唯一的全網絡量子安全解決方案,可以面向任何服務、任何端口、任何時間提供L1/L2/L2.5/L3加密服務。
在光網絡領域,產業布局的完整性同樣是諾基亞貝爾的核心優勢,垂直整合將會成為優化芯片成本的重要路徑,同時通過更為先進的集成工藝,可以實現產品的整體造價最優。張寒崢強調,諾基亞貝爾的產品系統完整且不封閉,“我們希望有更多的中國本土供應商參與到生態系統中來,共同推動400G/800G技術的應用,更好地支持AI的發展。”