C114訊 5月16日消息(水易)從“鵝廠網事”微信公眾號獲悉,騰訊網絡團隊在近期啟動了自研CPO交換機在現網的規模化部署。
隨著生成式AI、超高清視頻等技術的爆發式增長,傳統數據中心正面臨帶寬密度、能耗效率和傳輸時延的“三重瓶頸”。同時AI系統架構也處于持續的變革之中,從單機8卡到超節點,Cable Tray、中板線卡、正交插卡等方案相繼被提出,傳統互連方案面臨銅介質傳輸距離受限、系統能效低下以及鏈路可靠性低等諸多難題。
光電合封CPO(Co-Packaged Optics)是將傳統外部的光電轉換器件變為硅光引擎與邏輯芯片集成在同一基板(Substrate)上,憑借高度集成的光電協同設計,CPO具有支持更高速率、降低功耗、提升可靠性、提升傳輸距離與集群規模等優勢。
早在2022年,騰訊網絡團隊便啟動CPO交換機的研發進程,當年即推出并點亮業界首款25.6T CPO數據中心交換機——Gemini,標志著該技術從實驗室走向產業化的重要里程碑。
騰訊Gemini CPO交換機
據介紹,Gemini交換機集成12.8T光引擎(OE),提供16個800G光接口,另外12.8T交換容量通過面板上的32個QSFP112可插拔接口提供。與同樣具備25.6T交換容量、128個可插拔接口的4U高度傳統交換機相比,Gemini的體積僅為傳統交換機的一半,同時功耗降低了26%、傳輸延遲也降低了20%。
CPO雖具備顯著的性能優勢,但其現網應用仍面臨諸多技術挑戰。為此,騰訊網絡團隊通過系統級架構優化突破性能瓶頸,依托實驗室環境完成嚴苛的性能測試,充分驗證了CPO技術在現網部署的可行性。基于前期充分的驗證積累,于近期啟動了CPO技術的現網規模化部署。
騰訊網絡團隊介紹,在部署上線過程中,CPO交換機帶來諸多優勢:CPO交換機憑借光口直出的設計,顯著提升了網絡建設的效率;CPO低功耗和高密度特性可以在同一機架中部署更多的交換設備,同時有效降低租金電費支出,基于上線后的功耗預估,采用CPO交換機后的電費可節省30%以上。
當然,CPO交換機引入也為網絡運營帶來了新的考驗。CPO OE需要ELS部件提供光源,一旦該部件發生故障,將導致多個光端口同時失效,進而可能引發大范圍的網絡故障。為了應對這一挑戰,網絡管理系統新增了采集ELS運行信息的功能,當ELS部件的運行狀態信息上傳至網絡管理系統后,系統會將該數據與CPO直出光端口的收發光情況進行實時交叉驗證,從而在ELS部件性能異常或直出光端口異常時提前發出告警,確保網絡服務質量。
騰訊網絡團隊表示,通過在真實運營環境中部署CPO交換機,不僅積累了第一手的建設運維經驗,還系統性地采集并分析多維度的運營數據。這一實踐不僅可以評估CPO技術在復雜網絡場景中的可行性與性能表現,更為后續在更多業務場景中的規模化應用奠定了堅實基礎。
原文閱讀: