C114訊 9月11日消息(岳明)數字中國建設如火如荼,企業業務與新一代信息技術深度融合,ICT基礎設施的高效運轉已逐步轉變為企業發展的核心競爭力。隨著ICT基礎架構愈發龐大、復雜,運維工作面臨著規;、復雜化、智能化等挑戰。據Gartner預測,到2025年部署在云原生平臺的IT系統將增至95%,IT運維模式革新和運維平臺轉型已成為大勢所趨。
新華三集團作為中國IT統一運維軟件市場上的“五冠王”,憑借創新實力領跑。新華三集團智能管理與運維產品線總經理敖襄橋在接受C114采訪時指出,智能運維強調的是AI賦能,通過自動化和預測分析來減少人工干預,提高IT運維的效率和效果,而統一平臺則是實現變革的基礎。
新華三集團智能管理與運維產品線總經理 敖襄橋
正是基于對產業技術變革的深刻洞察,在2023領航者峰會上,新華三集團重磅發布U-Center5.0統一運維平臺,面向云智原生時代的企業運維新需求,U-Center基于AI能力,以“統一門戶、統一告警、統一資源、統一流程、統一分析”五大特點,重塑智能運維新模式,助力百行百業用戶持續降低基礎設施與應用的統一運維復雜度,從容迎接智能化變革。
瞄準客戶痛點
敖襄橋指出,“統一”是U-Center5.0的核心關鍵詞。“我們在與很多客戶的交流中發現,統一是客戶比較明顯的痛點。在客戶的運維系統中,安全域、網絡域、計算域等都可能有特定的運維軟件,而且都是割裂的,數據無法拉通,問題定位復雜,運維人員會面臨很多困擾。”
能不能把按照功能分域,把相互獨立的運維系統拉通,進一步降低運維復雜度呢?新華三集團對U-Center這一廣受市場與客戶認可的平臺進行了新一輪迭代,推出了U-Center5.0統一運維平臺,賦予統一運維新內涵。
統一門戶,打通邊界:U-Center通過入口統一、風格統一、數據拉通、操作拉通,打通了運維邊界,實現云、網、端異構全域混合資源的“一站式”管理,運維效率可提升60%。
統一告警,價值萃。篣-Center可將接收的所有資源告警統一處理、抑制、壓縮、統一轉發規則、統一升級策略,實現多個來源的告警統一管理,高效整合不同系統的告警信息,告警壓縮率可達95%以上。
統一資源,摸清家底:企業中共存不同系統,導致整體資源狀態及變化不可視。U-Center以CMDB為資源管理中心,可對全局資源進行統一建模、接入、關聯、調和一致,讓IT資產全域可視、可管、可用,各種維度資源情況一覽無余,隨時掌控全局。
統一流程,提升效率:U-Center通過流程接入規范和流程自定義,實現運維業務全流程端到端可視化和持續優化,讓服務響應更敏捷、團隊協作更有效、故障恢復更快捷、服務更滿意。
統一分析,優化治理:U-Center匯集多來源、多類型的運維數據,通過數據基建、數據資產、數據服務、數據應用實現多級價值提升;基于AI能力實現多場景智能運維,充分萃取數據價值,為業務運營運維提供數據分析和決策支撐。其實,不僅僅是多域,在“多云”環境下,U-Center 5.0也同樣游刃有余。在實際生產過程中,每個云廠家提供的能力都不一致,U-Center 5.0構建了一個中間的適配層,把各個廠家公共的能力抽出來做適配,盡量屏蔽多運維層造成數據不統一。
實現全場景落地
當前企業IT基礎架構規模越來越大,架構越來越復雜,產品與應用迭代的速度很快。在這樣的背景下,運維人員如何進行快速的故障診斷和業務恢復呢?新華三將IT統一運維切入點放到了網絡上。
“從新華三自身的IT實踐來看,故障可以映射到網絡層、應用層以及用戶體驗層,但網絡層出現故障對系統的影響最大,故障定位也是優先從網絡找起。從客戶的角度來講,看到的是網絡中斷或者是反應緩慢,排除網絡的問題再看應用,一層層迭代的定位。”敖襄橋指出,“我們運維團隊是基于網絡來孵化的,這也體現新華三在網絡層面運維的獨特優勢和多年積淀。網絡只是切入點,新華三的智能運維已經覆蓋了包含數據中心、園區網、廣域網等ICT領域里所有的計算與網絡架構,可以幫助客戶實現ICT基礎設施+應用的全棧智能運維。”
在數據中心場景,新華三可以基于總體意圖來完成網絡自動化配置,引入數字孿生系統,讓客戶在做所有變更之前,在孿生系統中進行包括配置解決、網絡的可達性的驗證,提前確認變更是不是可以達到預期;對數據中心網絡故障,做快速自動化的故障診斷與規避,自動化下發策略,進行故障隔離與處理提示。
在園區網場景,新華三最關注的是接入,在園區無線化的趨勢之下,如何實現漫游、海量、多制式終端的無縫接入和最佳體驗。新華三可以通過智能分析能力來獲取包括AC、AP以及核心交換機的運行數據,對終端和用戶進行數據解析和跟蹤,保證園區接入。
在廣域網場景中,客戶其實關心的是成本和服務質量,新華三智能運維希望給客戶呈現的是基于服務質量自動廣域網鏈路選擇,更多強調的是整個廣域網鏈路的SLA(服務等級協議)測量,基于客戶的策略和SLA測量的結果來做廣域網鏈路的調度優化。
當然,要實現全應用場景的落地,背后離不開不斷地技術創新。比如在服務質量測量方面,傳統的服務質量是通過撥測來實現,新華三則應用了隨流檢測技術,通過真實業務流量情況下測出來的網絡狀態數據,反饋到算法中,幫助客戶做出廣域網鏈路的最佳選擇。
加速駛向AI大模型時代
敖襄橋認為,運維的技術領域非常寬,既要懂各種數據中心內的IT基礎設施相關技術,還要懂云原生、智原生技術,搞得定應用軟件架構;既要能理解硬件設備是怎么工作的,還要理解應用軟件是怎么運轉的。所以新華三一直認為,要想把運維做好,需要非常強的領域知識背景。AIGC技術,恰好具備吸收消化,壓縮大量知識的能力。AIGC的出現與逐步成熟,極大加速了IT智能運維的發展進程。“沒有AIGC能力的加持,智能運維技術主要是面向KPI數據的趨勢預測和故障診斷等;AIGC的出現,實現了完整專家經驗注入,讓我們看到了一個解決問題的新方法,新思路,新華三也將全面擁抱AIGC。”
在IT智能運維大模型打造上,新華三集團是“站在巨人肩膀上”,“要落地AIGC能力,首先,是聚焦新華三過往20年的內部積累數據,包括大量的ICT領域知識語料,各種產品手冊和技術文檔,也包括大量各種客戶側問題、故障的協助處理記錄,工單信息等。這些數據都可以被加工為高質量的新華三獨有的ICT領域運維數據集;同時,密切關注學術界的技術進展和跟蹤通用大模型的趨勢,基于新華三的歷史經驗積累數據和學術界的進展,為客戶提供有新華三知識注入的ICT領域、智能運維領域的大模型。”
敖襄橋表示,出于安全性和隱私保護等多方面的考慮,在AIGC模型的部署和應用方面,大部分客戶會選擇進行本地部署。當前AIGC大模型的本地推理部署會面臨一定的計算資源瓶頸。但新華三相信,隨著技術的進步,產業的成熟,大模型推理的算力瓶頸將較快地得到解決。“我們給客戶推薦的是新華三調優過的大模型,這個大模型比開源大模型在智能運維領域有更強的優勢。如果客戶有較充裕的計算資源和豐富的自有私域運維數據,新華三可以進一步提供服務,支持客戶在本地去構建自有私域運維大模型,基于新華三大模型做私域模型的微調;還可以直接將私域知識加工后,通過外掛知識庫的方式,掛接到本地部署的新華三運維大模型上來。”
當全面引入AIGC賦能后,未來的運維工程師日常工作是什么樣的?當一個故障發生后,系統會把中斷的日志信息、告警信息推給AIGC大模型,它會快速給出一個診斷步驟和修復方案,幫助運維人員一步一步地找到故障根因,定位和修復故障;除了給出快速排障的應急方案外,大模型還會預測出可能發生類似故障的模塊并建議盡快進行替換,甚至是進一步幫助用戶提出優化網絡結構方案,避免未來再出現單點故障引起的此類問題。