日韩综合网-日韩综合网站-日韩综合一区-日韩综合在线视频-色涩网站-色涩网站在线观看

C114通信網  |  通信人家園

專題
2024/10/21 15:59

鑄引擎、破難題、建樣板:移動云以智算服務體系為基,助力千行萬業擁抱AI+時代

C114通信網  蔣均牧

C114訊 10月21日專稿(蔣均牧)技術的每一次突破,都創造了無限的可能。過去數年中,我們共同見證了人工智能的迅速崛起和跨越拐點——從前沿科技到貼身助理、從星空探索到衣食住行,AI技術正以驚人速度融入眾多場景,在數字經濟發展中發揮越來越重要的作用,成為新質生產力核心驅動因素和新的生產工具。

人工智能當前已經上升為國家戰略,今年的政府工作報告中明確提出要深化大數據、AI等研發應用,開展“人工智能+”行動,打造具有國際競爭力的數字產業集群。在硬幣的另一面,AI的技術迭代和應用普惠,離不開強大算力的支持;在各行各業落地AI大模型以賦能產業升級的過程中,也依然存在著不少難點、痛點。面向AI+時代,易獲取且好用的智算產品及服務無疑是擁抱變革浪潮、共建繁榮業態的關鍵所在。

作為云計算和AI領域的“國家隊”,移動云在智算賽道上耕耘多時、領勢先行。就在剛剛召開的2024中國移動全球合作伙伴大會上,移動云攜算網研發最新成果及智算服務體系精彩亮相,全面展現了其綜合優勢及卓越能力。以此為契機,C114赴蘇州采訪到了中國移動云能力中心平臺產品部總經理齊驥,請這位移動“大云”項目最早參與者之一、享受國務院津貼的資深專家與我們分享對AI+時代云服務的思考、解讀移動云的新時期布局,特別是在促進AI大模型落地應用方面的創新與實踐。

他指出,算力主體由通用算力轉向智能算力已是大勢所趨,移動云擁有較大的用戶規模、廣泛的資源布局、靈活的算網大腦調度能力和云智產品技術積累,在此基礎上致力于加快推動“由算融智”、打造AI服務入口、探索更多應用場景,為智算產業的健康發展和千行萬業的數智化轉型注入源源不斷的動力。

多管齊下,鑄就AI+時代強引擎

生成式AI、AI大模型等AI技術的蓬勃發展和在行業中的走實向深,帶來了對算力尤其智能算力需求的爆炸性增長,讓算力成為如“水電煤”般一點接入、隨取隨用的社會級服務已經演變為一種“剛需”。2023年10月,工信部等六部門對外發布《算力基礎設施高質量發展行動計劃》,提出到2025年,算力規模超過300EFLOPS,智能算力占比達到35%,東西部算力平衡協調發展;今年9月,工信部等十一部門聯合發布《關于推動新型信息基礎設施協調發展有關事項的通知》,強調要優化布局算力基礎設施,逐步提升智能算力占比。

中國移動以“信息服務科技創新公司”為愿景,提出并大力推進“AI+”行動計劃。齊驥介紹說,移動云依托中國移動資源稟賦,從算力、網絡、調度、產品、生態等維度多管齊下,推動算力普及和高效利用,加速云服務走向“智算原生”,構筑AI+時代強引擎。

其一是打造“超級工廠”,釋放算力集群優勢。加快算力基礎設施向通智超量一體化演進,打造多元泛在、綠色低碳的智算集群,強化超算、量算等社會算力并網。面向“AI+”升級,中國移動今年著力深化N個全國性智算中心與X個邊緣智算節點建設布局,計劃年內建成三個超萬卡智算中心、總規模近6萬卡,在1500個邊緣節點按需部署推理卡,形成“中心大集群、邊緣廣分布、中訓邊推、訓推一體”的智算網絡。

其二是暢通“信息高速”,發揮網絡規模優勢。中國移動在完成國家八大算力樞紐節點間400G全光高速直連基礎上,開展800G/1.2T超高速下一代網絡、廣域高吞吐協議等試點驗證,深化覆蓋全國的算力三級時延圈,通過在網絡方面的持續創新,將為AI訓推一體提供低時延、大帶寬、高可靠、強彈性的互聯能力。

其三是研發“調度中樞”,筑牢算網融合優勢。中國移動將利用自主研發的算網大腦,實現全網調度能力和智能化水平的全面躍升,進一步提升算力資源使用效率和效能,支撐更多國家級、樞紐級調度平臺的構建。

其四是建設“策源之地”,構建核心能力優勢。中國移動將依托AI智能基座,錨定AI供給者、匯聚者、運營者定位,構建“4個1”智算能力體系,即升級1個AI+算網底座、升級1個智能云內核、創新1個MaaS平臺、重塑1批AI+應用服務。

其五是開放“產業生態”,推動算力模型融通。開展“百川”算力并網行動計劃,覆蓋通、智、超、量多種算力類型,實現昆山超算中心、許昌智算中心、波色量子等3.4 EFLOPS社會算力并網。模型生態匯聚自研、開源及三方商業大模型,與行業龍頭共建行業大模型,打造最大規模、最開放的模型生態,推動AI+融合創新應用加速落地。

震澤平臺,破解大模型訓練難題

AI大模型被公認為是推動行業變革的關鍵因素,得益于政策和需求的雙輪驅動,千億、萬億參數規模的大模型不斷涌現、性能也越來越強。但是對傳統產業來說,AI大模型的落地應用面臨不少挑戰,例如大模型訓練尚處在早期階段,存在著效率低、不穩定、門檻高等明顯短板,智算資源池從“建起來”到“易用好用”,還有很長的路要走。

“隨著參數規模和訓練樣本的增加,千億大模型預訓練周期大約在45~60天,但千卡集群穩定訓練時長平均只有2天。雖然業界已有斷點續訓的通用能力,但故障定位、任務恢復往往需要消耗幾個小時。同時,由于檢查點非實時保存,依舊存在歷史訓練記錄的丟失,從而損失算力的有效訓練時間。”齊驥舉例說。

有鑒于此,為加快AI大模型在行業中的落地,移動云創新打造了一站式智算平臺——震澤智算平臺,以系統性地解決當下的矛盾。該平臺具備異構算力納管、萬卡并行訓練、全棧國產化適配、“通、智、邊”一體化等多類突出能力,能夠為用戶提供更快、更穩、更好的大模型訓推體驗。在訓練效率問題上,設計和開源了彈性資源管理架構KOSMOS,池化智算算力,實現萬卡算力資源分鐘級創建,開箱即用;通過數據預熱和緩存加速,IO性能提升20%,成本壓縮三分之一;通過梯度分段聚合以及算子融合加速等技術,將國產芯片MFU從35%提升至46%。

在長穩訓練層面,移動云首創了惰性續訓技術,當故障來臨時,健康節點忽略故障繼續訓練,因故障發生而掉隊的節點則通過彈性供給快速補齊。利用新增資源追趕訓練進度,結合內存實時檢查點實現故障恢復時間相比主流水平壓降90%,做到斷點不斷訓,實現了千卡25天超長穩訓。

在訓推平臺易用性層面,移動云提供了一體化工具鏈。依托算網大腦實現通智邊一體化調度,結合數據快遞實現模型訓中熱遷移,各智算中心資源化零為整;同時提供模型一鍵轉換能力,轉換好的模型自動推送到邊緣異構芯片進行推理,為客戶屏蔽底層異構芯片的差異以及資源跨域的感知。

齊驥表示,移動云智算平臺在產品設計上遵循了安全可靠、穩定高效、異構解耦和用戶導向四大關鍵原則。在安全可靠上,移動云于2023年高分通過公安部網絡安全等級保護四級認證,并已獲得20多項安全資質。智算平臺基于移動云的安全防線,通過首創的KOSMOS管理架構,實現租戶間安全物理隔離,確保了多租戶環境下的數據隱私與操作獨立性。在穩定高效上,首先將斷點續訓升級為業界首創的惰性續訓,做到斷點不斷訓;同時,結合數據預熱、緩存加速、梯度異步聚合、算子融合加速等核心技術將訓練成本壓降15%以上,訓練效能提升11%。在異構解耦層面,移動云通過支持英偉達和國產芯片模型的一鍵互轉,將訓推任務與芯片解耦,結合算網大腦實現訓練推理任務在異地和異構算力上的靈活調度。最后,堅持以用戶為導向,深度整合市場需求、客戶訪談等多維度信息,捕捉用戶真實需求,進而驅動產品功能創新與交互設計的持續優化,確保每一項改進都緊密圍繞用戶需求。

多方實踐,打通AI落地“最后一公里

基于海量算力資源,移動云現已上線自研震澤智算平臺、大模型服務平臺,提供模型訓推、智能體開發等全鏈路模型及應用工具鏈,助力打通AI大模型行業落地的“最后一公里”。其中,大模型服務平臺匯聚了開源、九天以及三方商用大模型,建設“L0基礎模型+L1行業模型+L2行業智能體+模型服務”的體系化生態服務內容,攜手合作伙伴共建面向用戶需求的商業閉環。

“行勝于言”,相比于市場上并不鮮見的“口號式”創新,移動云已經拿出了實實在在的實踐成果。齊驥在采訪中與C114分享了幾個成功故事,這在一定程度上或可視作引領發展方向的一座座“燈塔”。

中國移動云能力中心作為一個擁有3000名以上程序員的研發型單位,積累了海量代碼數據,研發成本在整體成本支出中占比較高。移動云自主研發并發布了湛盧代碼大模型,基于九天大模型基座,圍繞包括代碼問答、代碼補全、單元測試等在內的IT研發8大核心場景進行特定優化,支持100種以上編程語言,具備文生代碼、圖生代碼、企業私有知識庫等特色功能。目前,湛盧代碼助手已經在移動云內部全面推廣使用,覆蓋開發、測試、運維研發全流程,預計今年將為移動云降低10%研發成本。

移動云在能源、物流、政務等領域均有大模型相關的落地項目,涵蓋多種應用場景。例如在能源行業,移動云攜手兄弟單位助力客戶實施智能化升級,通過發揮中國移動算力網絡優勢,為客戶提供從資源到平臺、到模型服務的端到端產品能力,助力客戶得以快速具備400P的智算資源;搭建統一調度管理平臺,為上層九天提供豐沛算力,支持各個業務場景使用。

再比如在物流行業,面對人工客服標準化程度低、坐席緊張的情況,移動云攜手物流公司打造物流客服大模型,AI客服可解答85%以上的用戶問題,同時在并發場景下回復速率更快,從而提高了整體效率和客戶滿意度。

齊驥告訴C114,移動云正在積極推進大模型在各個行業的應用落地,目前在教育、醫療、工業、交通等多個行業都看到了細分場景需求。

在生態方面,移動云為合作伙伴提供了DICT庫、MaaS云市場、聯合實驗室等多種合作方式,并且除了開發工具等技術能力上的支持,還提供了算力補貼、技術大賽、沙龍活動等政策扶持。未來將持續打造完備的模型及應用生態,幫助各個合作伙伴實現自己的智能服務。

面向未來,加快實現商業閉環

超大規模智算集群是AI大模型發展的技術基礎。然而“技術可行”不等于“商業可行”,AI技術未來應朝著可持續的商業閉環路徑邁進。如何激發AI應用市場需求以拉動整個AI產業鏈的發展,是一個亟需探索的方向,這也意味著對于算力的需求將從模型訓練到模型應用,更強調計算的高性價比、彈性伸縮和低時延。

“人們總是高估新技術的短期影響,卻低估其長期價值。電氣技術也是在成熟了30年以后才逐漸走向廣泛應用,引發電氣革命。現在去擔憂AI會不會替代或者淘汰人還為時過早,而是要將重點放在AI的普及上來。”齊驥強調。

他介紹說,過去一年中,AI在軟件研發領域的應用已經變得更加廣泛和深入,各類“AI程序員”概念產品頻繁出現。談到,移動云根據自身的技術實踐和行業洞察,AI在該領域將從輔助代碼開發向輔助軟件研發全流程發展、從輔助人類向自主編程發展。

“技術為根,人才為本”,AI的發展是一項長期復雜的體系化工程,以大模型為例,其全流程就涉及了算力底座、數據準備、模型使能、業務應用等多個環節。各行各業在實現AI大模型落地應用的過程中,也亟需由內而外構建起相應的能力。因此對智算與大模型相關人才的需求將進一步凸顯。

齊驥表示,任何一個產業的發展,都離不開大量人才的支持。智算人才的培育,需要“政產學研”各方共同發力。移動云除了自身通過內培、競賽等方式,促進內部人才的成長,還致力于與高校合作,讓在校生更早地接觸到AI知識、激發他們對新技術的興趣,從而形成立體、綜合、成批次的人才培育體系。

“在未來幾年內,我們希望構建更穩定、易用、好用和普惠的算力服務,供給越來越多的AI應用服務構建智算商業閉環,讓‘能用’的技術可行,轉變為‘人人用’的商業可行。側重解決算力運營中的問題,解決規模化、集約化和高性價比等難題。”在采訪的最后他這樣展望道。

寫在最后

人工智能被譽為是21世紀社會生產力最為重要的賦能技術。“科技預言家”、知名科技雜志《連線》創始主編凱文·凱利(Kevin Kelly)曾預測,未來百年里,人工智能將超越任何一種人工力量,將人類引領到一個前所未有的時代。今年的諾貝爾物理學獎和諾貝爾化學獎也都與AI相關。

如今,我們正處在AI起勢的關鍵階段。移動云在智算及AI大模型方面的思考與實踐、布局與成果,既為AI的普惠化、產業化、規模化發展插上了翅膀,也為各行各業的智能化升級提供了利器,還給AI+時代的云服務樹立了標桿。攜手移動云,共同在新一輪創新變革浪潮中破浪前行,擘畫數改智轉更美好未來,時不我待!

給作者點贊
0 VS 0
寫得不太好

版權說明:C114刊載的內容,凡注明來源為“C114通信網”或“C114原創”皆屬C114版權所有,未經允許禁止轉載、摘編,違者必究。對于經過授權可以轉載我方內容的單位,也必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和本站來源。編譯類文章僅出于傳遞更多信息之目的,不代表證實其描述或贊同其觀點;翻譯質量問題請指正

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯系我們 | 網站地圖 | 手機版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網 版權所有 舉報電話:021-54451141

      主站蜘蛛池模板: 中文字幕国产专区 | 最新在线精品国自拍视频 | 精品日韩欧美一区二区三区 | 手机毛片在线观看 | 国产a级精品特黄毛片 | 欧美色综合高清视频在线 | 亚洲视频中文字幕在线 | 中文字幕成人免费高清在线视频 | 国产精品美女免费视频大全 | 一级毛片免费播放视频 | 久草在线视频资源 | 黄色欧美网站 | a级黄色毛片免费播放视频 a级精品九九九大片免费看 | 国产成人教育视频在线观看 | 国外精品视频在线观看免费 | 欧美japanese孕交 | 欧美精品videosbestsex另类 | 久久亚洲精品无码观看不卡 | 日本www高清免费视频观看 | 久草热久草视频 | 国产成人精品午夜在线播放 | 午夜亚洲 | 步兵精品手机在线观看 | 高清在线一区二区三区亚洲综合 | 日韩欧美视频在线一区二区 | 亚洲视频在线观看一区 | 亚洲三级黄色片 | 成人软件18免费 | 国产在线播放一区二区 | 国产精品99在线观看 | 欧美一级成人影院免费的 | 国产香蕉在线视频一级毛片 | 亚洲高清视频在线观看 | 国产亚洲精品一区二区三区 | 国产网曝手机视频在线观看 | 亚洲永久| 精品国产91久久久久久久a | 一级一片免费视频播放 | 国产精品极品美女自在线看免费一区二区 | 亚洲美女一级片 | 亚洲欧美国产高清va在线播放 |