Gitee AI 剛剛上線了DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四個(gè)較小尺寸的 DeepSeek 模型。值得關(guān)注的是,本次上線的四個(gè)模型均部署在國(guó)產(chǎn)沐曦曦云 GPU 上。
與全尺寸 DeepSeek 模型相比,較小尺寸的 DeepSeek 蒸餾版本模型更適合企業(yè)內(nèi)部實(shí)施部署,可以極大的降低落地成本。
同時(shí),這次 Deepseek R1 模型 + 沐曦曦云 GPU + Gitee AI 平臺(tái),更是實(shí)現(xiàn)了從芯片到平臺(tái),從算力到模型,全國(guó)產(chǎn)研發(fā)、中國(guó)制造。
100%國(guó)產(chǎn)AI的力量
國(guó)產(chǎn)模型 DeepSeek R1
DeepSeek R1 是一款大型混合專家(MoE)模型,擁有 6710 億個(gè)參數(shù),支持 128000 個(gè) Token 的大輸入上下文長(zhǎng)度。在數(shù)學(xué)、代碼和自然語(yǔ)言推理等任務(wù)上表現(xiàn)出色。
本次部署在沐曦曦云 GPU 上的是四個(gè) DeepSeek R1 蒸餾模型,以更小參數(shù)量的資源占用,實(shí)現(xiàn)了性能與大參數(shù)模型旗鼓相當(dāng)。
國(guó)產(chǎn) GPU 沐曦曦云
曦云系列通用 GPU 產(chǎn)品(包括 C550、C500、C500X、C290、C280、N260 等型號(hào))采用完全自主研發(fā)的 GPU IP,擁有完整的知識(shí)產(chǎn)權(quán),并具備強(qiáng)大的多精度混合計(jì)算能力及高帶寬顯存支持。同時(shí),沐曦產(chǎn)品搭載先進(jìn)的時(shí)空互聯(lián)技術(shù)和全球兼容的 MXMACA 軟件棧,可廣泛應(yīng)用于智能、通用計(jì)算和數(shù)據(jù)處理等場(chǎng)景。
在本次部署適配工作中,得益于沐曦曦云良好的 CUDA 兼容性,同時(shí)得到沐曦的算力供應(yīng)商超訊通信的鼎力支持,最終實(shí)現(xiàn)了模型的快速部署、穩(wěn)定調(diào)用。
國(guó)產(chǎn)平臺(tái) Gitee AI
2024 年初上線以來(lái),Gitee AI 平臺(tái)以 Serverless API、模型引擎、AI 應(yīng)用為核心功能與服務(wù),致力于讓開(kāi)發(fā)者輕松構(gòu)建和部署 AI 應(yīng)用,為企業(yè)客戶提供更加智能、高效的 AI 應(yīng)用解決方案。
100%國(guó)產(chǎn)AI免費(fèi)跑
目前 Gitee AI 上的DeepSeek-R1-Distill系列模型現(xiàn)已面向全體開(kāi)發(fā)者免費(fèi)使用!免費(fèi)使用!免費(fèi)使用!
本次上線的模型參數(shù)雖小,但它們表現(xiàn)并不亞于大參數(shù)模型,如下圖中的DeepSeek-R1-Distill-Qwen-14B,雖然參數(shù)較小,但簡(jiǎn)單任務(wù)相較于大參數(shù)模型其響應(yīng)速度更快,同時(shí)也具備體現(xiàn)思考過(guò)程的能力:
模型自強(qiáng)、算力自強(qiáng)、平臺(tái)自強(qiáng),100%國(guó)產(chǎn)AI的新時(shí)代已然來(lái)臨。我們一起在國(guó)產(chǎn) AI 的土壤上,種出下一個(gè)時(shí)代的參天大樹(shù)。
訪問(wèn) Gitee AI,體驗(yàn)基于沐曦算力的 DeepSeek R1,開(kāi)啟你的100%國(guó)產(chǎn)AI開(kāi)發(fā)之旅!