由 NVIDIA 后訓練的全新 Llama Nemotron 推理模型,為代理式 AI 提供業務就緒型基礎
埃森哲、Amdocs、Atlassian、Box、Cadence、CrowdStrike、德勤、IQVIA、微軟、SAP 和 ServiceNow 與 NVIDIA 合作,率先推出推理 AI 智能體,改變工作方式
美國加利福尼亞州圣何塞 —— GTC —— 2025 年 3 月 18 日 —— NVIDIA 今日發布具有推理功能的開源 Llama Nemotron 模型系列,旨在為開發者和企業提供業務就緒型基礎,助力構建能夠獨立工作或以團隊形式完成復雜任務的高級 AI 智能體。
NVIDIA Llama Nemotron 推理模型系列基于 Llama 模型構建,提供按需 AI 推理功能。 NVIDIA 在后訓練期間對該推理模型系列進行了增強,以提升多步數學運算、編碼、推理和復雜決策能力。
與基礎模型相比,這種增強過程將模型的精度提高多達 20%;與其他領先的開放推理模型相比,優化推理速度達到了 5 倍。推理性能的提高意味著模型可處理更復雜的推理任務,增強決策能力,并降低企業運營成本。
包括{HYPERLINK "https://newsroom.accenture.com/news/2025/accenture-expands-ai-refinery-and-launches-new-industry-agent-solutions-to-accelerate-agentic-ai-adoption" \h}、、Atlassian、{HYPERLINK "https://blog.box.com/box-announces-support-nvidia-llama-nemotron-reasoning-models-box-ai-studio" \h}、{HYPERLINK "https://www.cadence.com/en_US/home/company/newsroom/press-releases/pr/2025/cadence-accelerates-ai-driven-engineering-design-and-science.html" \h}、{HYPERLINK "https://www.crowdstrike.com/en-us/press-releases/crowdstrike-nvidia-agentic-ai-collaboration/" \h}、德勤、、微軟、 和 的領先智能體 AI 平臺, 正在這一全新推理模型和軟件上與 NVIDIA 進行合作。
“推理和代理式 AI 的采用速度非常驚人,” NVIDIA 創始人兼首席執行官黃仁勛表示,“NVIDIA 的開放推理模型、軟件和工具為世界各地的開發者和企業構建高效的代理式 AI 團隊提供了堅實基礎。”
NVIDIA 后訓練為企業推理提高準確性和可靠性
Llama Nemotron 模型系列專為提供生產就緒型 AI 推理而打造,以 NVIDIA NIM™ 微服務形式提供,包括 Nano、Super 和 Ultra 三種規模,每種規模都針對不同部署需求進行了優化。
Nano 模型可在 PC 和邊緣設備上提供最高準確性;Super 模型能夠在單個 GPU 上提供最佳的準確性和最高的吞吐量;而 Ultra 模型將在多 GPU 服務器上實現最高代理準確性。
NVIDIA 在 上采用高質量精選合成數據進行大量后訓練,由 NVIDIA Nemotron™ 模型和其他開源模型,以及 NVIDIA 共同創建的其它精選數據集{HYPERLINK "https://blogs.nvidia.cn/blog/nemotron-4-synthetic-data-generation-llm-training/" \h}。
用于開發模型的工具、數據集和后訓練優化技術將全面開放,為企業提供靈活性,以構建自己的自定義推理模型。
代理式平臺與 NVIDIA 合作為各行業增強推理能力
代理式 AI 平臺行業領導者正在使用 NVIDIA Llama Nemotron 推理模型,為企業提供先進推理能力。
微軟將 Llama Nemotron 推理模型和 NIM 微服務集成到 Microsoft Azure AI Foundry 中。 此舉擴展了 Azure AI Foundry 模型目錄,為客戶提供增強服務的選項,如針對 Microsoft 365 的 Azure AI Agent Service。
SAP 正利用 Llama Nemotron 模型,推動 SAP Business AI 解決方案和 SAP 智能副駕 Joule 的發展。 此外,它還采用 NVIDIA NIM 和 NVIDIA NeMo™ 微服務,提高了 SAP ABAP 編程語言模型的代碼補全精度。
“我們正在與 NVIDIA 合作,將 Llama Nemotron 推理模型整合到 Joule 中,以增強我們的 AI 智能體,使其更加直觀、準確且具有成本效益。” SAP 全球 AI 負責人 Walter Sun 表示,“這些先進的推理模型將優化和重寫用戶查詢請求,使我們的 AI 能夠更好地理解問題,并提供更智能、更高效的 AI 體驗,從而推動業務創新。”
ServiceNow 正利用 Llama Nemotron 模型構建 AI 智能體,提供更高的性能和準確性,從而提升各行各業的企業生產力。
埃森哲已經在其 AI Refinery 平臺上提供 NVIDIA Llama Nemotron 推理模型,包括{HYPERLINK "https://newsroom.accenture.com/news/2025/accenture-expands-ai-refinery-and-launches-new-industry-agent-solutions-to-accelerate-agentic-ai-adoption" \h}的全新行業智能體解決方案 —— 可助力客戶快速開發和部署定制 AI 智能體,以應對行業特定挑戰,加速業務轉型。
德勤計劃將 Llama Nemotron 推理模型納入其近期發布的 Zora AI 代理式 AI 平臺,該平臺旨在通過包含深度功能性、特定行業業務知識以及具備透明度的智能體,為人類決策和行動提供支持。
NVIDIA AI Enterprise 為代理式 AI 提供必要工具
開發者可借助新的 NVIDIA 代理式 AI 工具和軟件,部署 NVIDIA Llama Nemotron 推理模型,簡化高級推理在協作 AI 系統中的應用。
作為 NVIDIA AI Enterprise 軟件平臺的組成部分,最新的代理式 AI 構建模塊包括:
NVIDIA AI-Q Blueprint 助力企業將知識導入可自主感知、推理和行動的 AI 智能體。這一藍圖由 NVIDIA NIM 微服務構建,集成 NVIDIA NeMo Retriever™ 用于多模態信息檢索,使用開源 NVIDIA AgentIQ 工具包將智能體和數據連接并優化,同時實現公開透明。
NVIDIA AI 數據平臺為新型企業基礎設施提供的可定制參考設計,集成了使用 AI-Q Blueprint 構建的 AI 查詢智能體。
為復雜代理式 AI 應用優化推理的{HYPERLINK "https://www.nvidia.cn/ai/" \l "referrer=ai-subdomain" \h},可實現持續學習,并實時適應任意環境。微服務可確保對來自領先模型構建商,包括 Meta、微軟和 Mistral AI 的最新模型進行可靠部署。
NVIDIA NeMo 微服務提供高效企業級解決方案,以快速建立并維護具有魯棒性的數據飛輪,讓 AI 智能體持續學習人類和 AI 生成的反饋。用于構建數據飛輪的 NVIDIA AI Blueprint 為開發者提供一個參考架構,使開發者可以利用 NVIDIA 微服務輕松構建和優化數據飛輪。
可用性NVIDIA Llama Nemotron Nano、Super 模型和 NIM 微服務的托管應用編程接口,可通過 和 Hugging Face 獲取。NVIDIA 開發者計劃成員可免費{HYPERLINK "https://forums.developer.nvidia.com/t/nvidia-nim-faq/300317" \h},用于其開發、測試和研究工作。
企業可在加速數據中心和云基礎設施上借助 NVIDIA AI Enterprise 在生產環境中運行 Llama Nemotron NIM 微服務。開發者可以提前注冊,以便在 NVIDIA NeMo 微服務發布時及時收到通知。
NVIDIA AI-Q Blueprint 將于 4 月發布。NVIDIA AgentIQ 工具包現可前往 GitHub 下載。
關于 NVIDIA