英偉達近日正式推出開源模型系列Nemotron 3,包含Nano、Super和Ultra三種規格,旨在為AI智能體應用提供兼具高精度與高效能的解決方案。該系列通過引入創新的混合潛在專家(MoE)架構,支持開發者構建大規模、可靠的多智能體系統,應對復雜場景下的技術挑戰。
隨著企業從單一模型聊天機器人向協作式多智能體AI系統轉型,開發者面臨通信效率、上下文一致性及推理成本等多重難題。Nemotron 3系列通過優化架構設計,直接回應這些痛點,提供透明度與開放性,助力企業實現工作流程自動化。目前,安永、思科、Oracle Cloud Infrastructure、西門子等十余家行業領軍企業已將其納入AI開發流程,覆蓋制造、網絡安全、軟件開發等領域。
該系列包含三款差異化模型:Nemotron 3 Nano為300億參數的小型模型,每次激活參數不超過30億,專為高針對性任務設計,如軟件調試、內容摘要及低推理成本的信息檢索;Super版本擁有約1000億參數,每個token最多激活100億參數,適用于多智能體協作場景;Ultra版本則擴展至5000億參數,每token活躍參數達500億,可支撐復雜AI應用需求。
Nemotron 3 Nano在計算成本效率方面表現突出,其性能較前代提升顯著:token處理吞吐量提高4倍,推理token生成成本降低60%,同時配備100萬token的上下文窗口,能更精準地處理長流程、多步驟任務。該模型已上線開源平臺Hugging Face,開發者可自由調用;Super與Ultra版本預計于2026年上半年陸續發布。
對于初創企業而言,Nemotron 3的開源特性降低了AI智能體開發門檻,加速從原型設計到企業級部署的迭代周期。其模塊化架構允許開發者根據需求靈活組合功能,在控制成本的同時實現定制化解決方案。











