人工智能領域迎來重要進展,DeepSeek近日正式推出兩款新模型——DeepSeek-V3.2與DeepSeek-V3.2-Speciale。這兩款模型在推理能力方面展現出全球領先水平,引發行業廣泛關注。其中,V3.2定位為平衡推理性能與輸出長度的通用型模型,適用于問答場景和智能體任務等日常應用場景。該模型此前已發布實驗版本,此次正式版在公開測試中達到GPT-5的基準水平,僅在部分指標上略遜于谷歌Gemini3 Pro。
作為技術升級的核心產品,V3.2-Speciale被定位為"開源模型推理能力的極限探索者"。該模型通過融合長思考增強技術與DeepSeek-Math-V2的數學證明能力,構建起包含指令跟隨、邏輯驗證和數學推理的復合能力體系。在數學競賽測試中,Speciale在美國數學邀請賽、哈佛MIT數學競賽等權威賽事中均超越Gemini3 Pro,國際奧數競賽成績更達到人類選手前1%水平。不過在編程和理工科博士生測試中,其表現仍與谷歌模型存在差距。
技術評測數據顯示,Speciale在ICPC全球總決賽和IOI競賽中分別取得人類選手第二名和第十名的成績,展現出接近頂尖人類選手的復雜問題解決能力。但DeepSeek團隊坦言,與閉源專有模型相比,V3.2系列仍存在三方面局限:世界知識廣度不足、Token使用效率偏低,以及復雜任務處理能力有待提升。針對這些短板,研發團隊計劃通過擴大預訓練計算量和優化推理鏈密度進行改進。
當前開源與閉源模型的發展差距成為行業焦點。技術報告指出,自推理模型技術突破以來,雖然開源社區持續進步,但谷歌、OpenAI等閉源模型的性能增速明顯更快。這種分化主要體現在三個層面:標準注意力機制對長序列處理的效率制約、后訓練階段計算資源投入不足,以及智能體泛化能力與指令遵循能力的差距。這些因素導致專有系統在復雜任務中的優勢持續擴大。
為突破技術瓶頸,DeepSeek在9月實驗版中引入的稀疏注意力機制(DSA)已通過驗證。該機制通過優化計算復雜度,在不損失長上下文處理能力的前提下,顯著提升模型效率。正式版兩款模型均采用這項創新技術,使得V3.2在智能體場景中成為兼具性能與成本優勢的解決方案。實際測試表明,其推理性能提升的同時,計算資源消耗較前代降低37%。
目前DeepSeek-V3.2已完成全平臺更新,用戶可通過網頁端、移動應用和API接口使用。增強的Speciale版本則以臨時API形式開放,供研究機構和開發者進行深度評測。海外技術社區對此反應熱烈,部分專家認為這兩款模型的發布標志著開源模型與專有系統的性能差距進入動態平衡階段。雖然完全消除差距仍需時間,但DeepSeek通過工程優化突破參數規模限制的路徑,為行業提供了新的發展思路。







