DeepSeek 官方近日宣布正式推出兩款全新模型:DeepSeek-V3.2 與 DeepSeek-V3.2-Speciale。此次發布標志著該公司在開源模型領域的技術突破,尤其在推理能力與工具調用方面實現了重要進展。

DeepSeek-V3.2 作為標準版本,主打推理能力與輸出效率的平衡。在公開基準測試中,其表現已達到 GPT-5 水平,僅略遜于 Gemini-3.0-Pro。與同類模型 Kimi-K2-Thinking 相比,V3.2 在保持性能的同時顯著縮短了輸出長度,大幅降低了計算資源消耗與用戶等待時間。該模型適用于問答場景及通用智能體任務,官方網頁端、移動應用及 API 均已同步更新。
針對專業研究需求,DeepSeek-V3.2-Speciale 以臨時 API 形式開放測試。作為長思考增強版,該模型融合了 DeepSeek-Math-V2 的數學證明能力,在指令跟隨、邏輯驗證等維度表現突出。在主流推理基準測試中,其性能與 Gemini-3.0-Pro 持平,更在國際數學奧林匹克(IMO 2025)、中國數學奧林匹克(CMO 2025)等頂級賽事中斬獲金牌。在編程競賽領域,該模型于 ICPC World Finals 2025 達到人類選手第二名水平,IOI 2025 成績亦躋身前十。官方強調,Speciale 版本雖在復雜任務中表現卓越,但因 Token 消耗量較大,目前僅供研究使用,暫未針對日常對話優化。
技術層面,DeepSeek-V3.2 突破了傳統模型在工具調用上的局限,成為首個將深度思考融入工具使用流程的開源模型。用戶可在思考模式與非思考模式間自由切換,支持 Claude Code 等開發工具。通過引入大規模智能體訓練數據合成方法,團隊構建了超 1800 個訓練環境與 8.5 萬條復雜指令,顯著提升了模型泛化能力。在未針對特定測試集優化的情況下,V3.2 在智能體評測中創下開源模型新高,大幅縮小與閉源模型的差距。

使用體驗方面,用戶可通過修改模型名稱或快捷鍵觸發思考模式,但需注意該模式暫未完全適配 Cline、RooCode 等非標準工具調用組件。官方建議在此類場景下繼續使用非思考模式以確保穩定性。此次更新標志著 DeepSeek 在開源模型商業化與專業化路徑上邁出關鍵一步,其技術方案或為行業提供新的參考范式。










