人工智能領域迎來重要進展,DeepSeek正式推出兩款全新AI模型——DeepSeek-V3.2與DeepSeek-V3.2-Speciale。其中V3.2主打日常應用場景,在推理性能與輸出效率上實現突破;Speciale版本則聚焦極限推理能力,在國際頂級競賽中斬獲多項金牌。這一成果標志著開源模型與閉源商業模型的技術差距進一步縮小。
在核心性能方面,DeepSeek-V3.2展現出顯著優勢。公開測試數據顯示,該模型推理能力達到GPT-5水平,僅略遜于Gemini-3.0-Pro。與同類產品Kimi-K2-Thinking相比,其輸出長度減少40%以上,計算開銷降低35%,用戶等待時間縮短近半。官方渠道已全面升級,網頁端、移動應用及API服務均完成版本迭代。
增強版V3.2-Speciale在數學與編程領域創造歷史性突破。該模型不僅在IMO 2025、CMO 2025、ICPC全球總決賽及IOI國際競賽中包攬金牌,更在ICPC與IOI項目中分別達到人類選手第二名與第十名的競技水平。技術團隊通過融合DeepSeek-Math-V2的定理證明模塊,使模型具備嚴謹的邏輯驗證能力。不過研發團隊特別說明,該版本處理復雜任務時Token消耗量是標準版的3倍,目前僅開放研究用途,暫不支持工具調用功能。
技術創新層面,V3.2首次實現思考模式與工具調用的深度整合。通過構建包含1800個虛擬環境、8.5萬條復雜指令的強化學習體系,模型在智能體任務中的表現超越所有開源競品。測試數據顯示,其在未針對特定工具優化的條件下,工具調用準確率較前代提升27%,與閉源模型的差距縮小至8個百分點。技術報告披露,這種訓練方法顯著增強了模型的泛化能力。
在應用適配方面,V3.2推出雙模式運行機制。用戶可根據需求選擇標準模式或思考模式,后者支持多輪工具調用與邏輯推演。API服務新增對Claude Code生態的支持,開發者可通過簡單配置啟用深度思考功能。不過研發團隊提醒,非標準工具組件如Cline、RooCode仍需使用非思考模式,相關適配工作正在推進中。
開源社區同步迎來重要更新。兩款模型的完整代碼與訓練數據集已在HuggingFace和ModelScope平臺開放下載,技術白皮書詳細披露了DSA稀疏注意力機制等核心算法。為促進學術研究,Speciale版本的臨時API服務將持續開放至12月中旬,期間保持原有定價體系,最大輸出長度擴展至128K字符。
實驗性版本V3.2-Exp的驗證結果為本次發布提供重要依據。兩個月前的用戶對比測試顯示,該版本在32個典型場景中的表現均不弱于前代旗艦模型V3.1-Terminus,特別在長文本處理場景中展現出顯著優勢。這些反饋數據直接推動了稀疏注意力機制的優化升級,最終促成新一代模型的誕生。










