在ChatGPT迎來三周歲生日之際,硅谷科技圈的焦點意外轉向了來自中國的DeepSeek團隊。這家公司最新發布的兩款開源模型——DeepSeek-V3.2及其增強版V3.2-Speciale,正在全球范圍內引發強烈反響。據參與NeurIPS 2025學術會議的學者透露,在飛往圣地亞哥的航班上,近三分之一的乘客都在專注研讀這兩款模型的技術文檔。
這場技術風暴的沖擊力遠超預期。上周剛斷言DeepSeek"曇花一現"的推特言論,在發布當晚就獲得超過500萬次瀏覽。OpenAI首席執行官奧特曼緊急啟動紅色預警機制,甚至臨時叫停了原定在ChatGPT平臺投放的廣告計劃。谷歌Gemini團隊更遭遇網友集體"喊話",社交媒體上充斥著"DeepSeek歸來,你們還睡得著嗎"的調侃。
技術評測數據顯示,標準版V3.2在推理任務中已達到GPT-5水平,僅以微弱差距落后于Gemini-3.0-Pro。而增強版V3.2-Speciale則實現全面超越,不僅在主流推理基準測試中與Gemini-3.0-Pro不相上下,更在國際數學奧林匹克(IMO)、中國數學奧林匹克(CMO)等頂級競賽中斬獲金牌。特別值得關注的是,該模型在ICPC國際大學生程序設計競賽和IOI國際信息學奧林匹克競賽中,分別達到人類選手第二名和第十名的成績。
DeepSeek研究院在技術報告中揭示了突破性進展的核心:通過稀疏注意力機制(DSA)解決長上下文處理效率問題,為強化學習(RL)在超長序列中的應用奠定基礎。研究團隊投入超過預訓練階段10%的算力進行后訓練優化,使模型在通用推理能力上實現質的飛躍。增強版更通過解除RL的長度限制,迫使模型生成極長的"思維鏈",這種自我修正機制顯著提升了復雜問題解決能力。
成本對比數據引發行業震動。以百萬token輸出成本計算,V3.2比GPT-5低24倍,較Gemini 3 Pro便宜29倍。隨著輸出量增加,這個差距最高可達43倍。具體到應用場景,生成《三體》三部曲規模的內容,使用GPT-5約需800元,Gemini 3 Pro需1000元,而DeepSeek-V3.2僅需35元左右。這種成本優勢正在動搖閉源模型的商業根基。
技術社區的討論揭示出更深層影響。有開發者指出,V3.2-Speciale在解決特定問題時需要消耗7.7萬個token,是Gemini的近4倍。但這種"算力換性能"的策略,在價格優勢面前仍具競爭力。更令行業擔憂的是,DeepSeek模型已展示出在國產硬件(如華為昇騰芯片)上的優化潛力,這可能進一步壓縮推理成本。
性能評測顯示,V3.2系列在HLE和GPQA等知識型基準測試中稍顯遜色。研究團隊坦言,這主要受限于計算資源投入,單純依靠強化學習難以達到預訓練模型的知識儲備水平。這種技術路徑選擇,實際上揭示出開源與閉源模型的新競爭維度——當算力資源不再成為絕對門檻,模型優化的方向將發生根本性轉變。
行業觀察家指出,DeepSeek的突破證明AI發展存在多條可行路徑。預訓練階段的規模擴展固然重要,但強化學習在長上下文場景下的持續優化同樣能帶來顯著收益。這種技術路線的驗證,為資源有限的研發團隊開辟了新方向,也可能重塑整個AI產業的競爭格局。











