國慶假期前夕,AI行業(yè)迎來一場突如其來的“價格風(fēng)暴”。DeepSeek于9月29日晚間發(fā)布實驗性模型DeepSeek-V3.2-Exp,同步啟動API價格大幅下調(diào),輸入百萬Token價格最低降至0.2元,輸出價格直降75%至3元/百萬Tokens。這一激進定價策略迅速引發(fā)行業(yè)震動,被業(yè)界冠以“價格屠夫”的稱號。
價格調(diào)整呈現(xiàn)“雙軌制”特征:緩存命中場景下輸入價格從0.5元/百萬Tokens腰斬至0.2元,未命中場景從4元降至2元;輸出端價格從12元暴跌至3元,降幅達75%。橫向?qū)Ρ蕊@示,Anthropic最新發(fā)布的Claude Sonnet 4.5輸入輸出價格分別為3美元和15美元,按當(dāng)前匯率計算,其輸出價格是DeepSeek新定價的30倍以上。國內(nèi)廠商如智譜AI的定價體系也面臨顯著壓力。
支撐這場價格革命的是架構(gòu)層面的技術(shù)突破。DeepSeek-V3.2-Exp在V3.1-Terminus基礎(chǔ)上引入稀疏注意力機制,通過細粒度注意力分配實現(xiàn)長文本處理效率的質(zhì)的飛躍。技術(shù)團隊嚴格對齊訓(xùn)練參數(shù)后發(fā)現(xiàn),新模型在數(shù)學(xué)推理(AIME)、編程競賽(Codeforces)等專項評測中表現(xiàn)持平甚至小幅超越前代,驗證了“效率不降、成本大減”的技術(shù)路徑可行性。
這場技術(shù)革新與商業(yè)策略的雙重變奏,恰逢全球AI市場密集推新期。同日,Anthropic發(fā)布Claude Sonnet 4.5,強調(diào)在編碼、數(shù)學(xué)推理等領(lǐng)域的突破;智譜AI則將GLM-4.5標(biāo)注為“上一代旗艦”,暗示GLM-4.6即將登場。三大廠商選擇在國慶假期前集中發(fā)力,形成獨特的“節(jié)日競爭效應(yīng)”。
硬件生態(tài)的響應(yīng)速度令人矚目。寒武紀(jì)在模型發(fā)布當(dāng)日即完成適配,開源vLLM-MLU推理引擎代碼,股價次日應(yīng)聲上漲超4%。華為昇騰通過vLLM/SGLang框架實現(xiàn)“Day 0支持”,華為云上線超節(jié)點推理服務(wù)。海光信息依托GPGPU架構(gòu)完成DCU深度調(diào)優(yōu),強調(diào)“零等待”部署能力。這種硬件層的快速跟進,折射出中國AI產(chǎn)業(yè)鏈的成熟度。
開發(fā)者群體陷入“甜蜜的煩惱”。某技術(shù)人員在社區(qū)留言:“上周剛完成V3.1遷移,現(xiàn)在又要重新適配,國慶計劃徹底泡湯。”評測人員的工作量呈指數(shù)級增長,需同時跟蹤DeepSeek、智譜GLM-4.6和Claude Sonnet 4.5的性能表現(xiàn)。更復(fù)雜的是,作為實驗性版本,V3.2-Exp要求開發(fā)者在性能提升與系統(tǒng)穩(wěn)定性間尋找平衡點。
這場技術(shù)迭代狂潮正在重塑行業(yè)規(guī)則。DeepSeek通過架構(gòu)創(chuàng)新實現(xiàn)“效率躍遷”,證明算法優(yōu)化可替代部分算力堆砌。當(dāng)競爭對手還在追求參數(shù)規(guī)模時,其“小步快跑”策略已推動行業(yè)進入效率競爭的新階段。隨著硬件生態(tài)的深度適配,中國AI產(chǎn)業(yè)正形成從模型到芯片的完整創(chuàng)新閉環(huán)。







