國產(chǎn)大模型正在全球科技舞臺上掀起新一輪浪潮。月之暗面最新發(fā)布的Kimi K2 Thinking模型以萬億參數(shù)規(guī)模和開源模式登頂全球開源榜單,引發(fā)國際AI社區(qū)廣泛關(guān)注。這款模型在推理、編程等核心能力上達到或超越GPT-5水平,在人類終極考試等基準測試中創(chuàng)下最優(yōu)紀錄,其訓練成本僅約460萬美元,較DeepSeek V3的560萬美元再創(chuàng)新低。
技術(shù)突破背后是算法架構(gòu)的深度優(yōu)化。月之暗面采用原生INT4量化技術(shù),通過降低參數(shù)精度實現(xiàn)存儲與計算效率的顯著提升。研究員劉少偉透露,針對長文本生成場景,團隊開發(fā)了INT4 QAT量化方案,使后訓練強化學習效率提升數(shù)倍。這種技術(shù)路線選擇兼顧了非Blackwell架構(gòu)硬件的兼容性,為模型在多元硬件環(huán)境中的部署鋪平道路。盡管實測顯示該模型在智能指數(shù)評測中消耗1.4億token,是GPT-5的兩倍,但其在AA評測中的綜合得分與GPT-5僅差1分,在τ2-Bench電信任務中更以絕對優(yōu)勢登頂。
中國開源模型正形成集群效應。在Artificial Analysis最新榜單中,全球前十開源模型有六款來自中國,Kimi K2 Thinking取代MiniMax-M2占據(jù)榜首位置。這種技術(shù)影響力已轉(zhuǎn)化為實際商業(yè)價值:硅谷云計算公司Vercel率先上線該模型API服務,AI編程工具Cursor、Windsurf及搜索獨角獸Perplexity等二十余家企業(yè)相繼接入。更引人注目的是,Cursor 2.0版本被開發(fā)者發(fā)現(xiàn)套殼智譜GLM-4.6模型,Windsurf則直接承認應社區(qū)需求引入該模型,折射出國產(chǎn)模型在代碼生成領(lǐng)域的領(lǐng)先地位。
極致性價比成為破局關(guān)鍵。價格數(shù)據(jù)顯示,Kimi K2系列及GLM-4.6的API輸出成本僅為GPT-5的20%、Claude Sonnet 4.5的15%,MiniMax-M2更低至8%。Vercel實測表明,Kimi K2在智能體場景中準確率較GPT-5高出50%,而成本優(yōu)勢使其成為企業(yè)遷移的首選。這種技術(shù)遷移趨勢正在重塑全球AI生態(tài)格局,有海外開發(fā)者戲稱"該學習中文了",凸顯中國模型的技術(shù)話語權(quán)提升。
資本動向折射行業(yè)分化。月之暗面被曝啟動6億美元融資,投前估值達38億美元,若成功將躋身300億估值俱樂部。但市場對其估值存在爭議,有投資人指出,該估值雖低于美國同行,但在國內(nèi)融資寒冬中仍屬高位。與此同時,MiniMax完成3億美元融資后計劃赴港上市,智譜則加速科創(chuàng)板IPO進程,形成技術(shù)突破與資本運作的雙輪驅(qū)動。值得注意的是,Kimi用戶規(guī)模出現(xiàn)波動,今年9月月活較去年峰值下降超1100萬,商業(yè)化壓力促使公司轉(zhuǎn)向訂閱付費模式,在海內(nèi)外推出OK Computer應用試探市場反應。
行業(yè)格局遠未固化。當多數(shù)企業(yè)聚焦C端市場時,MiniMax通過海外陪伴應用Talkie和視頻生成工具海螺AI構(gòu)建收入支柱,近期又在編程領(lǐng)域推出收費服務。這種差異化路線與智譜的G端B端深耕形成互補。相比之下,階躍星辰等企業(yè)尚未找到突破路徑,顯示AI獨角獸在技術(shù)理想與商業(yè)現(xiàn)實間仍需艱難平衡。隨著開源模型持續(xù)進化,全球AI競爭正從算力軍備競賽轉(zhuǎn)向效率創(chuàng)新比拼,中國企業(yè)的技術(shù)突圍為這場馬拉松注入新的變量。











