三星高級(jí)AI研究院近日推出一款名為微型遞歸模型(TRM)的開(kāi)源AI系統(tǒng),憑借僅700萬(wàn)參數(shù)的極簡(jiǎn)架構(gòu),在結(jié)構(gòu)化推理任務(wù)中展現(xiàn)出與主流大模型抗衡的實(shí)力。該模型在數(shù)獨(dú)解謎、迷宮路徑規(guī)劃等封閉場(chǎng)景測(cè)試中,性能表現(xiàn)達(dá)到甚至超越參數(shù)量超過(guò)其萬(wàn)倍的谷歌Gemini 2.5 Pro等頂尖模型,引發(fā)AI領(lǐng)域?qū)δP托实闹匦滤伎肌?/p>
與傳統(tǒng)依賴龐大參數(shù)堆砌的AI模型不同,TRM采用雙層遞歸架構(gòu)實(shí)現(xiàn)高效推理。研究團(tuán)隊(duì)摒棄了復(fù)雜的雙網(wǎng)絡(luò)協(xié)作設(shè)計(jì),轉(zhuǎn)而通過(guò)模型自身輸出的反復(fù)迭代完成推理優(yōu)化。每輪迭代中,系統(tǒng)會(huì)主動(dòng)修正前序步驟的潛在誤差,直至輸出結(jié)果趨于穩(wěn)定。這種"以遞歸替代規(guī)模"的策略,使模型在保持性能的同時(shí),將計(jì)算資源消耗降低至傳統(tǒng)大模型的百分之一以下。
在基準(zhǔn)測(cè)試中,TRM展現(xiàn)出驚人的效率優(yōu)勢(shì):面對(duì)Sudoku-Extreme極限數(shù)獨(dú)難題時(shí),模型準(zhǔn)確率達(dá)到87.4%;處理Maze-Hard復(fù)雜迷宮時(shí)準(zhǔn)確率為85%;在衡量抽象推理能力的ARC-AGI測(cè)試中取得45%的準(zhǔn)確率,ARC-AGI-2測(cè)試準(zhǔn)確率則為8%。這些數(shù)據(jù)表明,盡管參數(shù)規(guī)模不足0.01%,TRM在特定領(lǐng)域的表現(xiàn)已接近或超越DeepSeek R1、o3-mini等知名大模型。
研究團(tuán)隊(duì)指出,TRM的成功源于對(duì)"極簡(jiǎn)主義"的極致追求。實(shí)驗(yàn)數(shù)據(jù)顯示,增加模型層數(shù)或參數(shù)規(guī)模反而會(huì)導(dǎo)致小數(shù)據(jù)集上的過(guò)擬合現(xiàn)象,使性能出現(xiàn)下滑。雙層架構(gòu)與遞歸機(jī)制的深度結(jié)合,恰恰實(shí)現(xiàn)了計(jì)算效率與推理能力的最佳平衡。這種設(shè)計(jì)哲學(xué)為AI模型優(yōu)化提供了全新思路——通過(guò)算法創(chuàng)新而非參數(shù)膨脹來(lái)提升性能。
需要特別說(shuō)明的是,TRM目前專注于結(jié)構(gòu)化、可視化的網(wǎng)格類問(wèn)題解決,包括數(shù)獨(dú)、迷宮等具有明確規(guī)則的封閉場(chǎng)景。與通用語(yǔ)言模型不同,該系統(tǒng)并不具備開(kāi)放式文本生成能力,其核心優(yōu)勢(shì)在于邏輯推理的精準(zhǔn)度而非語(yǔ)言處理的廣度。這種定位使其成為特定工業(yè)場(chǎng)景下的高效解決方案。
目前,TRM的完整代碼庫(kù)、訓(xùn)練腳本及測(cè)試數(shù)據(jù)集已通過(guò)MIT許可證在GitHub平臺(tái)開(kāi)源。全球開(kāi)發(fā)者均可自由獲取、修改及部署該系統(tǒng),包括商業(yè)用途。這種開(kāi)放策略或?qū)⑼苿?dòng)AI技術(shù)在資源受限場(chǎng)景中的創(chuàng)新應(yīng)用,為邊緣計(jì)算、物聯(lián)網(wǎng)設(shè)備等領(lǐng)域帶來(lái)新的可能性。











