三星SAIL蒙特利爾實(shí)驗(yàn)室的科研團(tuán)隊(duì)近日宣布,開發(fā)出一種名為“微型遞歸模型”(TRM)的新型人工智能架構(gòu)。該模型以僅700萬個(gè)參數(shù)的輕量化設(shè)計(jì),在復(fù)雜結(jié)構(gòu)化推理任務(wù)中展現(xiàn)出超越主流大型語言模型的性能,引發(fā)行業(yè)廣泛關(guān)注。
在數(shù)獨(dú)和ARC-AGI測(cè)試中,TRM的突破性表現(xiàn)顛覆了傳統(tǒng)認(rèn)知。研究數(shù)據(jù)顯示,該模型在ARC-AGI-1基準(zhǔn)測(cè)試中取得45%的準(zhǔn)確率,在ARC-AGI-2測(cè)試中達(dá)到8%,顯著優(yōu)于Gemini2.5Pro(4.9%)、Claude3.7(0.7%)等數(shù)十億參數(shù)規(guī)模的模型。尤其在數(shù)獨(dú)極限挑戰(zhàn)中,TRM將解題準(zhǔn)確率從55%提升至87.4%,迷宮難題的解決率也從74.5%提高到85.3%。
其核心優(yōu)勢(shì)在于獨(dú)特的遞歸推理機(jī)制。研究團(tuán)隊(duì)在《少即是多:基于微型網(wǎng)絡(luò)的遞歸推理》報(bào)告中指出,TRM通過密集的自我校正循環(huán)實(shí)現(xiàn)性能突破。這種設(shè)計(jì)使模型僅需使用主流大模型0.01%的參數(shù)量,就能在特定任務(wù)中達(dá)到更優(yōu)效果。不過,該模型目前仍專注于網(wǎng)格化結(jié)構(gòu)問題,尚未具備通用語言模型的文本生成能力。
技術(shù)實(shí)現(xiàn)層面,研究團(tuán)隊(duì)針對(duì)性地優(yōu)化了模型架構(gòu)。在固定尺寸網(wǎng)格問題中,采用多層感知機(jī)(MLP)替代傳統(tǒng)的注意力機(jī)制,這種架構(gòu)選擇被證明是提升效率的關(guān)鍵。實(shí)驗(yàn)表明,針對(duì)特定數(shù)據(jù)集進(jìn)行精準(zhǔn)的模型設(shè)計(jì),比單純擴(kuò)大參數(shù)規(guī)模更具性價(jià)比。
盡管存在應(yīng)用局限,但TRM為AI發(fā)展開辟了新路徑。其證明小型專用模型在特定領(lǐng)域具有不可替代的價(jià)值,特別是在需要高精度結(jié)構(gòu)化推理的場(chǎng)景中。目前,科研團(tuán)隊(duì)正在推進(jìn)模型的獨(dú)立驗(yàn)證與擴(kuò)展研究,探索將其推理能力遷移至更多垂直領(lǐng)域的可能性。
行業(yè)專家指出,這類“輕量級(jí)但高精度”的模型可能率先在醫(yī)療影像分析、金融風(fēng)控建模、工業(yè)質(zhì)檢等需要嚴(yán)格邏輯驗(yàn)證的領(lǐng)域發(fā)揮作用。其低資源消耗和高推理效率的特性,為邊緣計(jì)算設(shè)備部署高級(jí)AI功能提供了新的解決方案。










