小米近日正式宣布開源其自研的Xiaomi MiMo-V2-Flash模型,這一消息在科技領(lǐng)域引發(fā)廣泛關(guān)注。該模型是小米為追求極致推理效率而專門研發(fā)的混合專家(MoE)架構(gòu)模型,總參數(shù)規(guī)模達(dá)309B,激活參數(shù)為15B。通過引入創(chuàng)新的Hybrid注意力架構(gòu)以及多層MTP推理加速技術(shù),該模型在多個智能體測評基準(zhǔn)中表現(xiàn)優(yōu)異,成功躋身全球開源模型前兩名。
在性能對比方面,Xiaomi MiMo-V2-Flash展現(xiàn)出顯著優(yōu)勢。其代碼生成能力可與行業(yè)標(biāo)桿閉源模型Claude 4.5 Sonnet相媲美,但推理成本僅為后者的2.5%,同時生成速度提升至兩倍。這種高性價比的表現(xiàn),使其在開源模型領(lǐng)域形成獨(dú)特競爭力。據(jù)技術(shù)團(tuán)隊介紹,該模型在保持高性能的同時,通過架構(gòu)優(yōu)化實現(xiàn)了資源利用的最大化。
在2025小米“人車家全生態(tài)”合作伙伴大會上,Xiaomi MiMo大模型負(fù)責(zé)人羅福莉詳細(xì)闡述了模型的技術(shù)突破。她指出,MiMo-V2-Flash在多數(shù)評測基準(zhǔn)上已超越DeepSeek V3.2和K2-Thinking等知名模型,且參數(shù)量較這些模型減少二分之一至三分之二。在速度與成本的平衡方面,該模型在全球頂尖模型中處于領(lǐng)先位置,初步具備模擬現(xiàn)實世界的能力,為智能終端的應(yīng)用拓展提供了新的可能性。
羅福莉進(jìn)一步分享了對下一代智能體系統(tǒng)的展望。她認(rèn)為,未來的智能體不應(yīng)局限于語言模擬,而應(yīng)成為真正理解人類世界并與之共存的存在。在執(zhí)行能力上,智能體需要從單純回答問題轉(zhuǎn)向完成任務(wù),具備記憶、推理、自主規(guī)劃、決策和執(zhí)行等綜合能力。從感知層面看,統(tǒng)一多模態(tài)感知是關(guān)鍵,這能為理解物理世界奠定基礎(chǔ),使智能體更好地融入眼鏡等可穿戴設(shè)備,推動人機(jī)交互方式的革新。










