智東西12月17日北京現(xiàn)場(chǎng)報(bào)道,剛剛,小米舉辦了年度“人車家全生態(tài)”合作伙伴大會(huì),現(xiàn)場(chǎng)人頭攢動(dòng)座無(wú)虛席,展區(qū)不少展臺(tái)都已被圍觀人群擠滿,討論熱度頗高。小米創(chuàng)始人兼CEO雷軍此次并未來(lái)到現(xiàn)場(chǎng),小米集團(tuán)合伙人、集團(tuán)總裁盧偉冰率先登臺(tái)演講,今天第三位演講的是當(dāng)前備受關(guān)注的原DeepSeek核心成員、被業(yè)內(nèi)稱為“天才少女”的羅福莉,她現(xiàn)在的職位是小米MiMo大模型負(fù)責(zé)人。羅福莉在演講過(guò)程中雖然稍顯緊張,但她拋出的海量金句卻句句令人印象深刻:·AI正以非線性的方式重演人類大腦6億年的進(jìn)化史;·語(yǔ)言是人類思維和物理世界在符號(hào)空間的“投影”;·下一代智能體系統(tǒng)不是一個(gè)“語(yǔ)言模擬器”,而是一個(gè)真正理解我們世界、并與之共存的“智能體”;·相比生物演化的穩(wěn)固根基,AI的發(fā)展是“空中樓閣”;·AI進(jìn)化的下個(gè)起點(diǎn),一定是有一個(gè)能跟物理世界交互的模型;·算力和數(shù)據(jù)也并非最終的護(hù)城河,真正的護(hù)城河,是科學(xué)的研究文化與方法,是將未知問(wèn)題結(jié)合模型優(yōu)化轉(zhuǎn)化為可用產(chǎn)品的能力;·開(kāi)源的價(jià)值本質(zhì)上是一種分布式的技術(shù)加速主義;·開(kāi)源是實(shí)現(xiàn)AGI的普惠化,是確保所有人類的智慧共同進(jìn)化的唯一路徑;在演講中,羅福莉首次明確解讀了小米打造Agent語(yǔ)言基座模型的三個(gè)核心方向,解讀了新模型背后的多項(xiàng)關(guān)鍵技術(shù)突破。對(duì)小米如何通向AGI,羅福莉也明確了小米的路徑。除了AI大禮包,今天會(huì)上,盧偉冰也分享了小米整體業(yè)務(wù)的諸多亮點(diǎn)。盧偉冰說(shuō),2025年是小米“大發(fā)展”的一年,今年前三季度,小米收入同比增長(zhǎng)32.5%,超過(guò)了3400億元,經(jīng)調(diào)整利潤(rùn)同比增長(zhǎng)73.5%,其中手機(jī)銷量中國(guó)市場(chǎng)1-10月排名第二。未來(lái)五年,小米集團(tuán)研發(fā)投入預(yù)計(jì)將超過(guò)2000億元,2026年預(yù)計(jì)研發(fā)投入在400億左右。小米人車家生態(tài)究竟包括什么?盧偉冰這次給出詳細(xì)拆解:產(chǎn)品包括個(gè)人設(shè)備、出行設(shè)備、家庭設(shè)備;核心技術(shù)包括芯片、OS、AI;智能制造包括手機(jī)、汽車、大家電工廠;什么是小米當(dāng)前聚焦的核心,一目了然。在大家最關(guān)心的AI方面,小米自研MiMo系列大模型家族赫然呈現(xiàn):推理大模型、視覺(jué)推理大模型、原生端到端音頻生成模型、端側(cè)視覺(jué)語(yǔ)言大模型、具身大模型。一個(gè)月前的11月12日,羅福莉在朋友圈正式官宣加入小米Xiaomi MiMo團(tuán)隊(duì)。就在昨晚,小米剛剛發(fā)布了最新的MiMo大模型MiMo-V2-Flash,性能媲美DeepSeek-V3.2,這也是羅福莉加入后MiMo團(tuán)隊(duì)亮出的首個(gè)新成果。01.羅福莉首次解讀:小米大模型三個(gè)重點(diǎn)方向算力和數(shù)據(jù)并非最終護(hù)城河
羅福莉一上臺(tái)就回到了“6億年前”,她說(shuō),AI正以非線性的方式重演人類大腦6億年的進(jìn)化史。為什么大模型“智能”起源于語(yǔ)言?在羅福莉看來(lái),語(yǔ)言是人類思維和物理世界在符號(hào)空間的“投影”,而大模型成功解碼了人類思維在文本空間的投影。小米從“語(yǔ)言”出發(fā),構(gòu)建了面向Agent時(shí)代的語(yǔ)言基座模型MiMo-V2-Flash。在小米看來(lái),超強(qiáng)的代碼和工具調(diào)用能力是Agent溝通的高效“語(yǔ)言”,圍繞極致推理效率設(shè)計(jì)的模型結(jié)構(gòu)是“高帶寬”的Agent協(xié)作的關(guān)鍵,全新后訓(xùn)練范式則能夠保證高效穩(wěn)定的擴(kuò)展強(qiáng)化學(xué)習(xí)訓(xùn)練。這三個(gè)方面是小米聚焦的重點(diǎn)。羅福莉特別提到,MiMo-V2-Flash模型并不大,但在代碼和Agent測(cè)評(píng)基準(zhǔn)測(cè)試中已經(jīng)達(dá)到全球開(kāi)源模型TOP2。MiMo-V2-Flash的推理效率是其突出優(yōu)勢(shì),在全球大致相同水位的頂尖模型速度和成本象限里,MiMo-V2-Flash實(shí)現(xiàn)了低成本和高速度優(yōu)勢(shì)。具體來(lái)看,小米圍繞極致推理效率來(lái)設(shè)計(jì)模型結(jié)構(gòu),采用了Hybrid SWA架構(gòu),固定KV Cache,增強(qiáng)長(zhǎng)文推理,團(tuán)隊(duì)采用3層MTP推理加速并行Token驗(yàn)證,實(shí)現(xiàn)推理速度2-2.6倍的提升。在全新后訓(xùn)練范式方面,團(tuán)隊(duì)采用了Dense&Token-Level的強(qiáng)化學(xué)習(xí)。當(dāng)前MiMo-V2-Flash已經(jīng)初步具備了模擬世界的能力,比如通過(guò)HTML寫操作系統(tǒng)、模擬太陽(yáng)系、畫一顆圣誕樹。今天發(fā)布會(huì)現(xiàn)場(chǎng),羅福莉宣布MiMo-V2-Flash發(fā)布即開(kāi)源,模型權(quán)重、技術(shù)報(bào)告都開(kāi)源,API限時(shí)免費(fèi)。對(duì)于未來(lái)的Agent發(fā)展,羅福莉提到,下一代智能體系統(tǒng),不是一個(gè)“語(yǔ)言模擬器”,而是一個(gè)真正理解我們世界、并與之共存的“智能體”。Agent執(zhí)行從“回答問(wèn)題”到“完成任務(wù)”,具有記憶、推理、自主規(guī)劃、決策、執(zhí)行的能力。Omni感知統(tǒng)一多模態(tài)感知,為AI理解物理世界打下基礎(chǔ),嵌入眼鏡等智能終端、融入日常工作流。在通往AGI的路上,羅福莉團(tuán)隊(duì)希望補(bǔ)全缺失的演化拼圖,單純Scaling UP參數(shù)量不夠,他們要讓LLM回到“演化課堂”,補(bǔ)上它跳過(guò)的關(guān)鍵學(xué)習(xí)步驟。簡(jiǎn)單來(lái)說(shuō),他們非常看重AI與真實(shí)世界的交互,強(qiáng)調(diào)多模態(tài)。羅福莉特別提到,相比生物演化的穩(wěn)固根基,AI的發(fā)展有些像“空中樓閣”。在她看來(lái),AI進(jìn)化的下個(gè)起點(diǎn),一定是有一個(gè)能跟物理世界交互的模型。AI不僅要看懂畫面,還要理解背后的物理規(guī)律;AI不僅要推理文本,而是理解世界的運(yùn)作邏輯。羅福莉說(shuō),這一觀點(diǎn)并非共識(shí),行業(yè)中也有不少人認(rèn)為語(yǔ)言就可以實(shí)現(xiàn)最終的AGI,比如Ilya。在她看來(lái),算力和數(shù)據(jù)也并非最終的護(hù)城河,真正的護(hù)城河,是科學(xué)的研究文化與方法,是將未知問(wèn)題結(jié)合模型優(yōu)化轉(zhuǎn)化為可用產(chǎn)品的能力。羅福莉現(xiàn)場(chǎng)也開(kāi)啟了“招聘會(huì)”,她提到,小米大模型Core團(tuán)隊(duì)是研究、產(chǎn)品與工程深度耦合的年輕團(tuán)隊(duì),“小而美”卻充滿創(chuàng)業(yè)精神,他們極度好奇、追求真理。羅福莉提到,在她剛剛開(kāi)始研究時(shí),開(kāi)源模型與頂尖模型的代差有三年,而今天這一差距已經(jīng)縮短到了“數(shù)月”。他們相信開(kāi)源的價(jià)值,開(kāi)源的價(jià)值本質(zhì)上是一種分布式的技術(shù)的加速的主義。在羅福莉看來(lái),開(kāi)源是實(shí)現(xiàn)AGI的普惠化,是確保所有人類的智慧共同進(jìn)化的唯一路徑。未來(lái),從數(shù)據(jù)的極致壓縮,到算法的范式創(chuàng)新,再到與物理空間的深度鏈接,小米與全球AI共同定義未來(lái)。95后羅福莉本科就讀于北京師范大學(xué)計(jì)算機(jī)專業(yè),碩士畢業(yè)于北京大學(xué)計(jì)算語(yǔ)言學(xué)研究所計(jì)算語(yǔ)言學(xué)專業(yè)。她曾在阿里巴巴達(dá)摩院主導(dǎo)開(kāi)發(fā)了多語(yǔ)言預(yù)訓(xùn)練模型VECO,并推動(dòng)了AliceMind的開(kāi)源工作,2022年入職DeepSeek,參與了MoE大模型DeepSeek-V2的研發(fā)。集諸多光環(huán)于一身,來(lái)到小米的羅福莉,其動(dòng)向一直是業(yè)內(nèi)關(guān)注的焦點(diǎn)。02.結(jié)語(yǔ):猛攻Agent基座模型小米人車家生態(tài)全力沖刺AI







