前DeepSeek研究員羅福莉正式加入小米的消息,通過其朋友圈動態(tài)得以確認。這位被稱為"AI天才少女"的95后科學(xué)家,將參與小米"端側(cè)AI"與"人車家全生態(tài)"的戰(zhàn)略布局。她在DeepSeek期間積累的MoE架構(gòu)經(jīng)驗,恰好契合小米"輕量化、不拼參數(shù)"的AI發(fā)展路徑。據(jù)知情人士透露,羅福莉的工作領(lǐng)域不僅限于大模型開發(fā),更涉及手機、汽車等終端產(chǎn)品的AI落地應(yīng)用。
羅福莉在朋友圈發(fā)布動態(tài)稱:"智能終將從語言邁向物理世界。我正在Xiaomi MiMo,和一群富有創(chuàng)造力、才華橫溢且真誠熱愛的研究員,致力于構(gòu)建這樣的未來。"這一表述與其在DeepSeek時期的技術(shù)理念一脈相承。今年初,她曾以"接地氣"的方式在知乎解讀DeepSeek-V2模型優(yōu)勢,展現(xiàn)出對技術(shù)落地的深刻理解。
追溯其學(xué)術(shù)軌跡,這位四川宜賓出生的科學(xué)家,2013年考入北京師范大學(xué)計算機專業(yè),后保送至北京大學(xué)計算語言學(xué)研究所。2019年讀研二期間,她在人工智能領(lǐng)域頂級會議ACL上一次性發(fā)表8篇論文,其中2篇為第一作者,由此嶄露頭角。畢業(yè)后進入阿里達摩院,主導(dǎo)開發(fā)了多語言預(yù)訓(xùn)練模型VECO,該模型被納入阿里深度語言模型體系A(chǔ)liceMind并推動開源。
2022年加入DeepSeek后,羅福莉參與研發(fā)的DeepSeek-V2模型以"性價比之王"著稱,其中文水平處于國內(nèi)外閉源模型第一梯隊,價格僅為GPT-4的1/100。盡管未參與今年初爆火的V3和R1模型研發(fā),但她在混合專家架構(gòu)領(lǐng)域的技術(shù)積累,成為小米AI戰(zhàn)略的關(guān)鍵拼圖。
小米的AI布局早在2016年就已啟動,初期主要為小愛音箱等IoT產(chǎn)品服務(wù)。2023年4月,隨著大語言模型熱潮興起,小米AI實驗室下設(shè)專門大模型團隊,由曾任東芝研究院研究員的欒劍負責(zé)。不同于行業(yè)主流的"軍備競賽"思路,小米明確"不搞ChatGPT"的差異化戰(zhàn)略,強調(diào)輕量級模型的市場價值。
這種戰(zhàn)略轉(zhuǎn)向在技術(shù)成果上得到驗證。今年4月開源的Xiaomi MiMo推理大模型,以70億參數(shù)在數(shù)學(xué)推理和代碼競賽中超越OpenAI o1-mini和阿里QwQ-32B等更大參數(shù)模型。該成果出自新成立的"小米大模型Core團隊",而羅福莉此次加入的MiMo團隊,正是這一技術(shù)路徑的核心執(zhí)行者。
硬件層面的投入為AI戰(zhàn)略提供支撐。2024年雷軍推動建設(shè)的GPU萬卡集群,年中已擁有6500張GPU,并計劃擴容至萬卡規(guī)模。2025年2月公布的研發(fā)預(yù)算顯示,全年300億元研發(fā)費用中,75億元將投向AI領(lǐng)域,重點支持GPU集群建設(shè)和大模型場景落地。未來五年(2026-2030年)預(yù)計投入超2000億元,聚焦AI、OS、芯片三大底層技術(shù),構(gòu)建"人車家"生態(tài)的技術(shù)底座。
行業(yè)觀察人士指出,頂尖AI人才從新銳公司向傳統(tǒng)硬件巨頭的流動,標志著AI競爭進入"應(yīng)用深化期"。當基礎(chǔ)模型能力逐漸趨同,如何將AGI能力轉(zhuǎn)化為手機、汽車、智能家居中的真實體驗,成為新的競爭焦點。羅福莉提出的"從語言邁向物理世界"理念,正是這一趨勢的技術(shù)注腳。











