在12月18日的小米“人車家全生態大會”上,一款名為MiMo-V2-Flash的新模型成為焦點。這款由新加入的“天才少女”羅福莉主導研發的模型,標志著小米在人工智能領域邁出了重要一步。盡管參數規模僅為309B,激活參數15B,但小米團隊將其定位為Agent訓練的基座模型,重點優化了高性價比和快速響應能力。
MiMo-V2-Flash的核心優勢體現在三個方面:每秒150 tokens的生成速度、極低的成本,以及在保持高性價比的同時不犧牲性能。羅福莉在發布會上透露,該模型的代碼能力和Agent能力已在全球開源模型評估榜單中躋身前列,部分指標甚至超越了DeepSeek-V3、Kimi K2-Thinking等知名模型,而參數規模僅為后者的1/2至1/3。例如,在SWE-Bench Multilingual測試中,MiMo-V2-Flash的表現優于包括GPT-5在內的多個閉源大模型。
這一成果的背后,是小米對技術路徑的獨特選擇。羅福莉指出,當前模型學習方向與生物智能進化存在背離,單純依靠“大力出奇跡”已難以實現更高階的智能突破。因此,小米轉向了更契合自身需求的路徑——開發參數小、性能優且成本低的模型。具體而言,MiMo-V2-Flash采用了5:1的滑動窗口注意力(SWA)與全局注意力(GA)混合結構。實驗數據顯示,SWA在長文處理和推理能力上優于主流線性注意力機制,且固定大小的KV Cache使其更容易適配現有基礎設施。
小米的AI戰略已進入加速期。2025年,公司計劃投入超過300億元用于研發,其中四分之一(約75億元)直接投向AI領域,并規劃未來五年累計投入超2000億元。組織層面,小米自2024年起搭建了AI Infra平臺,并著手構建GPU萬卡集群,目前團隊已擁有6500張GPU資源。人才方面,除羅福莉負責基礎大模型外,小米還引入陳龍團隊,后者提出并開源了全球首個打通自動駕駛與具身操作的跨具身基座模型MiMo-Embodied,試圖解決兩者間的知識遷移難題。
這一系列動作的邏輯清晰可見:小米正試圖用一套通用的AI邏輯驅動其龐大的硬件生態,覆蓋手機、智能家居到智能駕駛的全場景。MiMo-V2-Flash的發布,不僅是技術實力的展示,更是小米向資本市場和用戶傳遞的新信號——這家硬件巨頭正通過掌握高效的“大腦”和廣泛的“身體”,在智能時代完成關鍵轉型。然而,技術突破能否真正轉化為用戶體驗的提升,仍需時間檢驗。











