近期,基礎模型市場再次熱鬧起來,各廠商紛紛推出新動作。不過,仔細分析可以發現,這些廠商的策略大致分為兩類。一類廠商選擇在模型的某個難點上集中突破,力求成為該領域的頂尖水平,以此在開發者群體中樹立鮮明形象,但這種做法可能限制其作為基礎模型供應商的廣泛適用性。另一類廠商則追求全面發展,在多個模態上齊頭并進,逐步構建起一個全面的基礎模型體系。
在全面發展的廠商中,MiniMax憑借其全球領先的語音和視頻模型脫穎而出。近日,該公司又推出了其基礎模型體系的最新成員——MiniMax M2,進一步鞏固了其在多模態模型領域的領先地位。
10月28日,MiniMax正式對外發布了MiniMax M2。這款模型專為編程和智能體應用設計,同時保持了輕量級和高靈敏度的特點。在通用能力的基礎上,MiniMax M2進行了針對性優化,其上下文窗口達到了當前主流模型的平均水平,最大輸入和輸出token總和為200k,最大輸出token為128k。該模型還提供了端到端的工具使用性能,滿足了開發者的實際需求。
MiniMax M2被定義為“極具成本效益的模型”,以其全球領先的性價比和極致速度為賣點。該模型擁有2300億總參數,但激活參數被控制在100億以內,有效降低了計算成本。在Artificial Analysis這一權威評測榜單上,MiniMax M2在數學、科學和編碼等多個核心領域表現出色,總分位列全球前五。這表明,MiniMax M2在提升編程和智能體能力的同時,并未犧牲其綜合性能。
更令人矚目的是,MiniMax M2在保持高性能的同時,還大幅降低了使用成本。據MiniMax介紹,該模型在某些任務上的成本僅為Claud的8%。目前,MiniMax M2的API價格定為每百萬Token輸入0.3美金(約合2.1元人民幣),輸出1.2美金(約合8.4元人民幣)。同時,該模型還提供了每秒輸出約100個Token的推理服務,且速度仍在不斷提升。從價格和速度的綜合性能來看,MiniMax M2已成為市場上最具性價比的模型之一。
為了吸引更多開發者體驗,MiniMax在發布后宣布延長免費測試時間,用戶可在11月6日前免費使用該模型。MiniMax在官方公告中表示:“我們目前在免費提供MiniMax Agent,直到服務器無法承受為止。”這一策略取得了顯著效果,限時免費期間,開發者的調用量快速增長,MiniMax M2已成為OpenRouter上調用量排名第十的模型。
MiniMax M2的成本控制得益于模型技術的更新和工程能力的提升。在發布MiniMax M2的同時,MiniMax還宣布其Agent應用同步更新,并推出了安卓和iOS版本。這一策略與OpenAI發布Sora2時類似,即模型從第一天起就以產品的形式呈現,因為模型和工程能力已經密不可分。用戶在使用以Agent能力為核心的產品時,能夠直接感受到模型能力的進步,這些技術變化不再僅僅停留在論文和技術報告中,而是成為了用戶可感知的產品能力。
為了驗證MiniMax M2的實際表現,我們進行了幾組測試,包括寫文章的速度、編程能力以及能否完成整個開發閉環。在寫文章測試中,我們要求MiniMax M2和Claude 4.1用同樣的題目《AI智能體的未來》寫一篇約800字的中文文章。結果顯示,MiniMax M2幾乎瞬間完成了文章,而Claude 4.1還在逐段生成。從內容結構和語言上看,MiniMax M2的表現也相當正常,給人一種“響應即結果”的流暢體驗。
在編程能力測試中,我們選擇了經典的Gilded Rose Refactoring Kata項目。該項目要求模型在不影響原有功能的情況下,優化代碼結構并添加新功能。MiniMax M2在加載項目后,自動判斷了語言版本并選擇了Python實現。它首先解析了原始代碼中的商品類型和邏輯關系,然后提出了采用策略模式重構的方案。在重構過程中,MiniMax M2同步修改了測試腳本和示例文件,確保數據初始化和邊界條件與新架構一致。經過幾輪調試后,所有測試均通過,展示了MiniMax M2在編程能力上的出色表現。
我們還測試了MiniMax M2的端到端開發能力。我們給它兩個空文件:一個calc.py和一個測試文件test_calc.py,要求實現加法和除法功能,并處理除以零的錯誤。MiniMax M2先讀取測試文件,然后編寫代碼。在第一次運行pytest報錯后,它立即分析了錯誤原因并進行了修復。整個過程不到一分鐘,從空白文件到測試全綠,展示了MiniMax M2在獨立開發方面的能力。
在網頁交互任務測試中,我們采用了“受控指令”的方式來評估MiniMax M2的three.js編程能力。我們明確規定了每一項功能,包括創建太陽與三顆行星的三維場景、實現自轉與公轉動畫、顯示軌道輔助線等。評測結果顯示,MiniMax M2在第一次編程時完成了大部分功能,僅在“統一控制行星大小”方面需要新增一次對話進行修改。從運行日志來看,MiniMax M2的工作過程呈現出清晰的“生成—驗證—修復”節奏,展示了其在代碼生成和調試優化方面的能力。
隨著Agent技術的興起,關于“模型即agent”還是應用本身需要更多工作的討論日益激烈。MiniMax M2的出現為這些討論提供了新的視角:在各模態模型上都達到頂尖水平的公司,可能更能夠將Agent能力更好地提供給所有人。目前,MiniMax的語音模型和視頻模型均處于全球領先水平。這些模型的優異表現并非單純的“雕花”創新,而是源于MiniMax在技術架構上的創新,如Speech模型的Flow-VAE架構和Hailuo 02視頻模型的NCR架構。
MiniMax在技術追求上顯得與眾不同。它寧愿花費更多時間,甚至顯得“笨拙”一些,也要為技術的底層進步做出貢獻,解決技術落地過程中的實際問題。在文本模型領域,MiniMax也走過了相似的道路。從年初發布和開源的MiniMax 01系列開始,到后來的M1、今天的M2,模型在不斷進化中。最終,MiniMax交出了它心目中這個階段最能解決實際問題的Agent模型。它既是模型也是應用,是MiniMax“讓每個人都擁有充裕的智能”過程中的重要一步。
目前,用戶可以通過MiniMax Agent APP、API和各大模型平臺使用MiniMax M2。而且,MiniMax宣布Agent和模型全球限時免費14天,用戶可以盡情體驗。












