上海AI獨角獸企業MiniMax稀宇極智近日掀起技術發布熱潮,在短短一周內接連推出多款創新模型,涵蓋文本、視頻、語音及音樂生成領域,標志著中國企業在全模態人工智能技術上實現系統性突破。這一系列成果不僅刷新了全球AI性能與成本紀錄,更以開源模式向全球開發者開放核心技術,推動行業進入普惠創新階段。
在文本生成領域,MiniMax發布的M2模型引發全球關注。這款僅含100億激活參數的輕量化模型,在國際權威測評平臺Artificial Analysis(AA)中躋身全球前五,成為首個進入該榜單開源模型榜首的中國產品。其顛覆性的成本優勢尤為突出——每百萬Token處理費用低至0.53美元,僅為同類產品Claude 4.5 Sonnet的8%,同時推理速度提升近一倍。該模型專為編程與智能體協作場景優化,上線五日即在API整合平臺OpenRouter的實時調用量排名中躍居全球第四、國內首位,編程場景應用位列全球第三。
視頻生成技術迎來里程碑式升級。基于前代Hailuo 02模型改進的海螺2.3版本,在動態表現力、風格化呈現及人物細節刻畫方面取得顯著進展。新模型在保持原有定價水平的同時,將性能指標推至行業新高度,實現"加量不加價"的承諾。其生成的視頻內容在肢體動作流暢度與場景真實感上達到專業級水準,為影視制作、廣告創意等領域提供高效工具。
語音交互領域同樣亮點紛呈。Speech 2.6模型針對智能語音助手場景深度優化,將首包響應時間壓縮至250毫秒,達到行業頂尖水平。該模型突破傳統語音識別局限,具備完整的上下文理解與情感交互能力,可廣泛應用于智能客服、車載系統及無障礙溝通場景。測試數據顯示,其在嘈雜環境下的識別準確率較前代提升37%,多輪對話連貫性顯著增強。
音樂生成技術實現質的飛躍。Music 2.0模型突破性地融合人聲情感捕捉與器樂動態表現,能夠精準還原不同唱法的細微差異,甚至模擬專業音樂制作人的創作邏輯。該模型支持多風格情感表達,從激昂搖滾到抒情民謠均可自然演繹,其生成的人聲音色與真實歌手的相似度經專業評測達92%,為音樂創作、影視配樂等領域開辟全新可能性。
這一系列技術突破的背后,是中國AI企業從應用模仿向原創算法的戰略轉型。MiniMax成為亞洲首個在全模態領域實現技術領先的科研實體,其底層CISPO算法架構已獲國際同行認可。公司負責人表示,通過開源核心技術與降低應用門檻,旨在構建開放的創新生態,讓AI技術真正服務于實體經濟轉型。目前,相關模型已吸引超過20萬開發者注冊使用,日均調用量突破50億Token,在金融、醫療、教育等領域形成數十個行業解決方案。
行業觀察家指出,MiniMax的技術路徑代表中國AI發展的新范式——通過垂直場景深度優化實現彎道超車,用普惠成本推動技術普及。這種"高性能、低成本、全模態"的發展模式,正在重塑全球AI產業競爭格局,為發展中國家突破技術壁壘提供可復制的實踐經驗。隨著多模態技術的持續進化,數字內容創作、智能制造等產業或將迎來新一輪變革浪潮。











