商湯科技近日宣布,正式推出并開源其最新研發的SenseNova-SI系列空間智能大模型。這一系列模型在空間理解與推理任務中表現卓越,不僅顯著超越同量級開源多模態大模型,更在多項國際權威評測中領先于GPT-5和Gemini 2.5 Pro等頂尖閉源模型,標志著我國在空間智能領域取得重要突破。
當前,主流大模型在知識儲備、文本生成、邏輯推理和編程能力等方面已展現出強大實力,但在空間結構理解與推理方面仍存在明顯短板。這種能力恰恰是具身智能體與物理世界交互所需的核心基礎。商湯科技此次發布的SenseNova-SI系列,正是針對這一痛點進行專項突破的創新成果。
該系列包含2B和8B兩種參數規模的模型版本。根據官方公布的評測數據,SenseNova-SI系列在VSI、MMSI、MindCube、ViewSpatial等空間智能基準測試中均取得優異成績。其中,8B版本模型在四個核心評測中平均得分達60.99,較Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等開源通用多模態模型,以及SpatialMLLM(35.05)、ViLaSR-7B(36.41)等專用空間智能模型均有顯著優勢。更引人注目的是,這一輕量化模型在性能上超越了GPT-5(49.68)和Gemini-2.5-Pro(48.81)等國際頂級閉源模型。
實際測試案例進一步驗證了該模型的空間智能優勢。在立方體組合圖形的俯視圖識別任務中,面對復雜三維結構,SenseNova-SI-8B準確選擇正確答案,而GPT-5出現判斷錯誤。在空間方位判斷場景中,當測試者模擬手持相機者的視角時,該模型能正確識別摩托車位于右側,而GPT-5誤判為左側。在動態場景理解方面,模型準確預測黃色汽車將進行右轉動作,而GPT-5判斷為靜止狀態。
在視角變化分析任務中,SenseNova-SI-8B展現出更強的空間推理能力。面對戶外場景的視角轉換,模型能精準判斷物體向左前方移動;在室內空間分析中,通過白板、沙發等家具的位置變化,同樣得出正確的移動方向判斷。另一項測試中,模型從正面視角準確識別桌子右側物體為門,而GPT-5的判斷出現偏差。這些案例充分證明,該模型在空間智能領域已實現質的飛躍。
目前,SenseNova-SI系列模型已通過開源方式向全球開發者開放。相關代碼和文檔可通過指定代碼倉庫獲取,這一舉措將為空間智能技術的研究與應用提供重要基礎設施,推動整個領域向更高水平發展。













