近日,AI21Labs宣布推出一款名為Jamba Reasoning3B的開源小型語言模型,該模型專為邊緣設備的人工智能計算量身打造。作為Jamba系列的新成員,這款“迷你語言模型”采用Apache2.0許可證發布,由AI21Labs在特拉維夫研發完成。
與傳統依賴變換器架構的大型語言模型不同,Jamba Reasoning3B基于AI21Labs自主研發的混合狀態空間模型(SSM)-變換器架構。狀態空間模型是一種通過當前狀態預測后續狀態的深度學習算法,在特定任務中展現出比傳統變換器更高的效率。其中,Mamba架構作為SSM的變體,被整合進Jamba的架構設計中,進一步優化了模型的計算性能。
盡管體積小巧,Jamba Reasoning3B的性能卻毫不遜色。其上下文窗口長度可達25.6萬個標記,最大處理能力超過100萬個標記,支持在iPhone、Android手機、Mac和PC等設備上運行,功能與Anthropic Claude、Google Gemini等大型模型相近。這種“小身材大能量”的特性,使其成為邊緣計算領域的突破性產品。
Futurum Group分析師布拉德·希明(Brad Shimmin)指出,狀態空間模型的概念在行業內已存在多年,但直到近期才具備可行的技術實現。他強調,隨著計算技術的進步,這類模型因其擴展性強、運算速度快的特點,逐漸成為更優選擇。例如,SSM架構通過“繩索縮放”技術優化注意力機制,在減少計算資源消耗的同時,仍能高效處理復雜任務。
作為一家成立僅7年的生成式AI公司,AI21Labs雖規模較小,卻獲得了Google和英偉達等科技巨頭的支持,累計融資超6億美元。通過構建生態系統,該公司計劃從開源模型Jamba Reasoning3B中探索商業化路徑。例如,在模型發布會上,AI21Labs展示了其在IFBench、MMLU-Pro和Humanity's Last Exam等基準測試中的表現,結果顯示其性能超越了阿里巴巴Qwen3.4B、谷歌Gemma3.4B、meta Llama3.23B等同級別開源模型。
在企業應用場景中,Jamba Reasoning3B的潛力尤為突出。其支持檢索增強生成技術,允許企業根據自身需求定制模型,同時保障數據安全。希明認為,客戶服務中心是該模型的理想落地場景之一——通過其推理能力,模型可自動分析客戶投訴,判斷是否需要轉接人工處理,從而提升服務效率。
核心亮點:










