國內人工智能領域兩大領軍企業DeepSeek與寒武紀近日同步推進重要技術進展,引發行業高度關注。9月29日傍晚,DeepSeek通過官方渠道率先發布新一代實驗性模型DeepSeek-V3.2-Exp,該版本在原有V3.1-Terminus架構基礎上引入創新的稀疏注意力機制,重點優化長文本場景下的訓練與推理效率。
據技術團隊介紹,此次升級的DeepSeek Sparse Attention技術通過動態調整計算資源分配,有效降低了長序列處理過程中的算力消耗。為加速生態建設,DeepSeek同步下調API調用價格超50%,并完成官方應用、網頁端及小程序的全平臺更新。開發者現可通過原有接口直接調用新模型,享受更高效的算力支持與更低的開發成本。
緊隨其后,寒武紀于18時11分通過開發者平臺宣布完成技術適配。其自主研發的vLLM-MLU推理引擎源代碼已實現開源,開發者可在寒武紀軟硬件一體化平臺上直接部署DeepSeek-V3.2-Exp模型。技術文檔顯示,此次適配通過Triton算子開發與BangC融合算子技術,使新模型在寒武紀芯片上的計算效率達到行業領先水平。
寒武紀研發團隊透露,針對稀疏注意力機制特性,公司采用計算通信并行策略進行深度優化。這種軟硬件協同創新模式,使得長序列場景下的訓練推理成本顯著降低。此前雙方在DeepSeek系列模型上的合作已驗證了這種技術路徑的可行性,此次實驗性版本的快速適配進一步鞏固了技術優勢。
行業分析師指出,兩家企業從模型發布到生態適配的緊密協作,展現了中國AI產業鏈在關鍵技術環節的協同能力。這種同步推進的技術演進模式,不僅縮短了新技術的產業化周期,更為下游應用提供了更具性價比的解決方案。特別是在需要處理超長文本的金融、法律、科研等領域,相關技術突破將帶來顯著效率提升。
技術文檔顯示,寒武紀此次開源的推理引擎包含完整的模型部署指南與性能測試工具。開發者可通過指定代碼倉庫獲取相關資源,按照文檔指引即可在寒武紀MLU系列芯片上實現模型部署。這種開放的技術生態建設,有望吸引更多開發者參與AI應用創新。
市場觀察人士認為,此次技術聯動標志著中國AI產業從單點突破轉向系統化創新。通過模型架構創新與硬件加速技術的深度融合,國內企業正在構建具有自主知識產權的技術體系。這種發展模式或將改變全球AI技術競爭格局,為產業升級提供新的技術路徑。











