近日,智譜正式對外發布其最新旗艦大模型GLM-4.6,作為GLM系列的重要升級版本,該模型在綜合性能上較前代GLM-4.5實現27%的顯著提升,覆蓋編程能力、長文本處理、邏輯推理、信息檢索、內容生成及智能體應用等六大核心場景。
在權威基準測試中,GLM-4.6展現強勁實力。該模型在AIME 25、LCB v6、HLE等8項國際主流評測中,部分指標已與Claude Sonnet 4/4.5持平,穩居國內大模型性能榜首。尤其在真實編程場景測試中,通過Claude Code環境對74個復雜任務進行驗證,GLM-4.6的實際表現超越Claude Sonnet 4,同時顯著領先其他國產同類模型。
效率優化方面,GLM-4.6通過架構創新實現計算資源消耗的突破性降低。數據顯示,其平均token處理成本較GLM-4.5下降超30%,達到行業最低水平。這一改進得益于模型對計算單元的深度優化,在保證輸出質量的前提下,有效控制了算力消耗。
硬件適配領域,GLM-4.6完成與國產芯片的深度整合。該模型已成功部署于寒武紀-U(688256.SH)芯片平臺,實現FP8+Int4混合量化技術的國產化落地。這項全球首創的芯片-模型協同解決方案,在維持模型精度的同時,將推理成本壓縮至新低,為國產硬件運行千億參數級大模型開辟了可行路徑。
在圖形處理器領域,GLM-4.6與摩爾線程新一代GPU達成深度兼容。基于vLLM推理框架,該模型可在摩爾線程全功能GPU上以原生FP8精度穩定運行,充分驗證了MUSA架構在生態適配與技術支持方面的領先優勢。這種軟硬件協同創新模式,為國產AI技術棧的完整性提供了重要支撐。
據智譜官方透露,搭載寒武紀與摩爾線程國產芯片的GLM-4.6解決方案,即將通過MaaS平臺(bigmodel.cn)向個人用戶及企業客戶開放。這一組合標志著國產大模型與自主芯片在訓練推理環節形成完整閉環,有望推動AI技術在關鍵領域的自主可控發展。
技術文檔顯示,GLM-4.6的升級聚焦于實際場景需求。在編程能力維度,模型可處理更復雜的代碼生成與調試任務;長文本處理方面,支持超過200K tokens的上下文理解;智能體應用則強化了多輪交互與任務分解能力。這些改進使模型能更好適配企業級應用場景。
開源計劃方面,GLM-4.6將遵循MIT協議,陸續登陸Hugging Face與ModelScope等國際開源社區。此舉旨在促進技術共享與生態共建,為全球開發者提供高性能的國產大模型選擇。