近日,智譜科技宣布將其核心AI智能體模型AutoGLM正式開源,這一舉措在人工智能領(lǐng)域引發(fā)廣泛討論。作為一款跨端通用智能體,AutoGLM能夠通過自然語言指令自主操作手機、電腦等設(shè)備,實現(xiàn)"一句話完成復(fù)雜任務(wù)"的交互體驗。該模型首次亮相于111天前,經(jīng)過持續(xù)迭代,現(xiàn)已具備穩(wěn)定處理外賣訂購、機票預(yù)訂、社交互動等數(shù)十步流程的能力,覆蓋50余個高頻中文應(yīng)用的核心場景。
AutoGLM的核心突破在于其"Phone Use"能力框架,可精準(zhǔn)模擬人類點擊、滑動、輸入等操作。在跨端協(xié)同方面,該模型支持手機與電腦的聯(lián)動操作——用戶可通過手機發(fā)送指令,讓電腦自動生成PPT或整理數(shù)據(jù),所有任務(wù)均在云端虛擬環(huán)境中運行,避免占用本地設(shè)備資源。這種設(shè)計既提升了執(zhí)行效率,又保障了用戶設(shè)備的使用流暢性。
2025年8月升級至2.0版本后,AutoGLM明確"執(zhí)行型助手"定位,突破傳統(tǒng)AI助手僅提供對話或信息查詢的局限。在辦公場景中,該模型可自主完成從資料檢索到視頻、PPT生成的全流程;在生活服務(wù)領(lǐng)域,則能實現(xiàn)跨應(yīng)用聯(lián)動預(yù)訂。不過,初期版本因第三方應(yīng)用適配問題、授權(quán)流程繁瑣及語義理解偏差等因素,未能實現(xiàn)預(yù)期的C端傳播效果。
此次開源包含三大核心價值:其一,通過開放技術(shù)底座打破AI手機能力壟斷,防止行業(yè)生態(tài)被少數(shù)企業(yè)控制;其二,采用MIT和Apache-2.0雙許可證協(xié)議,確保用戶數(shù)據(jù)與控制權(quán)完全歸屬使用方,支持私有化部署;其三,共享32個月的技術(shù)積累,提供訓(xùn)練好的核心模型、能力框架及50余個高頻應(yīng)用的開發(fā)文檔,顯著降低Agent開發(fā)門檻。據(jù)技術(shù)文檔披露,開源內(nèi)容已形成完整的技術(shù)棧,開發(fā)者可基于現(xiàn)有框架快速構(gòu)建定制化解決方案。
行業(yè)分析指出,AutoGLM的開源戰(zhàn)略具有深遠影響。通過將"AI使用手機"這一核心能力轉(zhuǎn)化為公共基礎(chǔ)設(shè)施,該模型為開發(fā)者提供了標(biāo)準(zhǔn)化開發(fā)環(huán)境,類似Android系統(tǒng)對移動應(yīng)用生態(tài)的塑造作用。這種模式不僅避免了技術(shù)壟斷風(fēng)險,更通過降低開發(fā)成本催生多樣化創(chuàng)新應(yīng)用。特別是在涉及支付、社交等敏感領(lǐng)域,私有化部署方案有效解決了用戶信任問題,技術(shù)團隊明確表示"拒絕將關(guān)鍵能力集中于單一主體"。
當(dāng)前AI智能體領(lǐng)域正形成兩條技術(shù)路線:以AutoGLM為代表的"云端智能體"范式,通過虛擬設(shè)備隔離執(zhí)行環(huán)境,保障用戶本地設(shè)備性能;以某競品為代表的"終端具身智能"范式,則直接在物理設(shè)備上模擬操作,將AI能力深度集成至硬件層。后者雖實現(xiàn)多任務(wù)并行,但因挑戰(zhàn)現(xiàn)有超級應(yīng)用生態(tài)壁壘,已引發(fā)部分平臺的限制措施。兩種路徑的競爭,實質(zhì)是軟件生態(tài)與硬件整合的權(quán)力博弈。
智譜的開源策略包含雙重考量:技術(shù)層面,通過封裝操作執(zhí)行能力為API接口,支持開發(fā)者靈活調(diào)用;生態(tài)層面,構(gòu)建開放協(xié)作的技術(shù)社區(qū),吸引硬件廠商、應(yīng)用開發(fā)者共同完善標(biāo)準(zhǔn)。這種模式與某競品通過專屬硬件搶占終端入口的策略形成鮮明對比,標(biāo)志著AI智能體領(lǐng)域正式進入基礎(chǔ)設(shè)施競爭階段。隨著更多參與者入局,這場關(guān)于技術(shù)標(biāo)準(zhǔn)與生態(tài)主導(dǎo)權(quán)的競爭將持續(xù)重塑行業(yè)格局。











