大模型領(lǐng)域迎來新突破,知名獨角獸企業(yè)階躍星辰近日宣布開源其自主研發(fā)的GELab-Zero項目。這一創(chuàng)新成果首次將圖形用戶界面(GUI)智能體模型與完整的配套基礎(chǔ)設(shè)施同步開放,為開發(fā)者社區(qū)帶來重大利好,尤其為偏好自主搭建環(huán)境的“手搓黨”提供了一鍵部署的便捷方案。
核心亮點在于4B參數(shù)規(guī)模的GUI智能體模型,該模型在移動端與桌面端的多項權(quán)威基準(zhǔn)測試中表現(xiàn)卓越,不僅刷新了同尺寸模型性能紀(jì)錄,更在ScreenSpot、OSWorld等國際公認(rèn)的評估體系中斬獲最先進(jìn)水平(SOTA)認(rèn)證。值得注意的是,其性能表現(xiàn)甚至超越了參數(shù)規(guī)模達(dá)32B的GUI-Owl等主流模型,在保持高精度的同時顯著降低了部署門檻。
技術(shù)團(tuán)隊同步開源了基于真實業(yè)務(wù)場景構(gòu)建的AndroidDaily評測標(biāo)準(zhǔn),該體系突破傳統(tǒng)學(xué)術(shù)評測框架,聚焦消費級應(yīng)用的規(guī)模化落地需求。通過模擬日常高頻使用場景,為行業(yè)提供了更具實踐指導(dǎo)意義的評估維度。目前開發(fā)者可通過GitHub與HuggingFace兩大開源平臺獲取完整工具鏈,實現(xiàn)從模型訓(xùn)練到終端部署的全流程自主掌控。
在功能特性方面,GELab-Zero展現(xiàn)出強大的工程化能力。其輕量化設(shè)計支持4B模型在消費級硬件上流暢運行,既保證了低延遲響應(yīng)又確保用戶數(shù)據(jù)隱私安全。系統(tǒng)內(nèi)置的智能環(huán)境適配模塊可自動處理多終端依賴配置,支持跨設(shè)備任務(wù)分發(fā)與交互軌跡記錄,形成可復(fù)現(xiàn)的操作閉環(huán)。更創(chuàng)新性地引入多模態(tài)智能體協(xié)作框架,涵蓋ReAct閉環(huán)推理、多智能體協(xié)同作業(yè)及定時任務(wù)調(diào)度等高級工作模式。
實際應(yīng)用場景測試顯示,該系統(tǒng)能精準(zhǔn)執(zhí)行復(fù)雜組合指令。在跨品類采購任務(wù)中,可自動處理不同商品的規(guī)格匹配與數(shù)量計算;面對“適合親子活動的經(jīng)典電影推薦”等主觀性需求時,能通過語義理解建立動態(tài)評估標(biāo)準(zhǔn),生成符合用戶偏好的執(zhí)行方案。這種類人化的決策能力,標(biāo)志著GUI智能體從單一指令響應(yīng)向自主策略規(guī)劃的跨越。
研發(fā)團(tuán)隊透露,項目初衷源于對移動生態(tài)碎片化難題的深度洞察。當(dāng)前不同品牌設(shè)備的系統(tǒng)差異導(dǎo)致智能體部署面臨ADB連接、權(quán)限配置等工程障礙,開發(fā)者需耗費大量精力處理基礎(chǔ)設(shè)施問題。GELab-Zero通過標(biāo)準(zhǔn)化接口設(shè)計與自動化運維模塊,將開發(fā)者從重復(fù)性工程工作中解放,使其能專注于核心算法創(chuàng)新。
此前該團(tuán)隊展示的AI手機解決方案已展現(xiàn)技術(shù)潛力,接入系統(tǒng)的設(shè)備可自主完成追星打卡、外賣訂購、醫(yī)療預(yù)約等30余類生活服務(wù)。此次開源的GELab-Zero進(jìn)一步拓展了應(yīng)用邊界,通過提供完整的工具鏈與開發(fā)范式,加速推動GUI智能體從實驗室走向規(guī)模化商業(yè)應(yīng)用,為智能終端交互范式革新奠定技術(shù)基礎(chǔ)。










