滾動資訊

當前位置：首頁 > 資訊 > 數字家電 > 正文內容

北理工DART框架革新：AI電腦操作效率躍升，智能助手時代加速到來

時間：2025-10-22 22:24:18 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

人工智能領域迎來突破性進展——由北京理工大學等多家機構聯合研發的GUI智能體訓練框架DART，成功讓AI具備像人類一樣操作電腦的能力。這項發表于arXiv平臺的研究（編號2509.23866v1），通過創新性架構設計使AI訓練效率提升數倍，在復雜軟件操作任務中展現出驚人表現。

傳統AI訓練如同單線程工廠，每個環節必須按順序完成：觀察屏幕、分析決策、執行操作、等待反饋。研究團隊形象地比喻這種模式如同廚師獨自完成整道菜品制作，在等待水燒開或食材烹飪的間隙完全閑置。DART框架通過將訓練過程解構為環境集群、推理服務、數據管理和訓練器四大模塊，實現了多線程并行作業，如同將手工作坊升級為現代化智能工廠。

在技術實現層面，研究團隊構建了包含180個虛擬Ubuntu環境的計算集群，配合多GPU推理服務器和智能數據管理系統。環境集群持續運行各類軟件任務，推理服務實時處理決策請求，數據管理系統精準調度訓練數據，訓練器則持續優化模型參數。這種架構使GPU利用率提升1.6倍，訓練吞吐量提高1.9倍，環境資源利用率更是達到傳統方法的5.5倍。

針對訓練數據質量參差不齊的問題，研究團隊設計了多層次自適應策略。在任務層面，系統動態調整練習頻率，當AI對某任務掌握度超過60%時自動減少訓練量；在操作軌跡層面，根據任務復雜度設置個性化步驟限制；在關鍵決策點層面，采用高熵驅動策略重點訓練不確定性高的操作步驟。特別設計的經驗軌跡池，通過預存成功案例幫助AI攻克復雜任務，如同為學生提供標準答案參考。

在OSWorld基準測試中，基于UI-TARS-1.5-7B模型優化的DART-GUI-7B展現出卓越性能。該模型在僅允許30步操作的嚴格限制下，達到42.13%的任務完成率，較基礎模型提升14.61個百分點，超越此前最優開源模型7.34個百分點。具體案例顯示，在VS Code配置任務中，AI能準確找到"編輯器換行列數"而非錯誤修改"HTML格式換行長度"；在LibreOffice文檔編輯中，精確選中需要下標的"2"而非整個"H2O"文本。

技術細節方面，研究團隊采用Kubernetes容器技術管理虛擬環境，通過vLLM推理引擎優化決策處理。構建的MySQL中央數據庫包含11個關聯數據表，完整記錄每次操作細節。分布對齊技術解決了推理與訓練環節的"表達差異"問題，確保模型學習過程的一致性。動態軌跡調節機制根據實時成功率自動調整采樣頻次，使計算資源始終聚焦于最需改進的任務。

盡管在Chrome瀏覽器"請勿跟蹤"設置等復雜任務中仍存在操作偏差，但研究團隊強調DART框架的核心價值在于提供可擴展的訓練基礎設施。開源的訓練框架、數據集和模型檢查點，為學術界和產業界提供了重要資源。該技術對普通用戶意味著自動化文件處理、數據備份等重復操作將成為現實；對企業用戶可顯著提升辦公效率；對殘障人士則能通過語音指令完成復雜軟件操作，大幅提高數字化工具的可訪問性。

在問答環節，研究人員解釋了DART-GUI-7B的獨特優勢：其去耦合架構使四個訓練模塊可獨立運行，避免傳統方法的等待損耗；軌跡級采樣技術允許AI即時獲得操作反饋，無需等待批量任務完成；按工作者更新機制實現模型局部優化，保持訓練過程連續性。這些創新使AI在30步操作限制下，達到其他模型100步才能實現的性能水平。

更多>同類資訊

IDC報告：百度智能云智算服務領跑市場，GenAI IaaS增速奪冠

模型服務層面，百度千帆提供覆蓋模型調用、模型開發、應用開發到數據智能的全流程、一站式AI服務。在金融行業，百度智能云與招商銀行正基于昆侖芯P800開展算力合作，為招行多個核心業務場景落地大模型應用提供全面…

10-22

從豆包到Cici：字節跳動AI全球布局加速，海外新星強勢崛起

除了底層技術與軟件，字節在硬件方面也推出了AI耳機等產品，此前還有市場消息稱其將推出AI手機，盡管其否認了AI手機項目，但也透露出了字節在AI硬件方面的野心。從豆包到Cici，字節跳動正在AI時代重構全球市…

10-22

天貓精靈全屋智能四川八店同啟：AI賦能空間進化，共筑智慧生活新范式

2025年10月18日，一場關于“未來生活”的展示在西南盛大開啟——天貓精靈全屋智能于四川同時落地8家門店，覆蓋成都、瀘州、廣元、都江堰等核心城市。為加速AI與美學的融合，天貓精靈全屋智能9月24日在云棲大…

10-22

從豆包到Cici：字節跳動AI海外突圍，打造下一個全球級產品

10-22

國研新能獲近5000萬B輪融資，鋼殼電池技術突破海外封鎖助力智能穿戴

10-22

格力朱磊談“翻車”視頻：臟公關借短視頻特性設局，堅信邪不壓正

10-22

華為鴻蒙6系統革新：跨生態文件互傳、鍵鼠無感切換、應用生態再升級

10-22

Netflix積極擁抱AI：助力創作者，以創新方式講好故事

10-22

谷歌Coral NPU開源登場：以高效架構與全棧方案，破解終端AI部署難題

10-22

知情人士爆料：夸克“C計劃”AI瀏覽器對標谷歌Chrome，年內或發布引關注

10-22

雙11新玩法：“即需即買即得” 淘寶閃購首秀激活消費新場景

10-22

雙11華為筆記本選購指南：從全能款到性價比款，輕松選到心儀好機！

10-22

OPPO Find X9系列正式開售：4399元起，搭載哈蘇真2億長焦成影像新標桿

10-22

古爾曼爆料：蘋果可折疊iPad或2029年上市，售價近3000美元面臨重量挑戰

10-22

國研新能獲近5000萬B輪融資，鋼殼電池技術突破海外封鎖助力智能穿戴

10-22

點擊查看更多 +

全站最新

寧德時代三季度日賺1.8億，動力電池市場“一超”格局松動，二線廠商崛起

百川智能推出M2 Plus大模型，六源循證推理助力醫療AI邁入新階段

努比亞Z80 Ultra深度體驗：影像游戲雙巔峰，全能旗艦新標桿

影像游戲雙巔峰！努比亞Z80 Ultra發布 4999元起開啟全能體驗新篇

谷歌云計算或迎發展契機：正與AI新秀Anthropic洽談百億美元級云服務大單

Q3全球PC出貨量達7590萬臺聯想居首蘋果增長顯著

熱門內容

本欄最新

胖東來2025年前9月銷售額達171.2億，超去年全年，創始人曾表態控銷

京東9月25日發布三款AI新品：涵蓋購物、生活及具身智能領域

速賣通“超級品牌出海計劃”啟航，助中國品牌海外破局，打造出海新陣地

2025假日季消費趨勢：中國品牌借AI與CTV全渠道策略，迎出海增長新契機

谷歌Pixel 10系列手機無線充電“小插曲”：戴殼充電易中斷引關注

云鯨智能：內憂產品質量信任危機，外患戰略滯后競爭失勢

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

北理工DART框架革新：AI電腦操作效率躍升，智能助手時代加速到來