滾動資訊

當前位置：首頁 > 資訊 > 信息流 > 正文內容

Meta聯(lián)合高校研發(fā)DreamGym框架：低成本高效訓練AI代理，多領域表現(xiàn)亮眼

時間：2025-11-21 16:22:46 來源：互聯(lián)網編輯：快訊 IP：北京 發(fā)表評論無障礙通道

強化學習（RL）在訓練大型語言模型（LLM）代理時，常因高昂成本、復雜基礎設施和不可靠反饋等問題面臨挑戰(zhàn)。為破解這些難題，meta公司聯(lián)合芝加哥大學與加州大學伯克利分校的研究團隊，共同開發(fā)了一款名為DreamGym的創(chuàng)新框架。該框架通過模擬RL環(huán)境，為代理提供了一條高效且安全的訓練路徑，有效降低了數(shù)據(jù)收集與環(huán)境交互的開支。

DreamGym的核心優(yōu)勢在于其動態(tài)任務調整機制。在訓練過程中，框架會根據(jù)代理的實時表現(xiàn)，自動生成難度逐步提升的任務，確保代理能夠循序漸進地掌握復雜問題的解決方法。這種設計不僅提升了訓練效率，還避免了因任務難度跳躍過大導致的代理學習受阻問題。研究團隊的實驗數(shù)據(jù)顯示，DreamG姆在完全模擬環(huán)境中，以及模擬學習向現(xiàn)實場景遷移的過程中，均顯著優(yōu)化了RL訓練效果。

針對現(xiàn)實應用中操作序列長、反饋稀疏的痛點，DreamGym通過三個核心模塊構建了閉環(huán)訓練系統(tǒng)。首先是“基于推理的經驗模型”，它將目標環(huán)境的動態(tài)特性轉化為文本空間，模擬真實應用場景；其次是“經驗重放緩沖區(qū)”，作為動態(tài)記憶庫，通過存儲多樣化經驗指導模型預測，確保合成數(shù)據(jù)的豐富性；最后是“課程任務生成器”，根據(jù)代理能力自動生成更具挑戰(zhàn)性的新任務。三者協(xié)同作用，形成了從經驗生成到任務升級的完整鏈條。

在電子商務、體感控制和網頁交互等領域的基準測試中，DreamGym展現(xiàn)了卓越性能。尤其在WebArena環(huán)境下，經其訓練的代理任務成功率較傳統(tǒng)方法提升超30%，驗證了框架在復雜場景中的適應性。研究團隊指出，該框架在需要高成本數(shù)據(jù)收集的領域具有顯著優(yōu)勢——僅通過合成交互即可達到主流算法水平，大幅削減了訓練開支。

DreamGym的突破性在于重新定義了RL訓練的可行性邊界。通過將環(huán)境模擬與動態(tài)課程設計相結合，它為那些因成本或技術限制難以應用RL的領域提供了解決方案。例如，在需要人類專家標注的場景中，該框架可減少對人工驗證的依賴；在涉及長序列操作的場景中，其逐步進階的任務設計能幫助代理更穩(wěn)定地積累經驗。這些特性使DreamGym成為推動RL技術落地的重要工具。

更多>同類資訊

維基百科發(fā)布AI寫作識別指南：五大破綻助你一眼識破AI文本

11-21

月之暗面籌備上市進程加速，40億美元估值引關注，太空探索再添新動力

11-21

豆包輸入法上線小米商店，智能語音與多元功能助力高效輸入體驗

11-21

東軟云科技：以“AI+全球化”雙輪驅動領航中國企業(yè)價值出海新征程

11-21

中交集團汪雙杰當選院士：深耕凍土公路40余載引領行業(yè)技術革新

11-21

廣州車展北京越野放大招！ELMT Max亮相，BJ40探險家預訂開啟新征程

11-21

廣州車展北京越野放大招！ELMT Max征名，BJ40探險家預訂開啟新征程

11-21

中國探索月球新方案：“月基磁懸浮拋射系統(tǒng)”開啟太空物流新篇章

11-21

月球南極水冰成焦點，中國六足機器人2026年開啟“暗區(qū)偵察”

11-21

天王星沖日上演"躺平"自轉秀！84年一遇觀測良機別錯過

11-21

諾獎得主迪迪埃·奎洛茲成電開講：解鎖系外行星與宇宙生命探索密碼

11-21

11月夜空奇景：下弦月與昴星團“捉迷藏” 東部觀星正當時

11-21

16萬光年外恒星上演“雙爆轟”大戲宇宙舞臺再添震撼奇觀

11-21

16萬光年外紅蜘蛛星云現(xiàn)“隱形星”，恒星演化理論迎新變局

11-21

跨越130億年時光，21厘米信號或成解鎖首批恒星奧秘的鑰匙

11-21

點擊查看更多 +

全站最新

30.19萬起！猛士M817 Hero版安全智能又好玩改裝潛力無限

豆包AI深度賦能！榮威M7 DMH開啟智能交互新體驗，車展實力圈粉

華為與廣汽攜手啟境，以生態(tài)共創(chuàng)模式開啟智能汽車新征程

2025廣州車展：梅賽德斯-奔馳核心車型煥新，智能舒適雙升級

2025廣州車展：比亞迪漢L攜新車色、OTA及黑科技動力震撼登場

2025廣州車展魏牌煥新登場，以科技之力開啟家庭智慧出行新篇章

熱門內容

本欄最新

廣州車展北京越野放大招！ELMT Max亮相，BJ40探險家預訂開啟新征程

廣州車展北京越野放大招！ELMT Max征名，BJ40探險家預訂開啟新征程

2025廣州車展：全新212 T01皮卡版領銜多款車型齊亮相展實力

嵐圖夢想家山河上市：800V超混技術加持，售價70.99萬元引關注

2025廣州車展：北京越野ELMT Max原型車登場，模塊化設計亮點足

2025廣州車展：北京越野ELMT Max原型車登場，模塊化設計亮點多

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

Meta聯(lián)合高校研發(fā)DreamGym框架：低成本高效訓練AI代理，多領域表現(xiàn)亮眼