国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

ITBear旗下自媒體矩陣:

清華大學(xué)團(tuán)隊(duì)提出EAGLET框架,讓AI智能體學(xué)會(huì)“深謀遠(yuǎn)慮”規(guī)劃任務(wù)

   時(shí)間:2025-11-15 01:19:33 來源:互聯(lián)網(wǎng)編輯:快訊 IP:北京 發(fā)表評(píng)論無障礙通道
 

人工智能領(lǐng)域迎來一項(xiàng)突破性進(jìn)展——清華大學(xué)聯(lián)合北京大學(xué)、DeepLang AI及伊利諾伊大學(xué)香檳分校的研究團(tuán)隊(duì),開發(fā)出名為EAGLET的創(chuàng)新訓(xùn)練框架,使AI智能體在復(fù)雜長期任務(wù)中展現(xiàn)出接近人類的全局規(guī)劃能力。這項(xiàng)成果已發(fā)表于arXiv預(yù)印本平臺(tái),編號(hào)arXiv:2510.05608v1,為解決AI"無腦試錯(cuò)"的痛點(diǎn)提供了全新解決方案。

傳統(tǒng)AI在處理簡單任務(wù)時(shí)表現(xiàn)優(yōu)異,但面對(duì)需要多步驟協(xié)調(diào)的復(fù)雜場景時(shí),往往陷入盲目探索的困境。研究團(tuán)隊(duì)以"準(zhǔn)備晚餐"為例:若缺乏整體規(guī)劃,AI可能先燒水再買菜,最終因烤箱未預(yù)熱而手忙腳亂。這種"走一步看一步"的模式,導(dǎo)致效率低下且成功率堪憂。現(xiàn)有訓(xùn)練方法要么依賴昂貴的人工標(biāo)注數(shù)據(jù),要么通過海量試錯(cuò)積累經(jīng)驗(yàn),均無法實(shí)現(xiàn)真正的全局把控。

EAGLET框架的核心突破在于將規(guī)劃與執(zhí)行徹底解耦。研究團(tuán)隊(duì)首先構(gòu)建了"冷啟動(dòng)"階段,利用GPT-5等頂級(jí)大模型生成初始規(guī)劃樣本,再通過"同源共識(shí)過濾"機(jī)制篩選優(yōu)質(zhì)數(shù)據(jù)。該機(jī)制采用兩個(gè)能力不同但架構(gòu)相似的執(zhí)行器(基礎(chǔ)版與專家版Llama-3.1-8B模型),讓它們?cè)谟袩o規(guī)劃指導(dǎo)下分別執(zhí)行任務(wù)。只有當(dāng)兩個(gè)執(zhí)行器在使用規(guī)劃時(shí)均顯著提升表現(xiàn),該規(guī)劃才會(huì)被保留用于訓(xùn)練。這種雙重驗(yàn)證機(jī)制確保了訓(xùn)練數(shù)據(jù)的高質(zhì)量。

在強(qiáng)化學(xué)習(xí)階段,團(tuán)隊(duì)創(chuàng)新性地提出"執(zhí)行器能力增益獎(jiǎng)勵(lì)"(ECGR)機(jī)制。與傳統(tǒng)方法單純以任務(wù)完成率為指標(biāo)不同,ECGR通過比較不同能力執(zhí)行器在有無規(guī)劃指導(dǎo)下的性能差異,量化規(guī)劃的實(shí)際價(jià)值。例如,對(duì)于簡單任務(wù),規(guī)劃器會(huì)生成簡潔步驟;面對(duì)復(fù)雜場景,則提供詳細(xì)指導(dǎo)。這種"因材施教"的能力,使規(guī)劃器能靈活應(yīng)對(duì)各種難度級(jí)別的任務(wù)。

實(shí)驗(yàn)驗(yàn)證環(huán)節(jié),研究團(tuán)隊(duì)在三個(gè)典型場景中展開測試:ScienceWorld模擬科學(xué)實(shí)驗(yàn)室環(huán)境,要求AI完成測量物質(zhì)熔點(diǎn)等實(shí)驗(yàn);ALFWorld模擬家庭場景,需執(zhí)行"將加熱杯子放入櫥柜"等家務(wù);WebShop則構(gòu)建在線購物環(huán)境,考驗(yàn)AI根據(jù)需求搜索商品的能力。結(jié)果顯示,配備EAGLET的智能體在所有場景中均表現(xiàn)卓越:ScienceWorld中已見任務(wù)成功率提升20%,未見任務(wù)提升25%;ALFWorld平均提升超15%;WebShop提升約10%。更關(guān)鍵的是,這些提升伴隨著步驟數(shù)的顯著減少,證明規(guī)劃器有效避免了無效探索。

訓(xùn)練效率方面,EAGLET展現(xiàn)出驚人優(yōu)勢(shì)。傳統(tǒng)強(qiáng)化學(xué)習(xí)需數(shù)百次迭代才能收斂,而EAGLET僅需約50次即可達(dá)到優(yōu)異性能,訓(xùn)練成本降低8倍。這種效率提升源于高質(zhì)量初始數(shù)據(jù)和精準(zhǔn)獎(jiǎng)勵(lì)設(shè)計(jì),使訓(xùn)練過程更具針對(duì)性。訓(xùn)練完成的規(guī)劃器具有強(qiáng)通用性,可輕松適配不同執(zhí)行器,無需重復(fù)訓(xùn)練。

消融實(shí)驗(yàn)進(jìn)一步揭示了各組件的貢獻(xiàn):移除同源共識(shí)過濾導(dǎo)致性能下降3%,取消ECGR機(jī)制則下降5%,證明數(shù)據(jù)質(zhì)量與獎(jiǎng)勵(lì)設(shè)計(jì)同等重要。團(tuán)隊(duì)還發(fā)現(xiàn),將規(guī)劃信息直接嵌入任務(wù)指令的效果最佳,這為后續(xù)優(yōu)化提供了方向。對(duì)比實(shí)驗(yàn)顯示,EAGLET生成的規(guī)劃在正確性、可操作性和標(biāo)準(zhǔn)化程度上均優(yōu)于直接使用GPT-4.1的規(guī)劃,證明專門訓(xùn)練的優(yōu)越性。

具體案例中,"將熱杯子放入櫥柜"任務(wù)暴露了傳統(tǒng)方法的缺陷:無規(guī)劃智能體反復(fù)聲明任務(wù)完成卻未實(shí)際執(zhí)行;傳統(tǒng)MPO方法因錯(cuò)誤假設(shè)陷入循環(huán);而EAGLET智能體則系統(tǒng)搜索杯子,發(fā)現(xiàn)錯(cuò)誤后及時(shí)糾正,最終僅用16步高效完成任務(wù)。這種目標(biāo)導(dǎo)向的決策模式,標(biāo)志著AI從反應(yīng)式向預(yù)見式的轉(zhuǎn)變。

盡管成果顯著,研究團(tuán)隊(duì)也指出當(dāng)前局限:實(shí)驗(yàn)主要基于文本交互環(huán)境,多模態(tài)場景適用性需進(jìn)一步驗(yàn)證;同源共識(shí)過濾依賴多個(gè)執(zhí)行器,某些場景可能受限;跨領(lǐng)域泛化能力仍有提升空間。針對(duì)這些問題,團(tuán)隊(duì)計(jì)劃探索多模態(tài)規(guī)劃、輕量化評(píng)估機(jī)制及更強(qiáng)泛化能力,推動(dòng)技術(shù)向更廣泛應(yīng)用場景拓展。

這項(xiàng)研究為AI發(fā)展開辟了新路徑。傳統(tǒng)方法側(cè)重模仿人類行為,而EAGLET讓機(jī)器學(xué)會(huì)像人類一樣思考規(guī)劃。這種轉(zhuǎn)變使AI從被動(dòng)工具升級(jí)為主動(dòng)助手,能夠理解深層需求、提出解決方案并協(xié)助實(shí)現(xiàn)復(fù)雜目標(biāo)。在工業(yè)機(jī)器人裝配、服務(wù)機(jī)器人護(hù)理、自動(dòng)駕駛導(dǎo)航等領(lǐng)域,這種全局規(guī)劃能力將成為核心競爭優(yōu)勢(shì)。對(duì)技術(shù)細(xì)節(jié)感興趣的讀者,可通過論文編號(hào)arXiv:2510.05608v1查閱完整內(nèi)容。

 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭議稿件處理  |  English Version
 
国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级
成人国产亚洲欧美成人综合网| 欧洲另类一二三四区| 免费高清成人在线| 欧美三级一区二区| 午夜激情综合网| 制服丝袜中文字幕一区| 久久精品国产一区二区| 2021中文字幕一区亚洲| 大尺度一区二区| 一区二区国产视频| 91精品国产综合久久福利软件 | 日本高清不卡aⅴ免费网站| 亚洲综合色区另类av| 欧美一级专区免费大片| 成人免费的视频| 亚洲bt欧美bt精品| 国产欧美视频一区二区| 欧美亚洲综合另类| 国产一区美女在线| 亚洲精品视频免费观看| 51精品视频一区二区三区| 国产精品123| 天堂一区二区在线| 日韩毛片视频在线看| 日韩欧美二区三区| 日本韩国欧美一区| 不卡的看片网站| 久久99精品国产麻豆婷婷| 悠悠色在线精品| 国产亚洲精品bt天堂精选| 6080yy午夜一二三区久久| kk眼镜猥琐国模调教系列一区二区 | 色8久久精品久久久久久蜜| 青青青伊人色综合久久| 亚洲精品少妇30p| 欧美v国产在线一区二区三区| 色狠狠桃花综合| 成人精品视频.| 国产呦精品一区二区三区网站| 午夜精品免费在线观看| 国产精品电影一区二区三区| 26uuu色噜噜精品一区二区| 91精品国产色综合久久| 在线不卡一区二区| 欧美日韩在线电影| 欧美日韩一区在线观看| 欧美日韩国产一二三| 欧美日韩综合在线| 777午夜精品免费视频| 9191久久久久久久久久久| 欧美亚洲另类激情小说| 91久久精品日日躁夜夜躁欧美| 9i在线看片成人免费| 成人黄动漫网站免费app| 不卡电影免费在线播放一区| 91亚洲国产成人精品一区二区三| 成av人片一区二区| 成人精品鲁一区一区二区| 成人a区在线观看| 91免费观看国产| 欧洲一区二区三区在线| 欧美精品一级二级三级| 欧美一个色资源| 欧美经典三级视频一区二区三区| 亚洲aⅴ怡春院| 久久久午夜精品| 中文字幕成人网| 国产精品电影一区二区三区| 亚洲最大的成人av| 午夜精品福利一区二区三区av| 三级在线观看一区二区| 国产精品资源在线看| 丁香天五香天堂综合| 在线一区二区视频| 精品久久人人做人人爱| 国产精品美女久久久久久| 一区二区三区欧美在线观看| 激情六月婷婷综合| 91福利视频网站| 久久久91精品国产一区二区三区| 亚洲色图欧美激情| 久久99日本精品| 在线视频一区二区三| 国产亚洲欧洲997久久综合| 亚洲午夜av在线| www.亚洲免费av| 日韩精品在线一区二区| 亚洲一级电影视频| 成人av午夜影院| 日韩欧美在线123| 亚洲一区二区三区激情| 成人性视频免费网站| 日韩一区二区三区免费观看 | 久久精品亚洲麻豆av一区二区| 亚洲综合男人的天堂| 国产jizzjizz一区二区| 欧美一区二区三区人| 一区二区三区在线观看国产| 成人午夜电影久久影院| 日韩精品最新网址| 日韩av一区二区在线影视| 在线观看视频91| 亚洲色图在线播放| 国产电影精品久久禁18| 久久久久久久久久久久久夜| 经典三级视频一区| 欧美成人a视频| 国产精品正在播放| 国产精品天美传媒沈樵| 国产99一区视频免费| 国产日韩一级二级三级| 粉嫩在线一区二区三区视频| 久久久久久久久久久久电影| 国产精品18久久久久久vr| 久久精品夜夜夜夜久久| 国产精品一区二区三区99| 精品盗摄一区二区三区| 国产伦精品一区二区三区视频青涩 | 欧美电视剧免费全集观看| 美女在线观看视频一区二区| 日韩一区和二区| 国产精品综合久久| 综合欧美一区二区三区| 欧美四级电影网| 黄页视频在线91| 国产精品天干天干在线综合| 一本一道久久a久久精品| 亚洲福中文字幕伊人影院| 日韩亚洲欧美在线| 国产69精品久久99不卡| 一区二区欧美在线观看| 欧美高清视频在线高清观看mv色露露十八 | 国产成人综合视频| 亚洲精品综合在线| 日韩一区二区中文字幕| 国产成人精品一区二| 国产精品妹子av| 欧美丰满美乳xxx高潮www| 国产91综合网| 亚洲高清视频中文字幕| 久久日韩粉嫩一区二区三区| 91在线精品一区二区三区| 日韩电影网1区2区| 国产精品福利av| 91精品免费观看| 91在线精品一区二区| 国内成人免费视频| 午夜欧美在线一二页| 国产精品久久久久一区二区三区共| 欧美日韩国产影片| 色综合天天综合狠狠| 精品一区二区三区免费观看| 一区二区不卡在线播放| 国产精品三级视频| 精品va天堂亚洲国产| 51精品国自产在线| 欧洲国产伦久久久久久久| 粉嫩绯色av一区二区在线观看 | 日韩精品1区2区3区| 亚洲国产sm捆绑调教视频| 亚洲三级小视频| 欧美激情中文字幕一区二区| 欧美岛国在线观看| 日韩一区二区在线看片| 欧洲另类一二三四区| 色噜噜狠狠成人中文综合| 色婷婷av一区二区三区软件| 国产成人精品影视| 国产91精品精华液一区二区三区 | 国产精品视频一二三区| 国产三级精品视频| 久久蜜桃一区二区| 国产三级一区二区三区| 久久精品日产第一区二区三区高清版 | 在线一区二区视频| 色先锋久久av资源部| 色先锋aa成人| 欧美卡1卡2卡| 26uuu另类欧美| 国产精品久久福利| 一区二区三区不卡视频| 日本欧美一区二区三区| 狠狠色丁香婷综合久久| 国产999精品久久久久久绿帽| www.亚洲国产| 欧美三片在线视频观看| 精品久久久久久亚洲综合网| 国产亚洲精品aa| 亚洲精品国久久99热| 奇米777欧美一区二区| 国产麻豆91精品| 色爱区综合激月婷婷| 日韩亚洲欧美在线观看| 中文字幕va一区二区三区| 亚洲国产精品一区二区www | 欧美午夜影院一区| 久久久青草青青国产亚洲免观| 亚洲精品va在线观看| 国产成人精品一区二 | 欧美一区二区啪啪|