国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

ITBear旗下自媒體矩陣:

清華深研院新突破:AI推理告別“非此即彼”,探索利用雙提升

   時(shí)間:2025-10-22 22:17:27 來(lái)源:互聯(lián)網(wǎng)編輯:快訊 IP:北京 發(fā)表評(píng)論無(wú)障礙通道
 

當(dāng)大型語(yǔ)言模型處理復(fù)雜問(wèn)題時(shí),常面臨一個(gè)關(guān)鍵抉擇:是廣泛嘗試多種解法(探索),還是依賴已有經(jīng)驗(yàn)(利用)?傳統(tǒng)認(rèn)知中,這兩者如同天平兩端,只能選擇其一。但清華大學(xué)深圳國(guó)際研究生院聯(lián)合加州大學(xué)洛杉磯分校、深圳技術(shù)大學(xué)的研究團(tuán)隊(duì),通過(guò)一項(xiàng)創(chuàng)新研究顛覆了這一觀念。他們發(fā)現(xiàn),在模型內(nèi)部的深層語(yǔ)義空間中,探索與利用并非對(duì)立,而是可以協(xié)同增強(qiáng)。該成果以論文形式發(fā)表于預(yù)印本平臺(tái)arXiv(編號(hào):arXiv:2509.23808v2),為AI推理能力提升開(kāi)辟了新路徑。

研究團(tuán)隊(duì)將視角從“輸出詞匯”轉(zhuǎn)向“思維過(guò)程”,聚焦模型處理問(wèn)題時(shí)的隱藏狀態(tài)——這些未被直接觀察的語(yǔ)義表征,如同人類思考時(shí)未說(shuō)出口的想法。通過(guò)引入“有效排序”這一數(shù)學(xué)工具,他們量化了模型在語(yǔ)義空間中的探索行為。與傳統(tǒng)矩陣排序僅統(tǒng)計(jì)維度數(shù)量不同,有效排序能分析維度的“質(zhì)量分布”,就像評(píng)估探險(xiǎn)路線時(shí)不僅看數(shù)量,還要看路線是否均衡利用。

基于有效排序,研究團(tuán)隊(duì)進(jìn)一步提出動(dòng)態(tài)指標(biāo):有效排序速度衡量信息獲取效率,反映利用能力;有效排序加速度則捕捉信息獲取速度的變化趨勢(shì)。正值表示思維活躍度增加,負(fù)值意味著推理趨于停滯。實(shí)驗(yàn)發(fā)現(xiàn),正確推理路徑中,有效排序加速度始終保持較高值,而錯(cuò)誤路徑往往同時(shí)出現(xiàn)高探索和高利用指標(biāo),表明過(guò)度探索與過(guò)度信息獲取可能導(dǎo)致推理偏離正確方向。

這一發(fā)現(xiàn)徹底改變了傳統(tǒng)訓(xùn)練方法的設(shè)計(jì)思路。研究團(tuán)隊(duì)開(kāi)發(fā)的VERL(速度利用排序?qū)W習(xí))方法,通過(guò)實(shí)時(shí)監(jiān)控隱藏狀態(tài)的動(dòng)態(tài)演化,利用有效排序加速度作為“智能調(diào)度器”。當(dāng)模型可能過(guò)度自信時(shí),系統(tǒng)增強(qiáng)探索激勵(lì);當(dāng)推理可能停滯時(shí),則加強(qiáng)利用獎(jiǎng)勵(lì)。這種雙通道激勵(lì)機(jī)制如同為AI安裝了雙引擎,既能預(yù)防錯(cuò)誤,又能鞏固有效推理。

VERL的創(chuàng)新不僅在于機(jī)制設(shè)計(jì),更在于其穩(wěn)定性保障。由于有效排序加速度具有理論上的O(1)增長(zhǎng)穩(wěn)定性,它為訓(xùn)練提供了可靠的指導(dǎo)信號(hào)。實(shí)驗(yàn)中,VERL在多種語(yǔ)言模型和數(shù)學(xué)推理基準(zhǔn)測(cè)試中均表現(xiàn)出色。以Llama-3.2-3B-Instruct模型為例,在AIME24數(shù)據(jù)集上,應(yīng)用VERL后準(zhǔn)確率從3.3%提升至13.3%;在高考2024數(shù)據(jù)集這一高難度測(cè)試中,準(zhǔn)確率提升達(dá)21.4%。

在Pass@k測(cè)試中,VERL的優(yōu)勢(shì)更為突出。這類測(cè)試要求模型生成多個(gè)解答,只要有一個(gè)正確即算成功。VERL訓(xùn)練的模型在某些數(shù)據(jù)集上,Pass@k的改進(jìn)幅度超過(guò)Pass@1,直接證明了其在增強(qiáng)探索能力方面的有效性。消融實(shí)驗(yàn)進(jìn)一步驗(yàn)證,僅使用探索或利用相關(guān)項(xiàng)均無(wú)法實(shí)現(xiàn)穩(wěn)定性能提升,只有兩者結(jié)合才能持續(xù)改進(jìn)。

實(shí)際應(yīng)用案例生動(dòng)展示了VERL的優(yōu)勢(shì)。在涉及負(fù)數(shù)比較的數(shù)學(xué)問(wèn)題中,傳統(tǒng)方法訓(xùn)練的模型錯(cuò)誤認(rèn)為-1小于-13,而VERL訓(xùn)練的模型能正確處理這類基礎(chǔ)概念。在房屋計(jì)數(shù)應(yīng)用題中,傳統(tǒng)模型忽略約束條件,錯(cuò)誤推斷每條街道只有10棟房屋;VERL模型則正確理解約束,得出每條街道20棟房屋的結(jié)論。在微分方程求解中,傳統(tǒng)模型常忽略“純指數(shù)”約束,給出包含多項(xiàng)式和三角函數(shù)的通解;VERL模型則嚴(yán)格遵循要求,只給出符合條件的指數(shù)解。

VERL的成功源于對(duì)模型內(nèi)部表征動(dòng)態(tài)的深入理解。傳統(tǒng)方法在詞匯層面觀察到的探索-利用權(quán)衡,在隱藏狀態(tài)層面幾乎消失。這是因?yàn)樵~匯輸出是高度壓縮的結(jié)果,而隱藏狀態(tài)保留了更豐富的語(yǔ)義信息。在這個(gè)更豐富的表征空間中,模型有足夠“空間”同時(shí)進(jìn)行探索和利用。有效排序加速度作為元控制信號(hào),能前瞻性地調(diào)節(jié)推理過(guò)程,引導(dǎo)模型走向更健康的推理路徑。

這項(xiàng)研究不僅提出了有效的技術(shù)方法,更從根本上改變了對(duì)AI推理過(guò)程的理解。它挑戰(zhàn)了探索-利用權(quán)衡的傳統(tǒng)認(rèn)知,開(kāi)創(chuàng)了基于語(yǔ)義表征動(dòng)態(tài)性進(jìn)行模型優(yōu)化的新范式。通過(guò)多尺度分析,研究團(tuán)隊(duì)獲得了單一尺度分析無(wú)法提供的深層洞察,為AI系統(tǒng)的改進(jìn)開(kāi)辟了全新方向。VERL代表的“質(zhì)量提升”型改進(jìn)路徑,在當(dāng)前AI發(fā)展面臨資源和環(huán)境約束的背景下,具有特殊意義。

Q&A

Q1:VERL方法與傳統(tǒng)強(qiáng)化學(xué)習(xí)方法的核心差異是什么?

A:傳統(tǒng)方法基于詞匯層面分析,認(rèn)為探索和利用只能二選一;VERL則深入語(yǔ)義表征空間,發(fā)現(xiàn)兩者可解耦,并通過(guò)有效排序及其導(dǎo)數(shù)同時(shí)增強(qiáng)這兩種能力,如同為AI配備智能雙引擎。

Q2:為何有效排序加速度能作為可靠的控制信號(hào)?

A:該指標(biāo)具有O(1)增長(zhǎng)穩(wěn)定性,不會(huì)因問(wèn)題規(guī)模或序列長(zhǎng)度變化而劇烈波動(dòng)。正確推理路徑中,此指標(biāo)往往保持較高值,而錯(cuò)誤推理中表現(xiàn)不佳,因此可區(qū)分推理質(zhì)量并指導(dǎo)訓(xùn)練。

Q3:VERL方法的實(shí)際應(yīng)用效果如何?

A:實(shí)驗(yàn)顯示,VERL在多種數(shù)學(xué)推理任務(wù)中顯著提升性能,高考2024數(shù)據(jù)集上準(zhǔn)確率提升達(dá)21.4%。更重要的是,它不僅提高準(zhǔn)確率,還增強(qiáng)推理多樣性,使AI能使用更豐富的解題策略。

 
 
更多>同類資訊
全站最新
熱門(mén)內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭(zhēng)議稿件處理  |  English Version
 
国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级
欧美激情中文字幕| 中文字幕一区二区三区四区不卡| 日韩精品一区二区三区四区| 欧美高清视频不卡网| 最新不卡av在线| 99精品视频一区| 亚洲三级在线看| 黄色日韩三级电影| 欧美伦理电影网| 一区二区三区在线不卡| av亚洲产国偷v产偷v自拍| 日韩一区欧美一区| 在线观看av不卡| 午夜精品一区二区三区三上悠亚 | 中文字幕亚洲视频| 久久久www成人免费无遮挡大片| 亚洲成人免费看| 91国产视频在线观看| 午夜av一区二区| 久久久99精品久久| 色综合天天视频在线观看| 一区二区久久久久久| 6080午夜不卡| 精品99久久久久久| 97久久精品人人爽人人爽蜜臀 | 日本欧美在线看| 久久综合中文字幕| 在线视频综合导航| 国产一区亚洲一区| 91麻豆精品秘密| 麻豆精品国产传媒mv男同| 中文字幕国产一区二区| 欧美日韩aaaaa| 粉嫩久久99精品久久久久久夜| 一区二区三区成人在线视频| 日韩无一区二区| 色综合久久综合网欧美综合网| 在线观看欧美精品| 国产成人av福利| 日本成人超碰在线观看| 亚洲视频精选在线| 国产亚洲污的网站| 欧美mv和日韩mv国产网站| 色哟哟日韩精品| 国产成人免费在线观看不卡| 免费人成在线不卡| 一区二区三区中文在线| 中文字幕一区免费在线观看 | 亚洲一区二区黄色| 综合久久综合久久| 国产日韩av一区二区| 日韩欧美三级在线| 欧美一区中文字幕| 欧美一三区三区四区免费在线看| 日本韩国一区二区三区| 99久久精品国产毛片| 国产精品99久久久久久似苏梦涵 | 国产日韩欧美综合在线| 日韩欧美一二区| 91精品一区二区三区在线观看| 色先锋aa成人| 欧洲精品视频在线观看| 在线观看91精品国产麻豆| 7777精品伊人久久久大香线蕉完整版 | 免费人成在线不卡| 麻豆精品视频在线观看| 欧美一区二区视频观看视频| 欧美精品电影在线播放| 欧美大片在线观看一区二区| 国产无一区二区| 日韩毛片视频在线看| 亚洲va欧美va天堂v国产综合| 亚洲一级片在线观看| 午夜天堂影视香蕉久久| 狠狠网亚洲精品| 精品美女在线播放| 国产偷国产偷精品高清尤物| 国产精品传媒视频| 亚洲五码中文字幕| 蜜桃视频在线观看一区| 成人涩涩免费视频| 欧美日韩一二区| 久久人人爽爽爽人久久久| 99久久国产综合精品女不卡| 日本韩国欧美国产| 精品成人免费观看| 亚洲一二三四在线观看| 国产成人夜色高潮福利影视| 欧美三级日韩在线| 国产精品污www在线观看| 午夜精品久久久久久久99樱桃 | 久久久精品日韩欧美| 亚洲一区免费在线观看| 国产成人综合在线| 日韩一区二区在线看| 亚洲手机成人高清视频| 久久激情五月婷婷| 欧美日本在线播放| **欧美大码日韩| 国产成人免费视频网站| 91精品国产高清一区二区三区 | 亚洲九九爱视频| 国内一区二区在线| 欧美一三区三区四区免费在线看| 亚洲欧洲日韩女同| 国产精品18久久久久| 欧美一区二区三区视频在线观看 | 欧美日韩日日摸| 亚洲国产欧美在线| 色94色欧美sute亚洲线路一ni | 欧美aⅴ一区二区三区视频| 欧美综合久久久| 亚洲丝袜另类动漫二区| 国产高清久久久久| 欧美电影免费观看高清完整版在线观看 | 在线综合视频播放| 亚洲国产中文字幕在线视频综合| 97se亚洲国产综合在线| 亚洲国产电影在线观看| 国产欧美日韩不卡| 成人久久18免费网站麻豆| 久久久久久日产精品| 高清久久久久久| 亚洲美女在线国产| 欧美色综合天天久久综合精品| 亚洲国产欧美在线| 欧美一级高清片| 国产精品99久久久久| 成人免费一区二区三区在线观看| 成人99免费视频| 亚洲成在人线免费| 久久影院视频免费| 色狠狠av一区二区三区| 日韩中文字幕麻豆| 久久久蜜臀国产一区二区| 国产99久久久国产精品免费看| 国产精品视频免费看| 欧美色图一区二区三区| 久久精品国产精品青草| 久久久久久一级片| 色欧美乱欧美15图片| 久久99深爱久久99精品| 亚洲欧美在线视频| 欧美少妇xxx| 国产精品一区在线观看乱码| ...av二区三区久久精品| 88在线观看91蜜桃国自产| 成人午夜电影小说| 美女视频黄 久久| 国产精品成人网| 日韩欧美激情一区| 欧美三级电影网| 色综合天天综合网国产成人综合天 | 久久久久久久久久久久久久久99 | 欧美激情在线观看视频免费| 欧美日韩一区成人| 成人精品鲁一区一区二区| 日韩av一区二区三区四区| 国产精品久久久久久福利一牛影视| 在线播放中文一区| 99久久99久久久精品齐齐| 国产一区二区福利视频| 日日夜夜免费精品视频| 亚洲一区二区影院| 国产精品久久久久精k8| 日韩精品一区二区三区在线| 欧美日韩视频一区二区| 91欧美激情一区二区三区成人| 国产精品一二三区| 国产乱人伦偷精品视频不卡 | 蜜桃精品视频在线| 蜜臀av性久久久久蜜臀aⅴ流畅| 亚洲福利视频一区二区| 一区二区三区不卡在线观看| 日韩一区有码在线| 亚洲欧洲一区二区在线播放| 中文字幕av一区二区三区| 国产亚洲一区二区三区在线观看| 日韩精品一区二区在线| 精品福利一区二区三区免费视频| 欧美一二三区在线观看| 日韩一区二区在线观看视频播放| 欧美区在线观看| 欧美xxx久久| 国产日韩精品一区二区三区在线| 久久久久久9999| 中文字幕一区二区三区不卡在线 | 久久国内精品视频| 国产福利视频一区二区三区| 国产传媒日韩欧美成人| 99久久国产综合精品色伊| 欧美亚洲精品一区| 91麻豆精品国产91久久久久久久久| 91精品一区二区三区在线观看| 日韩色视频在线观看| 久久久久久久一区| 亚洲激情第一区| 国模无码大尺度一区二区三区| 99视频精品在线| 欧美成人三级电影在线|