国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

ITBear旗下自媒體矩陣:

GAIR 2025:胡俠團(tuán)隊(duì)“有損計(jì)算”突破,為大模型推理效率提升帶來(lái)新可能

   時(shí)間:2025-12-12 17:09:52 來(lái)源:互聯(lián)網(wǎng)編輯:快訊 IP:北京 發(fā)表評(píng)論無(wú)障礙通道
 

在大語(yǔ)言模型領(lǐng)域,提升上下文處理能力一直是科研人員關(guān)注的焦點(diǎn)。當(dāng)前,不同廠商發(fā)布的大語(yǔ)言模型在超長(zhǎng)上下文處理方面取得了顯著進(jìn)展,部分模型已能支持?jǐn)?shù)百萬(wàn)Token的輸入,例如MiniMax-M1、Qwen2.5-1M系列模型,均具備百萬(wàn)Token級(jí)別的處理能力。然而,這場(chǎng)關(guān)于上下文長(zhǎng)度的競(jìng)爭(zhēng)仍在持續(xù),因?yàn)楦L(zhǎng)的上下文處理能力能夠?yàn)槟P驮诮鹑凇⒎伞⑨t(yī)療等領(lǐng)域的長(zhǎng)語(yǔ)境任務(wù)中提供更廣闊的應(yīng)用空間,創(chuàng)造更大的商業(yè)與技術(shù)價(jià)值。

針對(duì)這一目標(biāo),一支科研團(tuán)隊(duì)提出了“通過(guò)有損計(jì)算提高大語(yǔ)言模型推理效率”的研究方案。該方案的核心思路是利用大語(yǔ)言模型對(duì)低精度計(jì)算等“有損操作”產(chǎn)生的噪聲具有較強(qiáng)魯棒性的特點(diǎn),主動(dòng)引入可控的信息損失,以換取推理效率的提升。這種“有損計(jì)算”主要通過(guò)降低計(jì)算或存儲(chǔ)精度來(lái)實(shí)現(xiàn),重點(diǎn)圍繞模型參數(shù)量化、KV Cache壓縮、模型剪枝與知識(shí)蒸餾等路徑展開(kāi)。

在處理醫(yī)療領(lǐng)域長(zhǎng)篇文獻(xiàn)信息提取等任務(wù)時(shí),大語(yǔ)言模型面臨“預(yù)訓(xùn)練長(zhǎng)度限制”和“推理內(nèi)存需求激增”的雙重挑戰(zhàn)。為應(yīng)對(duì)這些挑戰(zhàn),該團(tuán)隊(duì)的研究實(shí)現(xiàn)了兩項(xiàng)關(guān)鍵技術(shù)突破。在算法層面,通過(guò)粗化遠(yuǎn)距離標(biāo)記的位置信息,將模型的語(yǔ)境長(zhǎng)度擴(kuò)展至原有水平的8倍;在系統(tǒng)層面,將過(guò)往標(biāo)記的中間狀態(tài)(KV Cache)量化為2比特?cái)?shù)字,實(shí)現(xiàn)了8倍內(nèi)存效率提升和3.5倍時(shí)鐘時(shí)間加速,且不影響模型性能。

在具體實(shí)施中,粗化位置信息的策略并非靜態(tài),而是根據(jù)上下文需求動(dòng)態(tài)調(diào)整。而將KV Cache壓縮至2比特是一項(xiàng)激進(jìn)的優(yōu)化,團(tuán)隊(duì)通過(guò)大量實(shí)驗(yàn)驗(yàn)證了其在低精度表示下仍能保持模型準(zhǔn)確率。KV Cache是大模型訓(xùn)練和推理中的重要中間存儲(chǔ)狀態(tài),直接關(guān)聯(lián)GPU內(nèi)存。例如,A100 80GB GPU中,超過(guò)90%的內(nèi)存用于存儲(chǔ)KV Cache。將其從16比特壓縮至2比特,相當(dāng)于將存儲(chǔ)量提升近10倍,顯著降低了硬件成本。

目前,該方案主要在llama模型上進(jìn)行了實(shí)驗(yàn)驗(yàn)證,相關(guān)研究成果已發(fā)表于2024年。團(tuán)隊(duì)開(kāi)發(fā)的AutoKeras等開(kāi)源項(xiàng)目已被廣泛采用,此次的有損計(jì)算技術(shù)也已被hugging face的transformer和llama.cpp等主流開(kāi)源軟件包采納。與混合專家模型(MoE)等技術(shù)相比,該方案在哲學(xué)上追求效率與準(zhǔn)確率的平衡,但在技術(shù)路徑上完全不同。MoE通過(guò)稀疏性解決問(wèn)題,而粗化位置信息方法則要求模型讀完所有內(nèi)容,但無(wú)需記憶精確位置。

在應(yīng)用場(chǎng)景方面,該方案目前主要針對(duì)語(yǔ)言大模型,在多模態(tài)大模型或其他智能體上的效果尚未充分驗(yàn)證。實(shí)驗(yàn)表明,在問(wèn)答類(lèi)任務(wù)中,壓縮至2比特時(shí)模型準(zhǔn)確率不會(huì)下降,但在生成程序等對(duì)精度要求極高的任務(wù)中可能影響準(zhǔn)確性。團(tuán)隊(duì)在醫(yī)療健康領(lǐng)域開(kāi)發(fā)了一個(gè)基于罕見(jiàn)病的問(wèn)診系統(tǒng),用戶可通過(guò)輸入癥狀查詢可能的罕見(jiàn)病,效果顯著。由于大模型能夠整合大量統(tǒng)計(jì)信息,該方案在法律和醫(yī)療等場(chǎng)景中仍具有應(yīng)用潛力。

關(guān)于硬件協(xié)同設(shè)計(jì),該方案目前專注于GPU層面的優(yōu)化,尚未涉及特定硬件的變革。然而,團(tuán)隊(duì)認(rèn)為,未來(lái)可能需要新的模型架構(gòu)在預(yù)訓(xùn)練階段直接融入稀疏性設(shè)計(jì),而非僅在推理階段進(jìn)行補(bǔ)救。該方案具有“即插即用”的特點(diǎn),實(shí)現(xiàn)原理簡(jiǎn)單易懂,因此用戶數(shù)量眾多。目前,團(tuán)隊(duì)正探索2比特壓縮在實(shí)際中的應(yīng)用邊界,以及理論研究與系統(tǒng)落地的結(jié)合方向。

 
 
更多>同類(lèi)資訊
全站最新
熱門(mén)內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭(zhēng)議稿件處理  |  English Version
 
国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级
51久久夜色精品国产麻豆| 欧美日韩不卡一区| 在线视频综合导航| 一区二区在线观看av| 色哟哟日韩精品| 久久黄色级2电影| 欧美一级二级三级蜜桃| 激情综合五月天| 亚洲男同1069视频| 在线播放国产精品二区一二区四区| 久久精品在线免费观看| 午夜激情一区二区| 国产一区二区三区国产| 亚洲欧洲av另类| 欧美一区二区精品久久911| 国内成人自拍视频| 久久精品国产**网站演员| 欧美高清视频一二三区 | 日韩一区二区三免费高清| 久久99国产精品久久99| 亚洲一区二区三区美女| 亚洲激情综合网| 91免费观看在线| 欧美一区二区精美| 日韩亚洲电影在线| 国产精品久久毛片a| 免费成人在线观看| gogogo免费视频观看亚洲一| 成人视屏免费看| 99天天综合性| 日韩欧美国产综合一区| 国产女人aaa级久久久级| 久久精品在这里| 一区二区三区加勒比av| 国产乱码精品一区二区三区忘忧草 | 亚洲在线成人精品| 亚洲精品日韩专区silk| 精一区二区三区| 久久精品国产秦先生| 综合欧美亚洲日本| 亚洲视频一二三| 一区二区三区 在线观看视频| 国产精品污www在线观看| 欧美极品aⅴ影院| 亚洲欧洲日产国码二区| 亚洲欧美另类久久久精品| 亚洲精品久久久久久国产精华液| 亚洲啪啪综合av一区二区三区| 中文字幕一区二区三区四区不卡| 亚洲另类在线一区| 日韩av电影免费观看高清完整版 | 国产日产亚洲精品系列| 夜夜亚洲天天久久| 成人综合在线观看| 欧美精品三级在线观看| 欧美精品一区二区久久婷婷 | 国产乱人伦精品一区二区在线观看 | 日韩精品色哟哟| fc2成人免费人成在线观看播放| 欧美天堂亚洲电影院在线播放| 国产色爱av资源综合区| 久久国产精品99久久久久久老狼| 91久久线看在观草草青青| 久久午夜羞羞影院免费观看| 亚洲mv在线观看| 欧美视频在线观看一区二区| 国产精品久久久久久亚洲毛片| 国产一区二区三区最好精华液| 精品日韩欧美在线| 国产一区二区电影| 中文字幕亚洲一区二区av在线| 国产精品一区二区久久不卡| 久久日韩精品一区二区五区| 国产精品一级在线| 国产精品黄色在线观看| 93久久精品日日躁夜夜躁欧美| 亚洲天堂免费看| 成人国产免费视频| 福利91精品一区二区三区| 久久综合久久综合九色| 亚洲欧美经典视频| 国产一区二区三区免费| 9人人澡人人爽人人精品| 精品久久久久久久久久久院品网| 国产精品丝袜久久久久久app| 91浏览器打开| 亚洲欧美日韩在线| 91美女精品福利| 日韩视频一区在线观看| 亚洲mv在线观看| xnxx国产精品| 国产在线一区观看| 亚洲人吸女人奶水| 成人激情午夜影院| 在线观看国产日韩| 91丨porny丨户外露出| 欧美丝袜自拍制服另类| 久久久久国产一区二区三区四区 | 91美女蜜桃在线| 欧美一区二视频| 99久久婷婷国产综合精品| 亚洲欧洲精品一区二区三区不卡| 99视频有精品| 亚洲高清免费在线| 欧美日韩黄色一区二区| eeuss影院一区二区三区| 欧美三区在线观看| 欧美日韩国产片| 91日韩一区二区三区| 国产美女精品人人做人人爽 | 香蕉av福利精品导航| 久久噜噜亚洲综合| 亚洲人成精品久久久久| 亚洲国产视频一区| 国产高清不卡一区二区| 日韩在线卡一卡二| 久久精品国产亚洲5555| 91麻豆高清视频| 国产日韩欧美一区二区三区综合| 精品精品国产高清a毛片牛牛| 久久久久久亚洲综合影院红桃| 欧美区在线观看| 蜜臀91精品一区二区三区| 91精品国产一区二区三区香蕉| 国产一区二区三区观看| 国产亚洲精品超碰| 亚洲欧美日韩久久| 亚洲一区二区三区在线看| 丝袜美腿亚洲综合| 精品国产第一区二区三区观看体验| 成人av资源在线| 欧美日韩精品高清| 欧美r级电影在线观看| 中文字幕久久午夜不卡| 亚洲国产日日夜夜| 91传媒视频在线播放| 777欧美精品| 久久久久88色偷偷免费| 美国av一区二区| 久久久综合视频| 欧美一级电影网站| 中文字幕乱码日本亚洲一区二区 | 国产一区在线观看视频| 亚洲高清三级视频| 日韩一区二区免费视频| 亚洲精品高清在线观看| 欧美午夜影院一区| 久久久久久久久久久电影| 狠狠色丁香婷婷综合久久片| 亚洲成av人片在线观看无码| 欧美日韩黄色一区二区| 91精品国产欧美一区二区18| 欧美国产精品一区二区三区| 2021中文字幕一区亚洲| 久久男人中文字幕资源站| 国产精品一品视频| 精品一区二区三区视频在线观看| 久久精品视频在线看| 91精品国产综合久久久久久久久久| 国产午夜精品一区二区三区嫩草 | 中文字幕第一区| 国产亚洲一区二区在线观看| 日韩中文字幕区一区有砖一区 | jvid福利写真一区二区三区| 欧美视频一区二| 精品成人免费观看| 无吗不卡中文字幕| 99精品视频一区二区三区| 日韩免费福利电影在线观看| 亚洲综合在线观看视频| 高清国产一区二区| 久久综合久久综合久久综合| 日韩影院精彩在线| 欧美久久久久免费| 亚洲r级在线视频| 在线观看不卡视频| 亚洲精品日韩综合观看成人91| 国产精品一区二区三区网站| 精品国产污网站| 寂寞少妇一区二区三区| 日韩精品一区二区三区在线| 麻豆精品久久久| 欧美一区欧美二区| 亚洲成人自拍网| 欧美福利一区二区| 美女网站色91| 精品国产成人系列| 高清不卡一二三区| 欧美国产综合色视频| 91在线视频网址| 亚洲国产精品影院| 日韩一区二区免费视频| 国内精品自线一区二区三区视频| 欧美α欧美αv大片| 国产精品一区二区久激情瑜伽| 欧美经典三级视频一区二区三区| 成人自拍视频在线观看| 一区二区三区欧美| 精品少妇一区二区三区日产乱码| 国产一区 二区 三区一级|