国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

ITBear旗下自媒體矩陣:

OpenAI突然開源新模型!99.9%的權(quán)重是0

   時(shí)間:2025-12-14 18:46:09 來源:量子位編輯:快訊 IP:北京 發(fā)表評論無障礙通道
 

聞樂 發(fā)自 凹非寺

量子位 | 公眾號 QbitAI

破解AI胡說八道的關(guān)鍵,居然是給大模型砍斷99.9%的連接線?

OpenAI悄悄開源新模型,僅有0.4B參數(shù),且99.9%的權(quán)重為零。

也就是Circuit Sparsity技術(shù)的開源實(shí)現(xiàn)。

這是一種通過人為約束模型內(nèi)部連接的稀疏性,讓模型計(jì)算過程可拆解、可理解的大語言模型變體,本質(zhì)上是為了解決傳統(tǒng)稠密Transformer的黑箱問題,讓內(nèi)部的計(jì)算電路能被人類清晰解讀,知道AI是如何做決策的,避免輕易相信AI的胡話(doge)。

更有人直言這種「極致稀疏+功能解耦」的思路可能會(huì)讓當(dāng)下熱門的MoE(混合專家模型)走上末路。

那么,當(dāng)Transformer的權(quán)重被訓(xùn)練到近乎全0,會(huì)發(fā)生什么呢?

放棄粗糙近似,追求原生稀疏

先說說為啥這個(gè)模型的思考過程能像電路圖一樣好懂。

咱們平時(shí)用的傳統(tǒng)大模型,內(nèi)部神經(jīng)元連接得密密麻麻,權(quán)重矩陣幾乎全為非零值,信息傳遞呈現(xiàn)出高度疊加狀態(tài),就像一團(tuán)扯不開的亂線,沒人能說清它是怎么得出某個(gè)結(jié)論的。

而Circuit Sparsity模型反其道而行之,基于GPT-2風(fēng)格的Transformer架構(gòu)訓(xùn)練時(shí),通過嚴(yán)格約束讓權(quán)重的L0范數(shù)極小,直接把99.9%的無效連接砍斷,只留下千分之一的有效通路。

這些留存的非零權(quán)重連接就像電路圖里的導(dǎo)線,信息只能沿著固定路徑傳遞;同時(shí),模型還會(huì)通過均值屏蔽剪枝方法,為每個(gè)任務(wù)拆出專屬的最小電路。

比如處理Python引號閉合任務(wù)時(shí),僅需2個(gè)MLP神經(jīng)元和1個(gè)注意力頭就能構(gòu)成核心電路,包含專門的引號檢測器、類型分類器等功能模塊,就像電路圖里的電阻、電容,各自管各自的事。

實(shí)驗(yàn)數(shù)據(jù)顯示,在預(yù)訓(xùn)練損失相同的前提下,稀疏模型的任務(wù)專屬電路規(guī)模比稠密模型小16倍,且具備嚴(yán)格的必要性與充分性——保留這些模塊就能完成任務(wù),刪掉任一節(jié)點(diǎn)則直接失效。

這樣,每一步的邏輯都能精準(zhǔn)追蹤。

那這時(shí)候就不得不提當(dāng)下主流的MoE模型了。

MoE的核心思路是通過門控網(wǎng)絡(luò)將模型拆分為多個(gè)專家子網(wǎng)絡(luò),每個(gè)專家負(fù)責(zé)處理一部分任務(wù),靠路由器分配任務(wù)來提升效率,本質(zhì)上是用拆分專家這種粗糙的方式近似稀疏性,目的只是為了適配硬件的稠密矩陣計(jì)算需求。

但這種架構(gòu)存在致命缺陷:

一是會(huì)割裂模型的特征流形,導(dǎo)致專家同質(zhì)化嚴(yán)重、知識(shí)冗余等問題,不同專家間的信息協(xié)同依賴復(fù)雜的負(fù)載均衡損失函數(shù)調(diào)控,穩(wěn)定性堪憂;

二是專家功能邊界模糊,無法像Circuit Sparsity模型那樣實(shí)現(xiàn)微觀機(jī)制的精準(zhǔn)拆解。

反觀Circuit Sparsity,追求的是模型原生的稀疏性,通過把特征投射到超大維度,再嚴(yán)格限制有效激活的節(jié)點(diǎn)數(shù)量,從設(shè)計(jì)上就讓每個(gè)特征變得單義、正交,從根源上解決了傳統(tǒng)模型一個(gè)概念分散在多個(gè)節(jié)點(diǎn)的疊加問題,不用靠路由器這種hack手段也能避免信息干擾。

不過Circuit Sparsity目前也有明顯的短板,最突出的就是算力成本極高。

訓(xùn)練和推理的計(jì)算量是傳統(tǒng)稠密模型的100-1000倍,暫時(shí)還達(dá)不到頂尖大模型的能力;

而MoE模型在算力效率和性能平衡上已經(jīng)很成熟,短期內(nèi)依然會(huì)是工業(yè)界的主流選擇。

并且,這項(xiàng)工作也只是AI可解釋性探索的早期一步,未來團(tuán)隊(duì)計(jì)劃將技術(shù)擴(kuò)展到更大的模型,解鎖更復(fù)雜的推理電路。

目前,團(tuán)隊(duì)發(fā)現(xiàn)有兩種克服稀疏模型訓(xùn)練效率低下的方法:

一個(gè)是直接從現(xiàn)有的密集模型中提取稀疏電路,這樣直接復(fù)用基礎(chǔ)框架,不額外訓(xùn)練稀疏模型,能大幅降低成本;

另一種途徑則是不放棄從頭訓(xùn)練可解釋稀疏模型的這種思路,但針對訓(xùn)練慢、成本高的短板,從技術(shù)層面優(yōu)化訓(xùn)練機(jī)制,造出原生可解釋、且能高效落地的模型。

那么就期待研究人員后續(xù)用更成熟的工具或技術(shù),逐步揭開大模型的黑箱面紗了。

 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭議稿件處理  |  English Version
 
国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级
欧美色图天堂网| 成人理论电影网| 综合久久久久久| 国产精品国产三级国产aⅴ原创| 久久新电视剧免费观看| 久久久精品国产99久久精品芒果| 欧美视频一二三区| 欧美一区二区三区男人的天堂| 欧美日韩另类国产亚洲欧美一级| 欧美怡红院视频| 欧美一级夜夜爽| 久久精品男人天堂av| 国产精品国产三级国产普通话蜜臀 | 99久久国产综合精品色伊| 91视频一区二区三区| 欧美日韩一区精品| 欧美成人性福生活免费看| 久久久精品中文字幕麻豆发布| 国产欧美日韩三区| 亚洲一区二区三区激情| 日本一不卡视频| 国产白丝精品91爽爽久久| 色综合天天综合网天天狠天天 | 国产午夜精品久久| 蜜臀av性久久久久蜜臀aⅴ流畅 | 欧美激情在线观看视频免费| 国产欧美日韩精品一区| 亚洲欧美一区二区久久| 国产欧美一区二区精品性色| 日韩女优视频免费观看| 国产91精品一区二区麻豆亚洲| 色综合天天狠狠| 日韩欧美卡一卡二| 国产一区二区三区美女| 国产日韩精品视频一区| 欧美激情中文不卡| 欧美精品777| **网站欧美大片在线观看| 国产一区二区影院| 捆绑调教一区二区三区| 成人开心网精品视频| 91久久一区二区| 欧美一区二区三区免费在线看| 精品一区二区三区影院在线午夜 | 国产又黄又大久久| 日韩一级黄色片| 欧美一区二区在线不卡| 成人午夜在线免费| 欧美日韩一级黄| 777亚洲妇女| 美女一区二区三区在线观看| 一区二区三区在线视频观看58| 亚洲色图在线播放| 日韩综合小视频| 欧美日韩在线不卡| 中文欧美字幕免费| 一区二区不卡在线播放| 久久久五月婷婷| 亚洲欧美偷拍三级| 国产精品无人区| 中文字幕免费在线观看视频一区| 中文字幕av免费专区久久| 国产精品美女久久久久高潮| 成人免费毛片片v| 国产亚洲精久久久久久| 国产酒店精品激情| 91麻豆精品国产91久久久| 久久亚洲综合av| 日韩精品一区二区三区视频播放 | 亚洲自拍偷拍欧美| 26uuu成人网一区二区三区| 亚洲精品视频在线看| 色久优优欧美色久优优| 亚洲天堂精品在线观看| 在线亚洲精品福利网址导航| 丝袜美腿亚洲色图| 日韩一级黄色片| 福利一区二区在线观看| 亚洲精品水蜜桃| 精品少妇一区二区三区在线视频| 国产精品系列在线播放| 一区二区三区日韩欧美| 欧美一区二区二区| 成人精品鲁一区一区二区| 亚洲免费高清视频在线| 欧美一级国产精品| 成人av电影观看| 美女诱惑一区二区| 亚洲女女做受ⅹxx高潮| 欧美xxxx老人做受| 欧美亚日韩国产aⅴ精品中极品| 久久99国产精品久久| 亚洲天堂网中文字| 欧美日韩成人在线一区| 成人性生交大片免费看中文网站| 一区二区三区免费| 国产精品三级在线观看| 日韩欧美一级二级三级久久久| 国产+成+人+亚洲欧洲自线| 日韩中文字幕区一区有砖一区| 欧美国产日韩精品免费观看| 日韩欧美中文字幕公布| 91福利在线播放| 97久久超碰国产精品| 国产伦精品一区二区三区免费迷| 亚洲免费在线播放| 18成人在线视频| 国产精品国产三级国产专播品爱网| 欧美一区二区成人| 欧美高清精品3d| 91黄色激情网站| 91麻豆6部合集magnet| 国产成人精品亚洲日本在线桃色| 伦理电影国产精品| 男女男精品视频| 午夜精品福利一区二区三区av| 亚洲激情一二三区| 一区二区久久久久| 亚洲一区二区三区四区五区中文| 亚洲图片激情小说| 亚洲成a人v欧美综合天堂| 亚洲一区二区三区四区的 | 麻豆精品一区二区综合av| 日韩av中文字幕一区二区三区 | 欧美色男人天堂| 在线看日本不卡| 国产69精品久久久久毛片| 久久99精品久久久久久| 亚洲成人你懂的| 国产suv精品一区二区883| 亚洲美女屁股眼交| 韩日av一区二区| 一本色道**综合亚洲精品蜜桃冫| 成人免费高清在线| 色婷婷综合久久久中文一区二区| 91蝌蚪porny| gogogo免费视频观看亚洲一| 成人av午夜电影| 美女网站一区二区| 国产色爱av资源综合区| 国产福利视频一区二区三区| 亚洲激情第一区| 91精品国产综合久久久蜜臀粉嫩| 欧美一级在线视频| 丰满白嫩尤物一区二区| 久久精品国产一区二区三区免费看| 国产精品久久久久影院老司 | 日韩一级完整毛片| 日韩视频一区二区三区在线播放| 欧美精品一区二区三区蜜桃| 亚洲欧洲精品一区二区三区| 日日欢夜夜爽一区| 国产69精品久久久久777| 91精品国产入口在线| 国产精品丝袜久久久久久app| 亚洲欧美区自拍先锋| 久久99精品久久久久| 欧洲中文字幕精品| 国产日韩欧美高清在线| 日韩精品免费专区| 日本精品视频一区二区| 国产免费成人在线视频| 蜜桃久久精品一区二区| 色婷婷av一区二区| 国产欧美一区二区精品婷婷| 蜜桃视频免费观看一区| 欧美日韩一区二区在线观看| 中文字幕一区二区三区在线观看 | 蜜桃视频在线观看一区二区| 91浏览器在线视频| 中文一区一区三区高中清不卡| 蜜臀久久99精品久久久久久9| 一本久道中文字幕精品亚洲嫩| 国产无人区一区二区三区| 久久精品99国产精品日本| 欧美日韩黄视频| 午夜视黄欧洲亚洲| 欧美色综合影院| 亚洲成人在线网站| 欧美色爱综合网| 亚洲一区二区欧美日韩| 在线观看av不卡| 亚洲综合免费观看高清完整版| 91亚洲永久精品| 亚洲香蕉伊在人在线观| 欧美日韩情趣电影| 日韩极品在线观看| 日韩一区二区在线观看视频| 免费精品视频在线| 精品不卡在线视频| 岛国精品在线观看| 自拍视频在线观看一区二区| 色婷婷av一区二区三区gif| 亚洲bt欧美bt精品777| 欧美日韩美少妇| 韩国av一区二区三区| 国产精品女人毛片| 欧美精品第1页| 成人综合激情网| 香蕉av福利精品导航|