国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

ITBear旗下自媒體矩陣:

OpenAI又開源了!僅0.4B,給模型大瘦身

   時間:2025-12-16 00:12:11 來源:智東西編輯:快訊 IP:北京 發表評論無障礙通道
 
智東西12月15日報道,昨天,OpenAI開源新模型Circuit-Sparsity,模型參數量僅0.4B,99.9%的權重為零。

這個技術試圖解決模型的可解釋性問題,簡單來說就是回答“模型為什么做出這個決策?”以及“它是如何得出這個結果的?”這兩個問題。在AI飛速發展的今天,大語言模型(LLM)雖然表現出了驚人的能力,但其內部運作機制始終像一個神秘的“黑箱”。我們不知道它為何做出某個回答,也不清楚它是如何從海量數據中提取知識的。這種不可解釋性,成為了AI在醫療、金融、法律等高風險領域落地的重大障礙。對此,OpenAI研究團隊訓練出了一個權重稀疏的Transformer模型,強制模型權重矩陣中99.9%權重為零,僅保留0.1%非零權重。在這項研究中,研究團隊在模型內部形成了緊湊且可讀的“電路”(Circuits),每個電路都僅保留了保證模型性能的關鍵節點,神經元的激活變得具有明確的語義。有外網網友稱這一技術讓當下的MoE(混合專家模型)走到了盡頭,并說“我們一直以來都將權重隔離到‘專家’中,以此粗略地近似稀疏性,僅僅是為了滿足稠密矩陣核的要求?!?/p>

▲外網評價(圖源:X)

更有網友將這項研究形容為將模型“減肥到只剩骨架”,還說這項研究就好像打開了黑匣子,不試圖解開稠密模型而是直接構建稀疏模型,正是這項研究有趣的地方。

▲外網評價(圖源:X)

但有些網友卻不這么認為,稱其沒有看出MoE模型為何會因此走到盡頭,并進一步解釋說這一技術是針對XAI(可解釋AI)的,它的訓練成本要高100-1000倍,回到“研究時代”并不意味著讓事情變得更復雜。

▲外網評價(圖源:X)

該模型目前受限于計算效率瓶頸,其運算速度較密集模型慢100至1000倍,將該技術直接應用于千億參數級別的前沿大模型,現階段尚不具備可行性。

開源地址:Github:https://github.com/openai/circuit_sparsityHugging Face:https://huggingface.co/openai/circuit-sparsity01.訓練稀疏TransformerOpenAI理清模型內部計算

要理解這項研究的突破,首先需要明白傳統大模型為何難以解釋。在標準的密集模型(Dense Models)中,神經網絡存在一種被稱為“超級位置”(Superposition)的現象。簡單來說,為了存儲海量的信息,模型被迫讓單個神經元或權重矩陣同時編碼多個完全不同的概念。這種特征糾纏導致了嚴重的后果,例如模型的決策不可追溯和邏輯混亂,當模型輸出一個結果時,我們無法確定是哪個具體的“概念”在起作用。針對以上問題,以前的研究通常從試圖拆解密集、糾結的網絡開始。但OpenAI團隊采取了一種“反直覺”的策略,即訓練權重稀疏的Transformer模型,強制模型權重矩陣中99.9%權重為零,僅保留0.1%非零權重。強制模型限制了模型只能使用其神經元之間極少的可能連接,而這一簡單的更改,幾乎從根本上理清了模型的內部計算。

▲每個神經元只與下一個層的幾個神經元相連(圖源:OpenAI技術博客)

具體的技術手段包括:1、動態剪枝與稀疏約束:在訓練過程中,系統會動態執行“剪枝”操作,每一步優化后僅保留絕對值最大的權重(Top-K稀疏化)。2、激活稀疏化:在殘差流、注意力鍵/值矩陣等關鍵位置,研究團隊引入了AbsTopK激活函數,強制僅保留前25%的激活值。3、架構微調:為了配合稀疏化,研究團隊用RMSNorm替代了傳統的LayerNorm,避免歸一化操作破壞稀疏性,同時引入了“Bigram表”來處理簡單的模式匹配,從而釋放模型的主干容量去處理復雜的邏輯推理。02.模型內部形成緊湊可讀的“電路”規??s減16倍

這項技術的最大成果,是模型內部形成了緊湊且可讀的“電路”(Circuits)。在傳統密集模型中,完成一個任務可能需要成千上萬個節點協同工作,邏輯分散且難以捕捉。而在稀疏模型中,研究團隊觀察到了極簡的計算路徑:1、極簡的邏輯單元:例如在處理“字符串閉合”任務時,模型僅用12個節點就構建了一個完美的電路,清晰地展示了它是如何檢測單引號或雙引號是否閉合的。2、可讀的特征:神經元的激活變得具有明確的語義。研究人員發現了一些神經元專門負責檢測“單引號”,另一些則像“計數器”一樣精確地追蹤列表的嵌套深度。3、規模縮減16倍:對比實驗顯示,在相同的任務損失下,稀疏模型的電路規模比密集模型小了16倍。這意味著解讀AI思維的難度降低了整整一個數量級。

▲稀疏模型的電路規模比密集模型小了16倍(圖源:OpenAI技術論文)

為了驗證這些電路的真實性,團隊進行了“均值消融”實驗。結果證明,移除非電路節點對任務幾乎沒有影響,而一旦移除電路中的關鍵節點,模型性能就會瞬間崩塌。這證實了這些電路確實是模型執行任務的“必經之路”。

▲“均值消融”實驗(圖源:OpenAI技術論文)

03.稀疏模型解讀力強但速度慢千倍OpenAI提出“橋梁網絡”

為了測量稀疏模型計算的解耦程度。研究團隊設計了一套簡單的算法任務。對于每個模型,他們都將其剪裁成了仍能執行該任務的最小電路,并檢查了該電路的簡潔程度。研究團隊發現,用規模更大、稀疏度更高的模型進行訓練后,就能夠依托結構更簡潔的電路,構建出性能更強的模型。

▲模型的可解釋性與能力的對比圖(圖源:OpenAI技術博客)

從模型可解釋性與性能的對比圖可見,在稀疏模型規模固定的前提下,提升稀疏性,也就是將更多權重置零,雖會導致模型性能有所下降,但能顯著增強其可解釋性。盡管稀疏模型在可解釋性方面優勢突出,但其應用目前受限于計算效率瓶頸:稀疏矩陣運算無法借助Tensor Cores實現加速,運算速度較密集模型慢100至1000倍。這意味著,將該技術直接應用于千億參數級別的前沿大模型,現階段尚不具備可行性。為此,研究團隊提出了“橋梁網絡”(Bridges)方案:1、編碼-解碼映射:在稀疏模型與預訓練的密集模型之間插入一個編碼器-解碼器對。2、跨模型干預:編碼器將密集模型的激活映射到稀疏空間,解碼器則反向轉換。“橋梁網絡”(Bridges)方案可以在“透明”的稀疏模型上修改某個特征,然后通過橋梁將這種擾動映射回“黑箱”的密集模型,從而實現對現有大模型的可解釋性行為編輯。04.結語:OpenAI提出稀疏化新路徑讓大模型從“黑箱”走向“可解釋”

OpenAI研究團隊的這項研究,標志著AI可解釋性領域的一項重要突破,也印證了理解AI并非遙不可及的目標。研究團隊在論文博客中稱,這項工作是邁向更宏大目標的早期探索。接下來,他們計劃將相關技術擴展至更大規模的模型,同時進一步解釋更多模型的行為邏輯。為解決稀疏模型訓練效率低下的問題,團隊提出了兩個后續研究方向:一是從現有密集模型中提取稀疏電路,替代“從頭訓練稀疏模型”的傳統方式;二是研發更高效的可解釋性模型訓練技術,推動相關技術更易落地生產。“我們的目標是逐步擴大可可靠解釋的模型范圍,同時打造相關工具,讓未來的AI系統更易于分析、調試與評估。”研究團隊在論文博客中寫道。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级
亚洲国产一区在线观看| 麻豆精品久久久| 精品国产成人在线影院| 久久综合五月天婷婷伊人| 亚洲欧美精品午睡沙发| 欧美高清在线一区| 一卡二卡三卡日韩欧美| 亚洲.国产.中文慕字在线| 这里只有精品99re| 国产精品一区二区在线观看不卡| 亚洲精品中文在线观看| 美女在线视频一区| 中文字幕欧美区| 国产成人在线观看免费网站| 亚洲第一主播视频| 欧美电视剧免费全集观看| 欧美在线你懂的| 久久看人人爽人人| 亚洲自拍偷拍欧美| 91成人在线免费观看| 久久精品亚洲一区二区三区浴池| 亚洲一区二区三区国产| 免费观看91视频大全| 久久久不卡影院| 国产女主播在线一区二区| 欧美日韩国产一级片| 国产精品1区2区3区在线观看| 成人中文字幕在线| 欧美丝袜丝交足nylons| 欧美军同video69gay| 中文字幕不卡在线播放| 欧美一级生活片| 99久精品国产| 久久综合精品国产一区二区三区| 六月丁香综合在线视频| 国产偷国产偷亚洲高清人白洁| 波多野结衣的一区二区三区| 国产精品亚洲第一| 五月婷婷综合激情| 欧美性猛交xxxx黑人交| 国产精品女主播av| 99re热视频精品| av午夜一区麻豆| 欧美另类久久久品| 亚洲成人动漫一区| 91麻豆精品秘密| 91精彩视频在线观看| 成人av手机在线观看| 亚洲视频图片小说| 欧美亚洲综合色| 久久一夜天堂av一区二区三区| 欧美三级视频在线观看| 午夜伦欧美伦电影理论片| www亚洲一区| 欧美成人aa大片| 日韩一区二区三区免费看| 欧美高清视频一二三区| 国产精品麻豆久久久| 3atv在线一区二区三区| 午夜视频一区二区| 日韩欧美激情在线| 欧美一级夜夜爽| 久久9热精品视频| 99久久er热在这里只有精品15| www..com久久爱| 一区二区不卡在线视频 午夜欧美不卡在| 国产精品一线二线三线精华| 日韩美女视频一区二区在线观看| 在线观看av不卡| 日本一区二区三级电影在线观看| 精品理论电影在线观看 | 99久久精品情趣| 国产在线不卡一区| 日本一区二区三区久久久久久久久不 | 欧美精品色一区二区三区| 午夜视频一区二区三区| 日韩一区二区三区电影| 国产不卡免费视频| 风间由美一区二区av101 | 午夜私人影院久久久久| 日韩欧美在线不卡| 不卡欧美aaaaa| 日韩av在线播放中文字幕| 日韩av成人高清| 精品国产91乱码一区二区三区| 岛国av在线一区| 午夜在线成人av| 国产欧美日韩不卡| 欧美三级电影在线观看| 精品在线播放午夜| 日本韩国欧美在线| 韩国成人在线视频| 色网站国产精品| 久久久久久亚洲综合影院红桃| 9色porny自拍视频一区二区| 婷婷成人综合网| 久久男人中文字幕资源站| 欧美制服丝袜第一页| 国产真实乱对白精彩久久| 亚洲免费观看高清在线观看| 欧美大片国产精品| 在线观看免费一区| 国产福利一区在线| 精品一区免费av| 日韩专区一卡二卡| 91亚洲国产成人精品一区二区三| 裸体健美xxxx欧美裸体表演| 亚洲卡通欧美制服中文| 国产精品欧美一区二区三区| 26uuu亚洲综合色欧美| 日韩视频在线一区二区| 欧美疯狂做受xxxx富婆| 欧美色综合久久| 日本精品视频一区二区| 99久久久无码国产精品| 成人h版在线观看| 国产高清在线观看免费不卡| 精品一区二区三区欧美| 久久99久久久久久久久久久| 蜜桃av一区二区| 日本不卡一区二区三区 | 综合欧美亚洲日本| 国产精品精品国产色婷婷| 免费欧美日韩国产三级电影| 亚洲va国产va欧美va观看| 一区二区不卡在线视频 午夜欧美不卡在 | 91视视频在线观看入口直接观看www | 成人欧美一区二区三区黑人麻豆| 国产凹凸在线观看一区二区| 久久国产综合精品| 风间由美一区二区av101 | 91老师国产黑色丝袜在线| 在线看日韩精品电影| 欧美一区二区视频网站| 久久久亚洲精品石原莉奈| 国产精品久久久久久亚洲伦 | 另类中文字幕网| 国产电影一区二区三区| 一本大道久久a久久综合| 欧美色网站导航| 久久久不卡网国产精品一区| 欧美激情在线看| 一区二区在线观看视频在线观看| 日本视频一区二区| 成人深夜视频在线观看| 欧美视频在线一区二区三区| 久久久影院官网| 午夜激情一区二区三区| 成人免费看视频| 91精品国产黑色紧身裤美女| 亚洲国产成人自拍| 免费高清不卡av| 色综合视频在线观看| 精品国产乱码久久久久久影片| 亚洲嫩草精品久久| 国产一区二区成人久久免费影院| 99久久久免费精品国产一区二区| 欧美日韩电影在线播放| 国产午夜亚洲精品羞羞网站| 亚洲精品日产精品乱码不卡| 国产精品一二三四| 欧美成人精品1314www| 亚洲国产视频一区| 成人高清免费观看| 国产午夜一区二区三区| 理论片日本一区| 欧美日韩一级二级三级| 亚洲乱码精品一二三四区日韩在线| 国内精品国产三级国产a久久| 欧美男人的天堂一二区| 有码一区二区三区| 一本色道久久综合亚洲91| 欧美国产精品中文字幕| 国产一区二区三区免费| 欧美一区二区三区人| 婷婷成人激情在线网| 欧美欧美午夜aⅴ在线观看| 依依成人精品视频| 欧洲视频一区二区| 亚洲高清一区二区三区| 欧美日韩一区小说| 亚洲v日本v欧美v久久精品| 欧美三级电影在线观看| 午夜精品久久久久| 日韩免费高清av| 国产二区国产一区在线观看| 欧美激情一区不卡| 色综合久久综合| 首页国产丝袜综合| 精品久久久久久久久久久久包黑料| 免费xxxx性欧美18vr| 久久综合av免费| 99精品视频在线免费观看| 一区二区欧美精品| 日韩精品综合一本久道在线视频| 狠狠色狠狠色综合系列| 国产精品狼人久久影院观看方式| 色狠狠一区二区| 久久成人久久爱| 中文字幕一区二区在线播放|