人工智能領(lǐng)域迎來(lái)一項(xiàng)重要進(jìn)展,OpenAI近日開(kāi)源了一款名為Circuit-Sparsity的新型模型。該模型采用獨(dú)特的稀疏架構(gòu)設(shè)計(jì),參數(shù)量?jī)H為0.4B,其中99.9%的權(quán)重被強(qiáng)制置零,僅保留0.1%的關(guān)鍵連接。這項(xiàng)技術(shù)突破為解決大語(yǔ)言模型"黑箱"問(wèn)題提供了全新思路,在醫(yī)療、金融等需要高透明度的領(lǐng)域具有潛在應(yīng)用價(jià)值。
傳統(tǒng)Transformer模型存在顯著的不可解釋性缺陷。在密集型網(wǎng)絡(luò)中,單個(gè)神經(jīng)元往往需要同時(shí)處理多個(gè)語(yǔ)義概念,這種"概念糾纏"現(xiàn)象導(dǎo)致模型決策過(guò)程難以追溯。OpenAI研究團(tuán)隊(duì)通過(guò)反向思維,構(gòu)建了權(quán)重高度稀疏的神經(jīng)網(wǎng)絡(luò)架構(gòu)。實(shí)驗(yàn)數(shù)據(jù)顯示,新模型在處理字符串閉合等任務(wù)時(shí),僅需12個(gè)神經(jīng)元即可形成完整計(jì)算路徑,相比傳統(tǒng)模型縮減了16倍規(guī)模。神經(jīng)元激活模式呈現(xiàn)出明確的語(yǔ)義特征,部分神經(jīng)元專(zhuān)門(mén)檢測(cè)引號(hào)符號(hào),另一些則像計(jì)數(shù)器般追蹤嵌套層級(jí)。
該技術(shù)通過(guò)三項(xiàng)核心創(chuàng)新實(shí)現(xiàn)突破:動(dòng)態(tài)剪枝機(jī)制在訓(xùn)練過(guò)程中持續(xù)優(yōu)化連接結(jié)構(gòu),每輪迭代僅保留絕對(duì)值最大的權(quán)重;激活稀疏化策略在注意力機(jī)制等關(guān)鍵模塊強(qiáng)制保留前25%的激活值;架構(gòu)層面用RMSNorm替代傳統(tǒng)歸一化方法,并引入Bigram表處理簡(jiǎn)單模式匹配。這些改進(jìn)共同確保了模型在極端稀疏條件下仍能維持基礎(chǔ)性能。
<國(guó)際學(xué)術(shù)社區(qū)對(duì)這項(xiàng)研究反應(yīng)熱烈。部分學(xué)者認(rèn)為該技術(shù)將顛覆現(xiàn)有混合專(zhuān)家模型(MoE)的設(shè)計(jì)范式,通過(guò)直接構(gòu)建稀疏結(jié)構(gòu)避免了權(quán)重分配的近似計(jì)算。但也有觀點(diǎn)指出,稀疏模型的訓(xùn)練成本較密集模型高出2-3個(gè)數(shù)量級(jí),當(dāng)前運(yùn)算速度存在100-1000倍的差距。這種效率瓶頸使其難以直接應(yīng)用于千億參數(shù)級(jí)大模型。
針對(duì)計(jì)算效率難題,研究團(tuán)隊(duì)提出了"橋梁網(wǎng)絡(luò)"解決方案。該方案在稀疏模型與預(yù)訓(xùn)練密集模型之間建立編碼-解碼映射,通過(guò)跨模型干預(yù)機(jī)制實(shí)現(xiàn)特征擾動(dòng)傳遞。這種設(shè)計(jì)允許研究人員在透明模型上修改特定特征,再將變化映射回復(fù)雜模型,為現(xiàn)有大模型提供可解釋性編輯能力。實(shí)驗(yàn)表明,稀疏度與模型性能存在制衡關(guān)系,在固定規(guī)模下提升稀疏性雖會(huì)降低準(zhǔn)確率,但能顯著增強(qiáng)決策可追溯性。
開(kāi)源代碼已在GitHub和Hugging Face平臺(tái)同步發(fā)布,包含完整的訓(xùn)練框架與基準(zhǔn)測(cè)試工具包。研究團(tuán)隊(duì)在技術(shù)文檔中強(qiáng)調(diào),當(dāng)前工作仍處于早期探索階段,后續(xù)將聚焦兩大方向:開(kāi)發(fā)從密集模型提取稀疏電路的技術(shù)路徑,以及優(yōu)化稀疏訓(xùn)練算法效率。這項(xiàng)研究為理解神經(jīng)網(wǎng)絡(luò)內(nèi)部運(yùn)作機(jī)制開(kāi)辟了新維度,其提出的稀疏化設(shè)計(jì)范式或?qū)⒅匦露x人工智能的可解釋性標(biāo)準(zhǔn)。











