上海交通大學(xué)集成電路學(xué)院的研究團(tuán)隊在算力芯片領(lǐng)域?qū)崿F(xiàn)關(guān)鍵突破,成功研制出全球首款支持大規(guī)模語義媒體生成的全光計算芯片。該成果以“大規(guī)模智能語義視覺生成全光芯片”為題,發(fā)表于國際權(quán)威學(xué)術(shù)期刊《科學(xué)》雜志,標(biāo)志著我國在光子計算與人工智能交叉領(lǐng)域取得引領(lǐng)性進(jìn)展。
隨著深度神經(jīng)網(wǎng)絡(luò)和生成式AI模型的快速發(fā)展,傳統(tǒng)電子芯片在應(yīng)對超大規(guī)模模型時面臨算力不足與能耗過高的雙重挑戰(zhàn)。研究團(tuán)隊指出,現(xiàn)有光計算方案多局限于簡單分類任務(wù),而光電混合架構(gòu)又會顯著降低光子計算的速度優(yōu)勢。如何讓光芯片直接運(yùn)行復(fù)雜生成模型,成為全球智能計算領(lǐng)域亟待攻克的核心難題。
針對這一挑戰(zhàn),研究團(tuán)隊提出全光大規(guī)模語義生成芯片架構(gòu)LightGen,在單芯片上同時突破三大技術(shù)瓶頸:首次實現(xiàn)百萬級光學(xué)神經(jīng)元集成,攻克全光維度轉(zhuǎn)換難題,并開發(fā)出無需真實數(shù)據(jù)標(biāo)注的光芯片訓(xùn)練算法。這些創(chuàng)新使光芯片能夠獨(dú)立完成從圖像輸入、語義理解到內(nèi)容生成的完整流程,真正實現(xiàn)“光認(rèn)知”語義信息。
實驗驗證表明,LightGen芯片可高效完成高分辨率圖像生成(分辨率達(dá)512×512以上)、三維場景重建(NeRF技術(shù))、高清視頻生成與語義調(diào)控等復(fù)雜任務(wù),同時具備圖像去噪、特征遷移等能力。與傳統(tǒng)電芯片依賴電子信號輔助生成不同,該芯片完全通過光子運(yùn)算實現(xiàn)端到端媒體生成,在生成質(zhì)量相當(dāng)?shù)那疤嵯拢到y(tǒng)能耗與延遲顯著降低。
性能對比數(shù)據(jù)顯示,即使采用普通輸入設(shè)備,LightGen仍能達(dá)到頂尖數(shù)字芯片2個數(shù)量級的算力提升和2個數(shù)量級的能效優(yōu)化。若配備前沿光信號輸入裝置,理論算力可提升7個數(shù)量級,能效提升達(dá)8個數(shù)量級。這種跨越式性能躍升,為解決AI算力危機(jī)提供了全新技術(shù)路徑。
該研究通過系統(tǒng)級優(yōu)化設(shè)計,驗證了全光架構(gòu)運(yùn)行大規(guī)模生成網(wǎng)絡(luò)的可行性。研究團(tuán)隊開發(fā)的專用訓(xùn)練算法,突破了光場訓(xùn)練缺乏真實標(biāo)注數(shù)據(jù)的限制,為光子芯片的自主學(xué)習(xí)能力奠定基礎(chǔ)。這項成果不僅為下一代低功耗AI芯片設(shè)計提供理論支撐,更將推動智能計算向光子時代加速邁進(jìn)。











