中國圖象圖形學(xué)學(xué)會(CSIG)近日揭曉2025年度科學(xué)技術(shù)獎評選結(jié)果,由網(wǎng)易(杭州)網(wǎng)絡(luò)有限公司聯(lián)合天津大學(xué)、中國科學(xué)技術(shù)大學(xué)及中國航天科工集團第四研究院十七所共同研發(fā)的《基于強化學(xué)習的智能決策關(guān)鍵技術(shù)及應(yīng)用》項目,榮獲“科技進步獎一等獎”。這一成果標志著產(chǎn)學(xué)研協(xié)同創(chuàng)新在數(shù)字技術(shù)領(lǐng)域的又一次突破,也為數(shù)字文娛產(chǎn)業(yè)的跨界融合提供了新范式。
作為圖像圖形學(xué)領(lǐng)域的國家級權(quán)威組織,CSIG的獎項評選向來以嚴格著稱。該學(xué)科通過賦予計算機“視覺理解”與“動態(tài)描繪”能力,支撐著從人臉識別到航天導(dǎo)航、從智能醫(yī)療到國防裝備的廣泛應(yīng)用。此次獲獎項目聚焦強化學(xué)習技術(shù)的三大核心難題——獎勵信號質(zhì)量不足、經(jīng)驗復(fù)用效率低下、環(huán)境適應(yīng)性差,提出了三項突破性解決方案:通過時空分解優(yōu)化獎勵生成機制,利用自監(jiān)督學(xué)習提升經(jīng)驗表征能力,并結(jié)合演化算法與強化學(xué)習構(gòu)建策略優(yōu)化模型。這些技術(shù)使系統(tǒng)在策略性能、學(xué)習速度和跨場景泛化能力上達到國際領(lǐng)先水平。
項目團隊基于技術(shù)創(chuàng)新搭建的智能決策平臺,已在多個關(guān)鍵領(lǐng)域?qū)崿F(xiàn)規(guī)模化應(yīng)用。在工業(yè)領(lǐng)域,該平臺助力海思完成14納米工藝全鏈條EDA工具國產(chǎn)化替代,打破國外技術(shù)壟斷;在國防軍事方面,支撐完成多項智能化任務(wù)系統(tǒng)開發(fā);在文娛產(chǎn)業(yè),則與網(wǎng)易旗下《逆水寒》等游戲深度結(jié)合,實現(xiàn)強化學(xué)習技術(shù)在大型商業(yè)游戲中的首次自動化測試應(yīng)用。平臺還為華為天籌求解器提供核心技術(shù)支持,使其性能超越國際標桿產(chǎn)品Gurobi,彰顯中國自主技術(shù)的競爭力。
以《逆水寒》手游為例,網(wǎng)易伏羲實驗室將智能捏臉、角色生成、群演調(diào)度等AI技術(shù)嵌入游戲生態(tài),推出“劇組模式”功能。玩家可自由擔任導(dǎo)演、編劇角色,通過自然語言指令生成劇情腳本,利用AI工具快速制作動畫短片。這一創(chuàng)新使數(shù)百萬普通玩家從內(nèi)容消費者轉(zhuǎn)變?yōu)閯?chuàng)作者,形成“人人可創(chuàng)作”的數(shù)字文娛新生態(tài)。在2024年云棲大會上,該模式作為AI賦能內(nèi)容生產(chǎn)的典型案例,引發(fā)行業(yè)廣泛關(guān)注。
項目技術(shù)負責人表示,游戲場景因其復(fù)雜多變的交互特性,成為前沿技術(shù)驗證的理想試驗場。通過將強化學(xué)習與圖形渲染、自然語言處理等技術(shù)融合,團隊不僅提升了游戲AI的決策能力,更探索出一條“以虛促實”的技術(shù)轉(zhuǎn)化路徑。目前,相關(guān)成果已延伸至生命健康、智慧城市等領(lǐng)域,例如通過模擬生物系統(tǒng)行為優(yōu)化藥物研發(fā)流程,利用虛擬環(huán)境訓(xùn)練城市交通調(diào)度模型等。
此次獲獎項目的技術(shù)報告顯示,其構(gòu)建的智能決策平臺已形成完整的技術(shù)體系,包含23項發(fā)明專利、17篇國際頂級會議論文及3項軟件著作權(quán)。經(jīng)第三方機構(gòu)評估,該平臺在工業(yè)軟件國產(chǎn)化替代、國防裝備智能化升級等方面創(chuàng)造直接經(jīng)濟效益超5億元,同時帶動相關(guān)產(chǎn)業(yè)鏈技術(shù)迭代,形成顯著的社會效益。隨著平臺開放接口的逐步推出,未來將有更多行業(yè)能夠接入這一“數(shù)字大腦”,加速智能化轉(zhuǎn)型進程。











