2025年9月18日至9月20日,華為全聯接大會在上海成功舉辦。在第三天的開發者日上集中展示了一批基于鯤鵬、昇騰基礎軟硬件平臺實現的具有前瞻性和領先競爭力的科研創新成果。在鯤鵬昇騰科教創新孵化中心的算力支持下,國內重點高校及孵化的初創企業創新成果紛至沓來,覆蓋AI編程語言、大模型訓推加速、多模態大模型及科學計算仿真等多個前沿領域,展現出繁榮生態下產學研協同創新的強大活力。
在高校方面,科研團隊聚焦于計算架構和交叉學科創新,展現了其深厚的學術功底與前沿的技術洞察,其成果展示了對領先計算范式與核心技術問題的深度探索。
科學計算仿真領域,北京大學力學與工程科學學院、北京科學智能研究院研究員陳幟團隊研發的DeepFlame燃燒流體仿真工具基于鯤鵬實現重大突破。該軟件針對火箭發動機研發中的燃燒模擬計算精度和效率的矛盾,創新融合AI推理與高性能計算,實現火箭發動機超臨界燃燒模擬的千倍加速。通過物理嵌入剛性神經算子(PE-SNO)和眾核PDE求解器優化,該工具完成近萬億網格規模模擬,浮點峰值超過1EFlops,將傳統需6個月的計算任務壓縮至1小時完成,研究成果有望大幅縮短我國航天發動機研發周期、降低試驗成本,為提升商業航天運力提供了關鍵的數字化支撐。

(北京大學力學與工程科學學院、北京科學智能研究院研究員 陳幟)
由北京大學計算機學院副研究員楊智團隊主導開發的開源 AI 算子編程語言 TileLang是算子開發的典型成果之一。該團隊核心成員董宇騏分享到其核心價值在于能夠將高級別的數據流描述,自動轉換并優化為高效的底層代碼(如Ascend C)。通過其獨特的Tile級抽象和自動調度能力,開發者可以用更簡潔的代碼表達復雜計算,同時獲得接近手寫算子的高性能,顯著提升了AI算子的開發效率。TileLang實現了FlashAttention算子開發,代碼量從500+行減少至80行,并保持了與官方版本持平的性能。

(北京大學計算機學院研究生、楊智團隊核心成員 董宇騏)
東南大學計算機科學與工程學院副教授楊旭主導團隊分享了圍繞多模態大模型的類比、抽象與推理能力展開系統性研究。在昇騰算力支持下,團隊提出啟發式上下文策略、可學習上下文向量LIVE等方法,顯著提升視覺問答任務中的學習效率與推理速度。進一步地,團隊基于規則獎勵的強化學習框架LMM-R1,通過兩階段訓練增強多模態模型的推理能力,并在動態微調DFT方法中統一監督學習與強化學習的優化視角,為輕量化模型實現高效知識遷移與泛化能力提升提供了新路徑。

(東南大學計算機科學與工程學院副教授 楊旭)
在鯤鵬昇騰種子計劃的助力下,眾多來自高校的創新開始成功走向市場,科研團隊紛紛成立初創企業。它們致力于將先進的學術理念轉化為可實際部署的解決方案,展示了他們對市場的敏銳嗅覺及強大的技術轉化和產業落地能力。
多模態大模型重新定義了AI的邊界與可能。魔芯科技CEO、浙江大學計算機科學與技術學院博士研究生陳天潤帶領團隊,構建了首個基于昇騰的3D空間智能大模型,基于數億真實物理世界數據訓練,忠實反映了物理世界。該模型采用MindSpeed訓練框架,在256卡昇騰集群上完成10萬場景訓練,僅通過Decoder-Only Transformer即實現三維空間關系的自發學習。模型支持多視角輸入、新視點合成、語義編輯等功能,在虛擬漫游、數字孿生、機器人仿真等領域具備廣泛應用潛力,推動三維內容生成走向普惠化。

(魔芯科技CEO、浙江大學計算機科學與技術學院博士研究生 陳天潤)
清華系初創代表趨境科技的KTransformers引擎另辟蹊徑,專注于利用鯤鵬CPU與昇騰NPU的異構協同技術,打造出極致的推理加速技術。該引擎基于計算強度實施精準負載分配策略,將混合專家模型中計算強度較低的路由專家層參數卸載至容量更大的鯤鵬CPU內存,而將計算密度最高的多層潛在注意力層保留在昇騰NPU上執行。通過針對鯤鵬多NUMA架構的本地內存分配與線程調度優化、結合鯤鵬數學庫對大模型矩陣乘法實現的專項加速以及采用專家延遲計算技術有效重疊通信與計算過程,KTransformers在千億參數模型推理中實現了顯存占用降低百分之九十以上的顯著效果,為大規模模型部署提供了創新的底層技術支撐。

(趨境科技KTransformers引擎架構師、清華大學計算機系博士 謝威宇)
前沿學術探索如源頭活水,而開發者始終是創新的關鍵所在。鯤鵬與昇騰社區通過提供體系化的課程、詳實的案例文檔、高效的工具軟件以及活躍的專家社群,全程陪伴開發者從學習到認證、從創新到實踐的全周期成長。未來,鯤鵬與昇騰將繼續攜手全球開發者,以更開放的技術、更豐富的工具和更緊密的社區共創,持續賦能開發者實現其創新價值,共同推動計算產業的智能化進程。