中國電信研究院攜手中國科學(xué)院計(jì)算技術(shù)研究所、華為昇騰及沐曦等合作伙伴,依托中國電信云網(wǎng)融合技術(shù)中試驗(yàn)證平臺(tái),成功完成了一項(xiàng)具有里程碑意義的技術(shù)突破——業(yè)界首個(gè)面向國產(chǎn)算力的跨架構(gòu)大模型推理技術(shù)驗(yàn)證。這一成果標(biāo)志著我國在人工智能算力適配領(lǐng)域邁出了重要一步。
此次技術(shù)攻關(guān)的核心項(xiàng)目為“Triton統(tǒng)一跨架構(gòu)推理框架”,由中國電信研究院主導(dǎo)研發(fā)。該框架通過自主研發(fā)的Triton跨架構(gòu)編譯器與統(tǒng)一大模型算子庫,實(shí)現(xiàn)了同一套算子源碼在英偉達(dá)、昇騰、沐曦三類主流芯片上的無縫兼容運(yùn)行。這一創(chuàng)新解決了不同芯片架構(gòu)間算子適配的難題,為國產(chǎn)算力生態(tài)的統(tǒng)一化發(fā)展提供了關(guān)鍵技術(shù)支撐。
在驗(yàn)證過程中,團(tuán)隊(duì)完成了10余款主流開源模型在三類芯片上的端到端推理測試。測試數(shù)據(jù)顯示,該框架在多項(xiàng)核心指標(biāo)上表現(xiàn)突出:平均遷移時(shí)間縮短至3天以內(nèi),較傳統(tǒng)適配模式效率提升超過80%;模型推理精度誤差控制在0.5%以下,確保了輸出結(jié)果的可靠性;在同等延遲約束條件下,系統(tǒng)吞吐量達(dá)到各芯片原生算子庫的90%以上,實(shí)現(xiàn)了性能與適配效率的雙重優(yōu)化。
為進(jìn)一步提升技術(shù)實(shí)用性,框架還內(nèi)置了benchmark與Profiling工具,可一鍵生成跨芯片性能對(duì)比報(bào)告。這一功能為業(yè)務(wù)方在芯片選型時(shí)提供了直觀的數(shù)據(jù)參考,有助于根據(jù)實(shí)際需求選擇最優(yōu)算力方案,降低技術(shù)遷移成本。
作為中國電信集團(tuán)的核心研發(fā)機(jī)構(gòu),中國電信研究院長期聚焦6G、光網(wǎng)絡(luò)、衛(wèi)星通信等前沿領(lǐng)域的技術(shù)攻關(guān)。此次跨架構(gòu)推理框架的成功驗(yàn)證,不僅展現(xiàn)了其在人工智能算力領(lǐng)域的創(chuàng)新能力,也為國產(chǎn)芯片生態(tài)的協(xié)同發(fā)展提供了可復(fù)制的技術(shù)路徑。











