在第八屆世界聲博會暨2025科大訊飛全球1024開發者節上,科大訊飛以“更懂你的AI”為核心主題,正式推出訊飛星火大模型X1.5版本及多款創新產品,系統描繪了人工智能技術從實驗室走向產業化的實踐路徑。此次發布不僅展示了自主可控技術體系的突破,更通過軟硬一體化解決方案重新定義了AI與人類生活的交互方式。

作為技術升級的核心成果,星火X1.5采用混合專家(MoE)架構,總參數量達2930億,激活參數300億,推理效率較前代提升100%。該模型在數學能力、多語言支持等六大核心維度全面對標國際頂尖水平,其中數學能力持續保持領先,多語言覆蓋超130個語種,整體性能達到GPT-5的95%以上。在拉美、東盟等14個重點語言場景中,其表現甚至超越國際競品。值得關注的是,星火X1.5在國產算力平臺上攻克了兩大技術瓶頸:長思維鏈強化學習訓練效率從30%躍升至84%,MoE模型全鏈路訓練效率實現質的飛躍,為AI技術自主可控奠定堅實基礎。
在硬件創新領域,科大訊飛推出全球首款非自回歸語音大模型架構,通過并行輸出機制將推理成本降低520%,同時效果提升16%。這一突破直接應用于智能辦公場景:搭載八麥克風陣列的訊飛智能辦公本X5,在嘈雜環境中識別準確率達95.08%,超越iPhone 17 Pro;AI翻譯耳機采用單耳三麥降噪系統,復雜噪聲下識別率高達97.1%;雙屏翻譯機2.0更在90分貝噪音中保持98.69%的識別率。聲學領域的創新同樣亮眼,iFLYSOUND智能座艙音響方案通過立體空間聲場重構技術,已量產應用于19家車企,累計出貨超100萬臺,車內音效媲美百萬級豪車。
多模態交互能力的進化成為本次發布的另一焦點。數字人導覽員“小飛”現場演示了跨模態任務執行能力:不僅能同時處理多人多語種對話,還可根據用戶歷史行為提供個性化服務,完成購票、訂酒店等復雜操作。其背后是麥克風遠場識別、3D視覺感知、情感語義理解等八項核心技術的突破。更引人注目的是兩大首發功能:個性化記憶系統通過構建用戶畫像庫,實現長期偏好與短期需求的綜合理解;百變聲音復刻技術僅需1秒錄音即可克隆任意音色,并支持風格化聲音創作。

在應用場景拓展方面,科大訊飛展示了AI技術對傳統行業的深度改造。教育領域首創的4000+標簽錯因分析體系,通過智能批閱機和教師助手實現“作業批改-課堂施教”的小時級閉環;醫療領域發布的“智醫助理醫院版1.0”,使基層診療合理率從87%提升至96%,病歷書寫時間減半;出行領域,星火智慧座艙2.0通過54維記憶錨點記錄用戶偏好,融合13個攝像頭實現體征監測,將汽車轉化為“第三生活空間”。情感陪伴賽道則推出“AI星朋友”,其160種人設模型與自學習情感引擎,能主動發起通話互動,讓科幻場景走進現實。
生態建設層面,科大訊飛宣布全面開源原生支持RPA的智能體平臺Astron,該平臺整合Agent智能決策與RPA自動化能力,提供八大行業解決方案。數據顯示,2025年AI開發者大賽吸引3.6萬個國際團隊參與,催生4622個垂直領域智能體。截至10月,訊飛開放平臺開發者總數突破968萬,近一年新增200萬,其中大模型企業開發者增長125%。發布會上啟動的“星火點亮全球”計劃,將聯合多國合作伙伴,通過多語言技術與自主可控架構,構建AI技術共享的跨國生態。










