在第八屆世界聲博會暨2025科大訊飛全球1024開發者節發布會上,科大訊飛董事長劉慶峰指出,AI技術要真正實現普惠價值,必須突破自主可控、軟硬融合、垂直行業深耕和個性化服務四大核心挑戰。他強調,AI不應僅停留在技術層面,更應成為助力每個人連接世界、創造美好生活的工具。
作為本次活動的核心成果,科大訊飛正式推出深度推理大模型訊飛星火X1.5。該模型基于混合專家(MoE)架構,總參數規模達2930億,激活參數300億,推理效率較前代提升一倍。在語言理解、文本生成、知識問答、邏輯推理、數學計算和代碼生成六大核心能力上,已達到國際領先水平,其中數學能力持續保持全球優勢。
多語言支持方面,訊飛星火X1.5覆蓋超過130種語言,整體性能達到GPT-5的95%以上,在拉美、東盟等地區的14種重點語言處理上表現尤為突出。算力層面,該模型完全基于國產算力平臺開發,實現了兩大技術突破:長思維鏈強化學習訓練效率從30%提升至84%,MoE模型全鏈路訓練效率顯著優化。
在原創技術領域,科大訊飛全球首發非自回歸語音大模型架構,推理能力實現階躍式提升。與同規模自回歸模型相比,效果提升16%,推理成本降低520%。這一突破為語音交互技術開辟了新的發展路徑。
基于強大的模型底座,科大訊飛同步升級了軟硬件一體化解決方案。活動現場發布了集成AI、麥克風陣列、揚聲器陣列、攝像頭陣列和視覺呈現技術的綜合方案。其中,訊飛智能辦公本X5在復雜噪聲環境下的識別準確率達95.08%,AI翻譯耳機和雙屏翻譯機2.0的識別準確率分別達到97.1%和98.69%。
在智能座艙領域,搭載"AI+揚聲器陣列技術"的iFLYSOUND方案已實現立體空間聲場重構,并在19家車企量產,出貨量突破100萬臺。教育硬件方面,訊飛AI學習機集成微納米類紙屏等技術,獲得國內外10余項權威護眼認證。
多模態交互能力的持續進化是軟硬一體方案的核心支撐。劉慶峰介紹,真正的多模態交互需要麥克風遠場識別、3D視覺感知、多人主動交互、類人舉止反饋、視聽覺融合理解、超擬人數字人、個性化記憶和情感語義等技術的協同運作。
發布會上,星火X1.5首次亮相兩大核心技術:個性化記憶技術通過構建用戶記憶庫,實現對用戶長期畫像、近期反饋和短期對話的綜合理解;百變聲音復刻技術僅需一句錄音即可復刻任意音色,并支持通過指令創造個性化聲音。這些突破將為數字人、有聲讀物和內容創作領域帶來變革性影響。
在行業應用方面,訊飛星火大模型持續深化垂直領域布局。教育領域,模型構建了包含3大類、3層級、4000余個標簽的錯因體系,通過智能批閱機和教師助手實現作業批改到課堂教學的"小時級閉環"。醫療領域,專科AI診療能力達到三甲醫院主任醫師水平,人機協同使基層診斷合理率從87%提升至96%,病歷書寫時間減半。個人AI健康助手"訊飛曉醫"已支持99%的醫學報告解析,累計完成1.6億次健康咨詢。
在實際應用中,科大訊飛與行業領軍企業合作開發了300余個即用型智能體。其中,"星火行業分析師"成為國內首個通過工信部教考中心《大數據分析師技術水平考試》的AI應用,得分92分,超越85%的人類考生;"星火招投標助手"在國家能源集團全年處理18萬單評審,準確率達97%。這些成果標志著AI技術正在各行業創造實質性價值。











