在第八屆世界聲博會暨2025科大訊飛全球1024開發者節上,科大訊飛以《更懂你的AI》為主題,向全球展示了其最新技術突破與產品矩陣。這場以“AI賦能千行百業”為核心的盛會,不僅發布了深度推理大模型訊飛星火X1.5,更通過軟硬一體化解決方案、多模態交互技術及行業深度應用,勾勒出AI技術從實驗室走向真實場景的完整路徑。

星火X1.5的發布成為全場焦點。這款采用MoE架構的模型總參數量達293B,激活參數30B,推理效率較前代提升100%,在數學能力、多語言支持等六大核心維度全面對標國際主流。其數學能力持續保持領先,多語言覆蓋超130個語種,整體性能達GPT-5的95%以上,在拉美、東盟等14個重點語言場景中表現尤為突出。更值得關注的是,科大訊飛在自主可控算力平臺上實現兩大突破:長思維鏈強化學習訓練效率從30%躍升至84%,MoE模型全鏈路訓練效率顯著優化,為國產AI算力樹立新標桿。與此同時,全球首發的非自回歸語音大模型架構通過并行輸出文本序列,將推理成本降低520%,效果提升16%,重新定義了語音交互的效率標準。
軟硬一體化解決方案的推出,標志著AI技術向真實世界滲透的關鍵跨越。科大訊飛融合AI與傳感器陣列技術,打造出覆蓋辦公、翻譯、同傳等場景的智能硬件生態。其中,智能辦公本X5搭載上4下4環八麥克風陣列,在高噪環境下識別準確率達95.08%,遠超iPhone 17 Pro;AI翻譯耳機首創單耳三麥多感融合系統,復雜噪聲下識別率高達97.1%;雙屏翻譯機2.0在90dB噪音中仍保持98.69%的識別率。更引人注目的是業界首個軟硬一體同傳麥克風,實現自動翻譯免切換,首響延遲低于2秒,支持私有化部署。在車載場景中,iFLYSOUND智能座艙音響方案通過立體空間聲場重構技術,讓車內音效媲美百萬豪車,目前已與19家車企合作,量產超100萬臺。
多模態交互技術的突破讓AI更具“人性溫度”。數字人導覽“小飛”現場演示了其八大核心能力:通過麥克風遠場識別、3D視覺感知等技術,實現多人多語種對話、個性化推薦及任務執行。發布會首發的個性化記憶能力與百變聲音復刻技術,則進一步拉近了AI與用戶的距離。星火X1.5可構建用戶記憶庫,綜合長期畫像、近期反饋與短期對話,實現精準個性化服務;基于語音大模型的聲音復刻技術,僅需1秒錄音即可克隆任意音色,并支持風格化聲音創造。科大訊飛董事長劉慶峰強調:“超擬人多模態交互將成為AI進入家庭的標配,讓技術真正理解人類情感與需求。”

行業深度應用場景的展示,印證了AI技術從工具到伙伴的蛻變。在教育領域,星火大模型構建的錯因體系包含3大類、3層級、4000+標簽,通過智能批閱機與教師助手實現“作業批改-課堂施教”小時級閉環,獲國家數學課程標準修訂組專家權威認證。醫療領域,星火醫療大模型專科診療能力達主任級醫師水平,人機協同使基層診斷合理率從87%提升至96%,病歷書寫時間減半。全新發布的“智醫助理醫院版1.0”與升級后的“訊飛曉醫”APP,可解析99%醫學報告,累計完成1.6億次健康咨詢。在出行場景中,星火智慧座艙2.0通過13個攝像頭與54維記憶錨點記住用戶偏好,提供體征監測與個性化服務,將汽車轉化為“第三生活空間”。辦公領域,智能辦公本X5與聽見APP升級后,可基于說話人識別自動生成會議紀要,手寫內容與AI紀要深度融合,更貼合用戶習慣。情感陪伴方面,“AI星朋友”憑借4.35MOS高保真聲音克隆與160種人設模型,通過自學習情感模型主動關懷用戶,讓科幻場景成為現實。
生態共建成為科大訊飛戰略的核心。2025年AI開發者大賽吸引17國36,898個團隊參與,誕生4,622個垂類智能體。截至10月底,訊飛開放平臺開發者總數達968萬,近一年新增200萬,大模型企業開發者增長125%。發布會現場,科大訊飛宣布全面開源原生支持RPA的智能體平臺Astron,將“大腦”與“手腳”結合,提供八大行業智能體,助力開發者跨越AI應用鴻溝。同時,攜手多國伙伴啟動“星火點亮全球”計劃,依托多語言與自主可控技術,推動AI紅利全球共享,為世界提供“第二種選擇”。


























