在2025科大訊飛1024開發者節上,一款名為“小飛”的多模態數字人導覽正式登場,標志著人工智能服務向真實物理空間邁出重要一步。這款數字人突破了傳統問答交互的局限,不僅能夠與多人進行自由對話,還支持多語種實時交流,更具備個性化記憶功能——通過記錄訪客歷史信息,提供諸如天氣提醒、日程建議等貼心服務。
“小飛”的核心競爭力源于八項技術的深度融合,包括遠場語音識別、3D視覺感知、情感語義理解等。科大訊飛董事長劉慶峰在現場演示中強調,這些能力讓AI不再是手機里的應用程序,而是能感知環境、理解情緒的“類人”伙伴。例如,當訪客用方言提問時,“小飛”可自動切換方言模式;當檢測到用戶情緒低落時,它會主動調整語氣并推薦舒緩音樂。
更令人矚目的是其形象變換功能。通過動態骨骼綁定技術,“小飛”能在0.5秒內切換為林黛玉、宇航員等數十種虛擬形象,甚至可根據場景需求調整服飾細節。在文旅場景中,它可化身歷史人物講解文物故事;在教育場景中,則能扮演虛擬教師進行互動教學。
同期發布的“百變聲音復刻”技術同樣引發關注。該技術基于星火語音大模型,用戶僅需提供10秒原始音頻,即可生成高保真數字音色。更突破性的是,通過指令調整可自由改變聲音風格——同一音色既能演繹新聞播報的莊重感,也能切換為動漫角色的俏皮腔調。這項技術已與多家有聲讀物平臺達成合作,未來用戶上傳聲音后,可自動生成個人專屬有聲書庫。
技術團隊透露,聲音復刻的保真度達到98.7%,情感表現力較傳統技術提升40%。在現場測試中,系統成功復刻了跨年齡、跨性別的聲音特征,甚至能模擬特定疾病患者的發聲狀態。這項突破或將重塑內容創作生態,從播客制作到虛擬偶像運營,都將迎來個性化定制的新時代。











