今日,科大訊飛在上海外灘世界會客廳舉辦新品發(fā)布會,正式推出具備60種語言同聲傳譯能力的AI翻譯耳機(jī)。這款產(chǎn)品融合聲音復(fù)刻技術(shù)與多模態(tài)AI降噪系統(tǒng),定位為“多語言耳畔智能體”,旨在通過端到端AI技術(shù)重構(gòu)跨語言溝通場景。
硬件設(shè)計(jì)方面,耳機(jī)采用開放式結(jié)構(gòu),搭載單耳三麥克風(fēng)陣列。其中2個數(shù)字硅麥克風(fēng)負(fù)責(zé)捕捉環(huán)境音與語音細(xì)節(jié),1個骨傳導(dǎo)麥克風(fēng)則通過采集骨振動信號實(shí)現(xiàn)精準(zhǔn)拾音。配合ENC降噪算法,系統(tǒng)可在近場通話時屏蔽環(huán)境噪音,遠(yuǎn)場交流時智能追蹤音源方向,確保拾音距離達(dá)5-8米。據(jù)現(xiàn)場演示,即使在嘈雜展會現(xiàn)場,耳機(jī)仍能清晰分離人聲與背景音。
翻譯功能依托端到端AI同傳大模型,可處理多義詞、歧義句等復(fù)雜語言場景。內(nèi)置超10萬條專業(yè)術(shù)語庫,覆蓋醫(yī)療、制造、金融等20余個行業(yè)。雙向?qū)υ捘J较拢脩艨蓪?shí)時查看原文與譯文,支持視頻會議、網(wǎng)絡(luò)通話等場景的同步傳譯。特別設(shè)計(jì)的“雙通道獨(dú)立同聲傳譯”功能,允許兩位使用者各戴單耳設(shè)備進(jìn)行無按鍵對話,系統(tǒng)自動識別發(fā)言方向并切換翻譯聲道。
聲音復(fù)刻技術(shù)是該產(chǎn)品的核心亮點(diǎn)之一。通過零樣本學(xué)習(xí)算法,系統(tǒng)可在10分鐘內(nèi)完成用戶音色建模,復(fù)刻相似度超90%。這項(xiàng)技術(shù)不僅保留聲紋特征,還能根據(jù)語境調(diào)整語調(diào),使翻譯語音更接近真人表達(dá)。在商務(wù)會議場景中,用戶可選擇將譯文轉(zhuǎn)為文字記錄,便于會后整理關(guān)鍵信息。
應(yīng)用場景覆蓋線上線下全維度:線上支持講座直播、遠(yuǎn)程談判的實(shí)時傳譯;線下可處理5-8米范圍內(nèi)的多人對話,通過AI算法自動識別發(fā)言者位置。耳機(jī)集成私人AI助手功能,支持語音記事、博客錄制等擴(kuò)展應(yīng)用,SIM卡插槽設(shè)計(jì)更確保了獨(dú)立通話能力。









