由中國汽車工程學(xué)會與江蘇省科學(xué)技術(shù)協(xié)會聯(lián)合主辦的2025國際汽車智能座艙大會(ICIC 2025)在環(huán)秀湖畔拉開帷幕。本屆大會聚焦"AI賦能智艙革新,重構(gòu)人·車·未來生態(tài)"主題,通過搭建產(chǎn)業(yè)協(xié)作平臺推動技術(shù)突破,吸引了全球汽車產(chǎn)業(yè)鏈上下游企業(yè)的廣泛參與。
在"座艙智能語音交互"專題論壇上,百度地圖智艙總經(jīng)理余云飛發(fā)表主題演講,系統(tǒng)闡述了跨模態(tài)AI語音技術(shù)重構(gòu)智能座艙的創(chuàng)新實踐。其團隊通過大模型技術(shù)全面升級車載語音系統(tǒng),為車企提供從技術(shù)架構(gòu)到用戶體驗的完整解決方案,相關(guān)成果已在吉利銀河等品牌實現(xiàn)量產(chǎn)應(yīng)用。
行業(yè)數(shù)據(jù)顯示,大模型技術(shù)正加速改變車載交互格局。自2024年起,搭載大模型能力的智能座艙新車滲透率持續(xù)攀升,預(yù)計2025年量產(chǎn)規(guī)模將突破900萬臺。技術(shù)升級推動車內(nèi)語音交互活躍度顯著提升,用戶日均使用時長較傳統(tǒng)系統(tǒng)增長42%,展現(xiàn)出強大的市場吸引力。
百度地圖智艙團隊推出的2.0架構(gòu)成為技術(shù)突破的關(guān)鍵。該架構(gòu)集成智能VAD(語音活動檢測)、語義理解增強、超擬人語音合成等創(chuàng)新模塊,通過統(tǒng)一拒識置信度模型實現(xiàn)需求精準(zhǔn)匹配。基于該架構(gòu)與吉利銀河聯(lián)合開發(fā)的語音系統(tǒng),在多輪對話、模糊指令識別等場景表現(xiàn)優(yōu)異,相關(guān)技術(shù)年內(nèi)將推廣至更多品牌車型。
針對傳統(tǒng)級聯(lián)架構(gòu)的局限性,百度率先實現(xiàn)端到端語音語言大模型與座艙系統(tǒng)的深度融合。該方案將座艙數(shù)據(jù)全面注入模型訓(xùn)練,通過RAG(檢索增強生成)技術(shù)接入百度地圖、搜索的實時信息,使系統(tǒng)具備行業(yè)專家級知識儲備。測試數(shù)據(jù)顯示,新系統(tǒng)意圖識別準(zhǔn)確率達97.6%,較傳統(tǒng)方案提升31個百分點。
在個性化體驗方面,技術(shù)團隊開發(fā)出動態(tài)人設(shè)生成系統(tǒng)。通過分析用戶交互習(xí)慣,系統(tǒng)可自動調(diào)整語音風(fēng)格、對話策略,配合定制化聲效庫,為每個品牌打造獨特的"數(shù)字行車伴侶"。這種成長型交互模式使車載語音系統(tǒng)具備持續(xù)進化的能力,形成差異化競爭優(yōu)勢。
通用智能體解決方案的落地成為技術(shù)應(yīng)用的里程碑。以上汽通用別克至境L7為載體,百度將端到端模型作為交互中樞,整合車輛感知信號與用戶記憶數(shù)據(jù),構(gòu)建出跨模態(tài)自然語言對話系統(tǒng)。該系統(tǒng)支持多輪復(fù)雜指令處理,并能根據(jù)環(huán)境變化主動提供服務(wù)建議,實現(xiàn)從被動響應(yīng)到主動關(guān)懷的跨越。
面向車企開放生態(tài)需求,百度正推進"超級Agent"出行系統(tǒng)建設(shè)。該方案深度融合語音大模型與高精地圖,在AI行程規(guī)劃、實時路況解讀、場景化陪伴等領(lǐng)域形成技術(shù)閉環(huán)。通過持續(xù)OTA升級,系統(tǒng)可同步獲取最新地圖數(shù)據(jù)與交互算法,確保用戶體驗始終處于行業(yè)前沿。