在世界互聯(lián)網(wǎng)大會(huì)的舞臺(tái)上,百度再次憑借前沿技術(shù)斬獲殊榮。其“劇本驅(qū)動(dòng)多模協(xié)同的高擬真數(shù)字人技術(shù)”榮獲2025年世界互聯(lián)網(wǎng)大會(huì)領(lǐng)先科技獎(jiǎng),這是自2023年“知識(shí)增強(qiáng)大語(yǔ)言模型關(guān)鍵技術(shù)”、2024年“文心智能體技術(shù)”獲獎(jiǎng)后,百度大模型連續(xù)第三年將這一獎(jiǎng)項(xiàng)收入囊中。
頒獎(jiǎng)典禮上,百度首席技術(shù)官王海峰作為發(fā)布人亮相。他詳細(xì)介紹了這項(xiàng)獲獎(jiǎng)技術(shù)的核心創(chuàng)新點(diǎn):通過(guò)融合多模規(guī)劃與深度思考的劇本生成,實(shí)現(xiàn)動(dòng)態(tài)決策的實(shí)時(shí)交互;運(yùn)用文本自控的語(yǔ)音合成技術(shù),結(jié)合高一致性超擬真數(shù)字人長(zhǎng)視頻生成能力,突破了多模態(tài)實(shí)時(shí)協(xié)同與復(fù)雜動(dòng)態(tài)交互的技術(shù)瓶頸。這些創(chuàng)新使數(shù)字人在語(yǔ)言、聲音和形象上達(dá)到高度協(xié)調(diào),顯著提升了直播內(nèi)容的質(zhì)量與交互體驗(yàn),具備“高情商、強(qiáng)互動(dòng)、長(zhǎng)續(xù)航、更專業(yè)”的顯著優(yōu)勢(shì)。
實(shí)際應(yīng)用中,這項(xiàng)技術(shù)已展現(xiàn)出強(qiáng)大價(jià)值。基于百度數(shù)字人技術(shù),超過(guò)10萬(wàn)個(gè)數(shù)字人已在電商、教育、法律等多個(gè)行業(yè)投入使用,有效降低了開播成本,并提升了直播轉(zhuǎn)化率。在百度電商場(chǎng)景中,該技術(shù)已成功應(yīng)用于明星直播、圖書推薦和健康科普等領(lǐng)域,為商家開辟了新的銷售渠道。
公開資料顯示,自2016年以來(lái),百度憑借一系列創(chuàng)新成果,七次榮膺世界互聯(lián)網(wǎng)大會(huì)領(lǐng)先科技獎(jiǎng)。這些成果包括百度大腦、小度助手(DuerOS)、Apollo自動(dòng)駕駛平臺(tái)、飛槳深度學(xué)習(xí)框架,以及知識(shí)增強(qiáng)大語(yǔ)言模型、文心智能體技術(shù)和此次獲獎(jiǎng)的劇本驅(qū)動(dòng)多模協(xié)同高擬真數(shù)字人技術(shù),充分展現(xiàn)了百度在人工智能領(lǐng)域的持續(xù)創(chuàng)新力。










