百度文心助手近日迎來重大升級,其AIGC創(chuàng)作能力得到全方位強(qiáng)化,現(xiàn)已支持AI圖片、視頻、音樂、播客等八大創(chuàng)作模態(tài)。用戶可通過單一入口調(diào)用多種工具,實(shí)現(xiàn)跨場景內(nèi)容生產(chǎn)的高效整合。

在視頻生成領(lǐng)域,文心助手推出行業(yè)首創(chuàng)的長視頻創(chuàng)作功能。用戶僅需輸入文字描述,即可自動(dòng)生成時(shí)長達(dá)3分鐘的完整故事片。這項(xiàng)突破性功能背后,是百度自主研發(fā)的"蒸汽機(jī)"視頻生成模型的再次進(jìn)化。
作為今年5月才進(jìn)入AI視頻生成賽道的后起之秀,百度蒸汽機(jī)模型憑借卓越性能迅速登頂VBench-I2V全球評測榜首。此次升級后,該模型不僅突破了傳統(tǒng)AI視頻10秒左右的時(shí)長限制,更實(shí)現(xiàn)了全球首個(gè)AI長視頻"實(shí)時(shí)交互"生成系統(tǒng)。
新系統(tǒng)支持創(chuàng)作過程中隨時(shí)中斷調(diào)整、內(nèi)容編輯修改,且生成效率顯著優(yōu)于國內(nèi)同類產(chǎn)品。技術(shù)團(tuán)隊(duì)透露,蒸汽機(jī)模型理論上具備無限時(shí)長生成能力,但考慮到實(shí)際應(yīng)用場景,當(dāng)前創(chuàng)意視頻生成時(shí)長限定在1分鐘范圍內(nèi)。

該模型的創(chuàng)新性體現(xiàn)在交互維度拓展——?jiǎng)?chuàng)作者可像操作傳統(tǒng)視頻編輯軟件般,在生成過程中實(shí)時(shí)調(diào)整鏡頭語言、敘事節(jié)奏等要素。這種"所見即所得"的創(chuàng)作模式,為專業(yè)內(nèi)容生產(chǎn)者提供了全新工具鏈。







