谷歌今日正式發(fā)布新一代視頻生成模型Veo 3.1,該模型在畫面真實(shí)度、敘事控制及多模態(tài)生成能力方面實(shí)現(xiàn)顯著突破。同步升級(jí)的AI影視創(chuàng)作平臺(tái)Flow新增音頻生成功能,支持從文本到"聲畫同步"內(nèi)容的完整創(chuàng)作流程。
此次更新為Flow平臺(tái)帶來(lái)三大核心功能革新:素材生視頻功能允許用戶上傳多張參考圖,自動(dòng)生成包含指定角色與場(chǎng)景風(fēng)格的完整視頻;首尾幀功能可根據(jù)用戶上傳的畫面生成自然過(guò)渡鏡頭;視頻延展功能則支持從現(xiàn)有片段擴(kuò)展出最長(zhǎng)一分鐘的新內(nèi)容。最引人注目的是新增的AI音頻生成系統(tǒng),能根據(jù)畫面內(nèi)容自動(dòng)匹配環(huán)境音效、動(dòng)作聲音及氛圍配樂(lè)。
針對(duì)創(chuàng)作者后期的修改需求,F(xiàn)low平臺(tái)新增多項(xiàng)智能編輯工具。用戶可在現(xiàn)有視頻中插入人物、動(dòng)物等新元素,系統(tǒng)會(huì)自動(dòng)調(diào)整光影效果與景深參數(shù)。即將上線的一鍵移除功能支持無(wú)痕刪除不需要的對(duì)象,系統(tǒng)將智能重建背景畫面。這些工具顯著提升了創(chuàng)作者對(duì)最終作品的把控精度。
在實(shí)測(cè)環(huán)節(jié),Veo 3.1展現(xiàn)出對(duì)復(fù)雜光影場(chǎng)景的出色處理能力。當(dāng)生成清晨溪流場(chǎng)景時(shí),模型準(zhǔn)確還原了柔和的暖色調(diào)光線,水流反光細(xì)節(jié)自然,整體畫面符合真實(shí)物理規(guī)律。其生成的配音也與畫面內(nèi)容高度契合。不過(guò)在挑戰(zhàn)高難度體操視頻生成時(shí),模型輸出的畫面出現(xiàn)明顯人體扭曲,暴露出當(dāng)前技術(shù)對(duì)動(dòng)態(tài)人體捕捉的局限性。
該模型已通過(guò)Flow平臺(tái)、Gemini API、Vertex AI及Gemini應(yīng)用全面開放,開發(fā)者與創(chuàng)作者可免費(fèi)體驗(yàn)。Flow平臺(tái)為免費(fèi)用戶每月提供100個(gè)AI點(diǎn)數(shù),約可生成5條視頻。在素材生視頻功能測(cè)試中,上傳咖啡杯、桌子和人物照片后,系統(tǒng)成功生成符合商業(yè)廣告調(diào)性的短片,并自動(dòng)為廣告詞添加了韻律感。
測(cè)試過(guò)程中也發(fā)現(xiàn)部分技術(shù)限制。當(dāng)上傳OpenAI CEO照片進(jìn)行測(cè)試時(shí),生成的人物形象與原型差異較大,這可能與平臺(tái)對(duì)名人肖像的保護(hù)機(jī)制有關(guān)——系統(tǒng)在識(shí)別到特定人物時(shí)會(huì)提示不支持使用相關(guān)圖像。
從近期Sora 2到Veo 3.1的迭代軌跡看,視頻生成技術(shù)正以驚人速度發(fā)展。但相比Veo 2到Veo 3的質(zhì)變,此次3.1版本的升級(jí)更多體現(xiàn)在功能完善與細(xì)節(jié)優(yōu)化。對(duì)于專業(yè)創(chuàng)作者而言,該模型提供了更高效的創(chuàng)作工具,但仍需結(jié)合人工調(diào)整才能達(dá)到理想效果。











