在AI視頻生成技術加速向“精細化創作”演進的背景下,谷歌DeepMind與谷歌實驗室近日聯合推出新一代AI視頻模型Veo 3.1,并對旗下AI創作平臺Flow進行全面升級。此次更新引入了音頻生成、鏡頭編輯及物體增刪三大核心功能,標志著AI視頻制作從“基礎生成”邁入“專業導演”階段。
據官方披露,Flow平臺自上線以來已累計生成超2.75億條視頻,而Veo 3.1的推出將進一步推動AI視頻創作向專業化發展。該模型在三個關鍵領域實現突破:其一,全鏈路音頻生成技術可同步為視頻添加環境音效、背景音樂及擬真聲效;其二,通過首尾幀設定與參考圖像導入功能,用戶可精準控制鏡頭節奏與敘事走向;其三,強化光影渲染與動作細節,顯著提升畫面真實感。
谷歌DeepMind產品經理杰斯·加萊戈斯強調:“Veo 3.1首次實現了音畫同步的敘事能力,讓創作者能在AI視頻中完整講述故事,而不僅是生成片段。”目前,該模型已深度集成至Flow平臺,用戶可像專業剪輯師般進行多維度編輯操作。
在音頻生成方面,Veo 3.1支持為不同場景自動匹配風聲、水聲、腳步聲等環境音效,并可生成適配的背景音樂。其“素材轉視頻”功能允許用戶同時導入多張參考圖像,精準控制角色造型、場景風格及光影效果;“幀序列生成”功能通過輸入首尾幀畫面,自動生成中間過渡鏡頭;“續拍生成”功能則能基于前序片段最后一秒內容,實現分鐘級長鏡頭的連貫創作。
平臺新增的“視頻修圖”功能引發行業關注。其中,“插入元素”功能支持添加人物、物體甚至奇幻生物,AI會自動調整陰影與光線使其自然融入畫面;“刪除元素”功能(即將上線)則允許用戶直接移除畫面中的特定對象,AI將智能重建背景以實現無縫銜接。這些功能使AI視頻創作從“一次性生成”轉向“可迭代編輯”,更接近專業影視后期流程。
技術生態層面,Veo 3.1已同步接入Gemini API與Vertex AI平臺,企業和開發者可直接在應用中調用該生成體系。這不僅鞏固了Flow作為創作者工具的地位,更使Veo 3.1成為谷歌AI生態的核心視頻引擎。
從應用場景看,該技術正在重塑多個行業的工作流程:創作者可通過參考圖像與音頻腳本構建完整短片;媒體機構可快速生成新聞過渡鏡頭與背景音效;游戲公司能高效制作敘事動畫與CG預告片;教育及廣告領域則可一鍵生成定制化教學視頻與產品宣傳片。
與OpenAI Sora的端到端生成模式不同,谷歌的Veo 3.1+Flow組合更接近“AI創意工作臺”。若將Sora比作“AI攝影機”(輸入文本生成視頻),則Veo 3.1+Flow可視為集剪輯、調色、音效于一體的“AI影視工作站”。這種模塊化創作模式使Flow兼具視頻生成工具與創意平臺的雙重屬性,被業界視為下一代Adobe Premiere與Midjourney的融合體。











