10月15日,百度宣布其視頻生成模型“百度蒸汽機”完成重大升級,引發科技圈廣泛關注。此次升級不僅突破了傳統AI視頻生成10秒左右的時長限制,更實現了AI長視頻實時交互生成功能,標志著國內視頻生成技術邁入新階段。
據介紹,升級后的“百度蒸汽機”依托流式視頻技術,首次在行業內實現AI長視頻實時交互生成。用戶上傳素材后,可全程干預視頻生成過程,包括暫停、修改提示詞、調整劇情和畫面等。該模型還支持圖生視頻和視頻生視頻雙模式,滿足不同場景下的創作需求。
在定價策略上,百度延續了首發時的性價比路線。蒸汽機Turbo有聲版價格為2.5元/秒,首發雙周優惠價為1.4元/5秒;C端用戶可通過“繪想”平臺充值會員,月費41元起。相比之下,OpenAI的Sora 2 API定價為0.1美元/秒起,C端用戶需訂閱ChatGPT Plus(20美元/月)或Pro(200美元/月)會員。
百度商業體系商業研發總經理劉林透露,此次定價基于工程優化能力、生成成本等多維度考量,未進行漲價或降價調整。他強調,百度蒸汽機的核心競爭力在于技術突破與用戶體驗的平衡。
除了長視頻生成功能,升級后的“百度蒸汽機”還推出了可交互數字人與開放世界動態構建兩大創新功能。數字人支持沉浸式雙向互動,可應用于AI導購、教育、陪伴等場景;開放世界則允許用戶在AI生成的環境中自由探索,如游戲地圖、旅游景點和宇宙空間等。
百度工作人員表示,具備交互能力的長視頻生成技術有望重塑人機互動模式,推動內容消費從“被動接收”向“共同創造”轉變,甚至催生新的藝術形式和商業生態。
值得注意的是,在百度蒸汽機升級的同一晚,谷歌推出了視頻生成模型Veo 3.1版。該版本在音頻輸出、精細化編輯控制和圖像轉視頻效果方面均有提升,并新增視頻擴展、首尾幀補過渡和圖片引導風格控制三大功能。這一動向進一步加劇了全球視頻生成賽道的競爭。
百度副總裁陳一凡指出,當前視頻生成賽道技術差距尚未拉開,短期優勢存在但無長期絕對領先。企業比拼的關鍵在于執行力和迭代速度。他透露,百度蒸汽機在產品層面雖支持無限時長生成,但考慮到用戶應用場景,仍做了一定時長限制。
與此同時,百度搜索宣布全面升級文心助手AIGC創作能力,支持AI圖片、視頻、音樂、播客等8種模態創作。用戶可通過百度首頁按鈕進入“文心助手”,一鍵調用多工具解決多場景問題。據百度搜索產品經理李想介紹,目前每天有千萬量級的AIGC內容由用戶創作產生,且已打通全模態生成。
以視頻生成場景為例,文心助手提供“長視頻生成玩法”。用戶輸入一段描述后,AI可自動完成情節設計、角色塑造、場景搭建、鏡頭運鏡和聲音配樂等全流程,生成一部3分鐘的故事片。文心助手還集成“一句話寫歌”“MV制作”“名場面模仿秀”等創作功能,以及超30種特效玩法模板,后續將上線音樂數字人分身功能。
在數字人領域,百度搜索發布了行業首個開放式實時互動的數字人智能體。該功能基于百度數字人技術、多模態模型和多智能體協作,支持用戶與持證真人專家的數字分身進行1v1對話,提供法律、情感、旅游等場景的專業陪伴與咨詢服務。
劉林透露,關于蒸汽機是否推出獨立App的問題,百度目前優先滿足內部業務需求,同時觀察到專業創作者更多使用PC端。不過,App將作為未來規劃方向之一。目前,包括蒸汽機在內的多項新技術已接入百度App。











