AI視頻生成領域迎來重大突破,Runway最新發布的Gen-4.5模型在Artificial Analysis文本轉視頻基準測試中以1247 Elo評分登頂,成為當前性能最強的視頻生成工具。這款被業界稱為"視頻生成AGI時刻"的模型,憑借其物理還原度與視覺精準度引發廣泛關注。
該模型的核心優勢在于對復雜指令的理解能力。用戶可通過單個提示詞精準控制鏡頭運動軌跡、場景構圖細節、事件時間節點及氛圍變化。例如在生成汽車追逐場景時,既能展現揚塵效果的真實物理特性,又能通過背景模糊處理強化速度感,同時保持畫面主體清晰度。
物理引擎的突破性升級是另一大亮點。生成的視頻中,物體運動呈現符合現實規律的重量感與動量特征,表面材質反射效果與真實世界高度一致。當模擬滑板運動時,板面與地面的摩擦力、人物重心轉移等細節均得到精準還原。更有趣的是,模型支持突破物理定律的創意表達,如讓綿羊拉動北極熊等超現實場景。
在視覺風格適配方面,Gen-4.5展現出強大泛化能力。從寫實風格到3D繪畫,從微距特寫到宏觀場景,模型均能保持穩定輸出質量。特別在處理復雜場景時,如人物照鏡子、車輛顛簸行駛等動態畫面,幾乎無法察覺人工生成痕跡。刷墻視頻中顏料干燥后的色差變化等微觀細節,進一步驗證了模型的觀察力。
控制模式兼容性方面,除文本生成視頻外,官方承諾將適配圖片轉視頻、關鍵幀生成、視頻轉視頻等現有控制方式。這種開放架構設計,使得專業創作者既能利用精細指令實現創意,普通用戶也可通過簡單操作完成基礎視頻制作。
盡管性能顯著提升,研發團隊坦言模型仍存在局限性。在因果推理與物體恒存性認知方面,例如處理遮擋物體后的狀態延續時,模型表現尚未達到人類水平。不過官方透露正在進行針對性優化,未來將通過迭代更新逐步完善這些功能。
目前該模型已啟動權限開放流程,預計未來幾天內所有用戶均可體驗。定價策略保持親民路線,維持與當前訂閱套餐相近的收費標準。這一舉措或將加速AI視頻生成技術的普及應用,重新定義數字內容創作邊界。
完整演示視頻可通過指定鏈接觀看,其中包含多個長鏡頭案例,充分展示模型在復雜敘事場景中的持續表現能力。從靜態指令到動態敘事,從物理模擬到藝術表達,Gen-4.5的推出標志著AI視頻生成進入全新發展階段。












