AI視頻生成領(lǐng)域迎來新突破,初創(chuàng)公司Runway推出的Gen 4.5模型在獨(dú)立基準(zhǔn)測(cè)試中力壓谷歌與OpenAI的同類產(chǎn)品,登頂Video Arena榜單。這款模型憑借對(duì)物理規(guī)律的深度理解與精準(zhǔn)的動(dòng)態(tài)捕捉能力,正在重新定義視頻生成技術(shù)的行業(yè)標(biāo)準(zhǔn)。
根據(jù)AI基準(zhǔn)分析機(jī)構(gòu)Artificial Analysis的盲測(cè)結(jié)果,用戶需同時(shí)評(píng)審兩個(gè)模型生成的視頻片段并投票選出更優(yōu)者。在持續(xù)數(shù)周的測(cè)試中,Gen 4.5以顯著優(yōu)勢(shì)領(lǐng)先,谷歌的Veo 3與OpenAI的Sora 2 Pro分別位列第二和第七。測(cè)試覆蓋運(yùn)動(dòng)軌跡、人物動(dòng)作、鏡頭語言及因果邏輯等核心維度,Runway模型在復(fù)雜場(chǎng)景還原方面展現(xiàn)出獨(dú)特優(yōu)勢(shì)。
該模型的核心突破在于物理引擎的升級(jí)。Runway團(tuán)隊(duì)透露,Gen 4.5通過改進(jìn)時(shí)空連續(xù)性算法,能夠更真實(shí)地模擬重力、碰撞等物理現(xiàn)象。例如在生成拋物線運(yùn)動(dòng)時(shí),物體落地后的彈跳高度與角度更符合現(xiàn)實(shí)規(guī)律;人物行走時(shí)衣物褶皺的動(dòng)態(tài)變化也達(dá)到影視級(jí)精度。這些特性使其在廣告制作、影視預(yù)演等場(chǎng)景中具備直接應(yīng)用價(jià)值。
公司創(chuàng)始人克里斯托瓦爾·瓦倫蘇埃拉將此次突破形容為"現(xiàn)代版大衛(wèi)戰(zhàn)勝歌利亞"。這位智利裔企業(yè)家在采訪中強(qiáng)調(diào):"技術(shù)壁壘不取決于團(tuán)隊(duì)規(guī)模或資金實(shí)力,而是對(duì)核心問題的專注程度。我們用7年時(shí)間打磨底層架構(gòu),現(xiàn)在終于迎來質(zhì)變時(shí)刻。"據(jù)PitchBook數(shù)據(jù)顯示,Runway當(dāng)前估值已達(dá)35.5億美元,客戶群體覆蓋迪士尼、Netflix等頭部影視機(jī)構(gòu)及超過200萬個(gè)人創(chuàng)作者。
技術(shù)迭代背后是持續(xù)的研發(fā)投入。Runway自2018年成立以來,始終聚焦多模態(tài)世界模型構(gòu)建,其研發(fā)的時(shí)空預(yù)測(cè)系統(tǒng)能通過視頻數(shù)據(jù)自主學(xué)習(xí)環(huán)境規(guī)律。這種技術(shù)路線與主流大模型形成差異,瓦倫蘇埃拉指出:"生成式AI不應(yīng)被少數(shù)巨頭壟斷,我們正在通過開源部分算法推動(dòng)行業(yè)生態(tài)發(fā)展。"
目前Gen 4.5已啟動(dòng)分階段部署,現(xiàn)有用戶將在本周末前獲得完整訪問權(quán)限。除基礎(chǔ)視頻生成功能外,Runway還計(jì)劃推出動(dòng)態(tài)光照調(diào)節(jié)、多角色交互等升級(jí)模塊。該模型將通過平臺(tái)界面、API接口及戰(zhàn)略合作伙伴渠道同步開放,預(yù)計(jì)未來三個(gè)月內(nèi)接入超過50個(gè)創(chuàng)作工具平臺(tái)。













