美國人工智能初創(chuàng)企業(yè)Runway近日宣布推出新一代視頻生成模型Gen-4.5,這款產(chǎn)品在獨(dú)立基準(zhǔn)測(cè)試中展現(xiàn)出超越谷歌與OpenAI同類產(chǎn)品的實(shí)力。根據(jù)AI基準(zhǔn)測(cè)試機(jī)構(gòu)Artificial Analysis發(fā)布的Video Arena排行榜數(shù)據(jù),Gen-4.5以顯著優(yōu)勢(shì)登頂榜首,谷歌的Veo 3和OpenAI的Sora 2 Pro分別位列第二和第七。
該模型的核心突破在于對(duì)物理規(guī)律的深度理解能力。Runway團(tuán)隊(duì)透露,Gen-4.5能夠精準(zhǔn)解析文字提示中的運(yùn)動(dòng)軌跡與動(dòng)作邏輯,在生成高清視頻時(shí),可自然呈現(xiàn)人體動(dòng)態(tài)、鏡頭運(yùn)動(dòng)軌跡以及事件因果關(guān)系。這種技術(shù)特性使其在影視制作、廣告創(chuàng)意等領(lǐng)域具有顯著應(yīng)用價(jià)值,目前已有媒體機(jī)構(gòu)、影視工作室、品牌方等超過120家客戶開展合作。
測(cè)試排名采用雙盲對(duì)比機(jī)制,參與者需同時(shí)觀看兩個(gè)模型生成的視頻片段并投票選擇更優(yōu)作品,整個(gè)過程完全不知曉作品歸屬方。這種評(píng)估方式確保了結(jié)果的客觀性,Gen-4.5在多輪比拼中持續(xù)保持領(lǐng)先地位。公司首席執(zhí)行官Cristóbal Valenzuela在技術(shù)分享會(huì)上強(qiáng)調(diào):"我們用120人的精干團(tuán)隊(duì),在七年研發(fā)周期中實(shí)現(xiàn)了對(duì)科技巨頭的超越,這印證了專注研究的力量。"
成立于2018年的Runway持續(xù)深耕視頻生成領(lǐng)域,其技術(shù)路線聚焦于構(gòu)建"世界模型"——通過海量視頻數(shù)據(jù)訓(xùn)練,使系統(tǒng)能更真實(shí)地模擬物理世界運(yùn)行規(guī)律。這種技術(shù)積累為其贏得資本青睞,最新估值已達(dá)35.5億美元,投資方包括General Atlantic、英偉達(dá)等知名機(jī)構(gòu)。Valenzuela特別指出,Gen-4.5內(nèi)部代號(hào)"David"取自圣經(jīng)典故,象征著以創(chuàng)新突破行業(yè)壟斷的決心。
據(jù)技術(shù)白皮書披露,Gen-4.5的研發(fā)周期長達(dá)七年,期間經(jīng)歷多次技術(shù)迭代。該模型將通過Runway平臺(tái)、API接口及合作伙伴渠道逐步開放,首批用戶將于本周內(nèi)獲得訪問權(quán)限。Valenzuela透露,這僅是公司技術(shù)升級(jí)計(jì)劃的第一步,后續(xù)還將推出一系列重大功能更新。在談到行業(yè)格局時(shí),他表示:"AI技術(shù)不應(yīng)被少數(shù)企業(yè)壟斷,我們致力于推動(dòng)技術(shù)普惠化發(fā)展。"







