埃隆·馬斯克旗下的人工智能企業(yè)xAI正式宣布進軍世界模型研發(fā)領(lǐng)域,與meta、谷歌等科技巨頭展開直接競爭。該公司的核心目標是開發(fā)能夠深度理解物理規(guī)律、自主設(shè)計并導(dǎo)航復(fù)雜環(huán)境的下一代AI系統(tǒng),這一戰(zhàn)略被視為突破當(dāng)前文本生成技術(shù)邊界的關(guān)鍵嘗試。
為實現(xiàn)技術(shù)突破,xAI已從英偉達招募多名頂尖研究員,其中包括在世界模型領(lǐng)域具有深厚積累的Zeeshan Patel和Ethan He。這兩位專家此前參與的英偉達Omniverse平臺開發(fā),正是通過模擬環(huán)境訓(xùn)練AI理解真實世界的標桿項目。據(jù)內(nèi)部人士透露,xAI的研發(fā)方向?qū)⒕劢褂跇?gòu)建可生成交互式3D環(huán)境的模型,初期應(yīng)用場景鎖定在游戲開發(fā)領(lǐng)域,未來計劃延伸至機器人控制系統(tǒng)。
馬斯克在近期訪談中透露,xAI計劃在2026年底前推出"具有劃時代意義的人工智能生成游戲"。為支撐這一目標,公司正在組建名為"omni team"的跨模態(tài)技術(shù)團隊,該團隊將突破傳統(tǒng)文本處理框架,實現(xiàn)圖像、視頻、音頻的協(xié)同生成。目前公開的招聘崗位顯示,核心技術(shù)職位年薪區(qū)間達18萬至44萬美元,同時設(shè)有專門訓(xùn)練AI游戲設(shè)計系統(tǒng)的"視頻游戲?qū)?職位,時薪45至100美元。
與傳統(tǒng)視頻生成模型相比,世界模型的技術(shù)路徑存在本質(zhì)差異。以O(shè)penAI的Sora為代表的現(xiàn)有技術(shù),主要通過模式識別生成視頻幀;而世界模型需要建立對物理因果關(guān)系的深度理解,能夠?qū)崟r模擬物體在不同環(huán)境中的動態(tài)交互。這種技術(shù)躍遷被行業(yè)視為開啟AI實體化應(yīng)用的關(guān)鍵,英偉達此前向《金融時報》分析稱,該領(lǐng)域的市場潛力可能達到全球經(jīng)濟總量規(guī)模。
盡管技術(shù)前景備受期待,但世界模型的開發(fā)仍面臨重大挑戰(zhàn)。真實世界數(shù)據(jù)的采集與標注成本高昂,模擬環(huán)境的復(fù)雜性遠超現(xiàn)有訓(xùn)練框架。游戲產(chǎn)業(yè)資深人士對此持審慎態(tài)度,《博德之門3》發(fā)行主管Michael Douse指出,當(dāng)前行業(yè)更需要的是具有創(chuàng)造力的世界觀設(shè)計,而非單純依賴數(shù)學(xué)模型生成的游戲循環(huán)。這種觀點反映出技術(shù)落地過程中可能存在的產(chǎn)業(yè)認知差異。
目前xAI的研發(fā)進程已進入實操階段,其構(gòu)建的模型正在通過視頻數(shù)據(jù)和機器人操作記錄進行訓(xùn)練。這種多模態(tài)學(xué)習(xí)方式被認為能夠更真實地還原物理世界運行規(guī)律,但如何平衡技術(shù)可行性與商業(yè)應(yīng)用價值,仍將是決定項目成敗的關(guān)鍵因素。











