當其他科技公司還在大模型領域激烈競爭時,OpenAI悄然發布了一款名為Sora2的全新視頻生成系統,并同步推出了配套的iOS社交應用。這一動作被OpenAI首席執行官Altman稱為“創意領域的ChatGPT時刻”,標志著視頻生成技術進入了一個全新的階段。
據OpenAI介紹,Sora2在物理準確性、真實感和可控性方面實現了顯著突破。與初代Sora相比,新一代系統能夠更精準地模擬現實世界的物理規律,例如浮力、剛性和物體恒存性等復雜現象。在官方演示中,Sora2成功呈現了奧運體操動作、槳板后空翻等高難度場景,甚至能模擬小貓抓握物體完成三周半跳的細節。這些能力在之前的視頻生成模型中幾乎無法實現。
技術團隊指出,Sora2的核心突破在于掌握了大規模視頻數據的預訓練和后訓練技術。這一里程碑式的進展,使系統能夠深度理解物理世界的運行規律。與語言模型相比,視頻領域的此類技術仍處于起步階段,但Sora2的發布意味著該領域正加速邁向成熟。OpenAI認為,這類系統對于訓練能真正理解現實世界的AI模型至關重要。
在可控性方面,Sora2展現了驚人的進步。系統能夠精準遵循復雜的多鏡頭指令,同時保持世界狀態的一致性。無論是寫實風格、電影級畫面還是動漫效果,Sora2都能輕松駕馭。更引人注目的是其同步的對話和音效生成能力,作為通用視頻音頻系統,它能創建高度真實的背景音、語音和音效,為內容創作者提供了前所未有的工具。
OpenAI特別強調了Sora2的“現實注入”功能。通過分析用戶提供的視頻素材,系統能將任何人、動物或物體精準地融入生成的場景中,并完美復現其外貌和聲音特征。這種通用能力為個性化內容創作開辟了新可能。盡管系統仍存在不完美之處,但OpenAI認為,通過進一步擴大神經網絡規模,視頻生成技術將更接近真實世界的模擬。
伴隨Sora2的發布,OpenAI同步推出了名為“Sora”的iOS社交應用。這款應用允許用戶創作原創視頻、基于他人作品進行二次創作,并通過可定制的信息流發現新內容。最受關注的“客串”功能讓用戶能將自己的形象高度逼真地融入任何場景。為保護用戶權益,應用提供了嚴格的形象使用權管理,用戶可隨時撤銷授權或刪除含自己形象的視頻。
針對視頻平臺常見的成癮性問題,OpenAI采取了一系列創新措施。他們開發了基于自然語言的推薦算法,允許用戶通過指令定制內容推薦。系統會定期詢問用戶身心健康狀況,并提供調整動態消息的選項。與傳統平臺不同,Sora應用默認優先展示用戶關注者的內容,以及可能激發創作靈感的視頻,而非單純優化用戶停留時間。OpenAI明確表示,應用設計旨在促進創作而非被動消費。











