在全球科技巨頭紛紛加碼大語言模型(LLM)的浪潮中,圖靈獎得主、meta首席AI科學家Yann LeCun卻選擇了一條截然不同的道路。這位被譽為“AI教父”的學者宣布,將于年底結束在meta長達12年的任職,轉而投身創業,致力于開發能夠理解物理世界的機器智能系統。
LeCun的離職并非突然之舉。早在數月前,他便多次公開質疑LLM的技術路線,認為這類基于文本生成的模型雖在語言處理領域表現卓越,卻缺乏對真實世界的認知能力。他指出,當前AI系統在記憶存儲、多步推理等方面存在明顯短板,僅靠擴大模型規模無法實現真正的通用人工智能(AGI)。
在巴黎舉辦的AI-Pulse活動上,LeCun進一步闡述了他的技術愿景。他強調,自主機器智能需要建立在“世界模型”基礎之上——這種模型通過視覺等感官信息訓練,能夠預測物理世界的演變規律。與之形成對比的是,LLM更像是“文本生成器”,屬于快速反應的System 1系統,而非具備深度推理能力的System 2系統。
這位學者對技術路線的堅持,與meta的戰略方向產生了顯著分歧。盡管公司CEO馬克·扎克伯格曾公開表示支持,但實際行動卻頗為謹慎。LeCun透露,meta并未參與其新創業項目的投資,雙方在技術路徑上的分歧已難以調和。這種矛盾在meta近期重金招募LLM專家的舉措中體現得尤為明顯——公司不惜代價從競爭對手處挖角,甚至由扎克伯格親自出面挽留人才。
LeCun的技術理念可追溯至十年前。他長期主張,真正的機器智能應當模仿人類嬰兒的學習方式:通過觀察和互動構建對世界的認知模型。為此,他帶領團隊開發了非生成式的聯合嵌入預測架構(JEPA),這種系統能夠學習現實世界的結構特征,并預測不同行動可能產生的結果。相較于依賴自回歸機制的LLM,JEPA架構更接近人類認知世界的模式。
在具體實踐層面,LeCun的團隊不僅使用視頻數據,還引入電子游戲等交互式場景進行模型訓練。他解釋稱,單純依賴視頻數據存在局限性——就像觀看夢境般缺乏參與感,而真正的智能需要具備預測不同行動后果的能力。這種思路與當前主流的“視頻模型”形成鮮明對比,體現了其對交互式學習的高度重視。
這位學者的技術主張引發了行業廣泛討論。支持者認為,他指出了當前AI發展的瓶頸;反對者則質疑,放棄已被驗證的LLM路線是否明智。市場對此反應敏感:在LeCun離職消息傳出后,meta股價短暫下跌2%,反映出投資者對公司技術方向調整的擔憂。










