人工智能領(lǐng)域正經(jīng)歷一場靜悄悄的范式革命。當(dāng)圖靈獎(jiǎng)得主Yann LeCun與Richard Sutton公開質(zhì)疑大語言模型發(fā)展路徑時(shí),Transformer架構(gòu)聯(lián)合發(fā)明人、OpenAI研究員?ukasz Kaiser以全新視角展開回應(yīng)。這場關(guān)于技術(shù)路線的爭論,折射出AI發(fā)展從數(shù)據(jù)驅(qū)動(dòng)向推理驅(qū)動(dòng)的關(guān)鍵轉(zhuǎn)折。
在硅谷追逐通用人工智能(AGI)的熱潮中,OpenAI的Scaling路線引發(fā)持續(xù)爭議。經(jīng)濟(jì)學(xué)家Tyler Cowen將2025年4月16日定義為"AGI誕生日",但這種樂觀預(yù)測遭遇多位頂尖學(xué)者質(zhì)疑。強(qiáng)化學(xué)習(xí)之父Richard Sutton斷言現(xiàn)有大模型已觸及能力天花板,其改進(jìn)空間遠(yuǎn)比行業(yè)預(yù)期狹窄。開源深度學(xué)習(xí)框架Keras創(chuàng)始人Fran?ois Chollet更發(fā)起百萬美元ARC Prize競賽,試圖引導(dǎo)研究回歸"正確路徑"。
面對質(zhì)疑,?ukasz Kaiser提出截然不同的技術(shù)演進(jìn)圖景。他指出推理模型正在突破傳統(tǒng)訓(xùn)練范式:這類模型所需數(shù)據(jù)量較前代降低數(shù)個(gè)數(shù)量級(jí),卻能在數(shù)學(xué)推理、代碼分析等復(fù)雜任務(wù)中展現(xiàn)驚人能力。OpenAI首個(gè)推理模型o1在結(jié)構(gòu)化任務(wù)中的表現(xiàn),已顯著超越通用模型GPT-4o。這種"先思考后回答"的機(jī)制,使AI開始具備解決實(shí)際問題的能力——從撰寫報(bào)告到代碼審查,從數(shù)據(jù)庫核對到漏洞發(fā)現(xiàn)。
技術(shù)突破的背后是算力與能源的雙重約束。Kaiser坦言,當(dāng)前所有實(shí)驗(yàn)室都面臨GPU資源短缺的普遍困境,這解釋了奧特曼持續(xù)融資的深層動(dòng)因。但不同于數(shù)據(jù)瓶頸的不可逆性,他認(rèn)為算力限制只是階段性挑戰(zhàn)。隨著推理模型效率提升,單位算力能支撐更復(fù)雜的認(rèn)知任務(wù),這種技術(shù)杠桿效應(yīng)將重塑AI發(fā)展軌跡。
編程領(lǐng)域的變革最具說服力。Claude 3.5發(fā)布時(shí)在SWE-Bench基準(zhǔn)測試中僅取得30%通過率,短短一年后這個(gè)數(shù)字躍升至75%。現(xiàn)代AI代碼模型不僅能理解大型代碼庫,更能進(jìn)行跨文件推理、發(fā)現(xiàn)隱蔽漏洞。這種指數(shù)級(jí)進(jìn)步使開發(fā)者開始重新評估人機(jī)協(xié)作模式——AI不再僅是輔助工具,而是能獨(dú)立承擔(dān)復(fù)雜項(xiàng)目的生產(chǎn)力引擎。
多模態(tài)訓(xùn)練的突破為推理能力注入新維度。通過將音頻、圖像編碼為離散token,神經(jīng)網(wǎng)絡(luò)已掌握跨模態(tài)生成能力。盡管視頻訓(xùn)練面臨數(shù)據(jù)冗余挑戰(zhàn),但Kaiser強(qiáng)調(diào)AI需要發(fā)展"重點(diǎn)提取"機(jī)制,自動(dòng)識(shí)別運(yùn)動(dòng)軌跡、因果關(guān)系等關(guān)鍵信息。這種對物理世界的理解能力,將成為實(shí)用機(jī)器人技術(shù)的突破口。谷歌Gemini 1.5 Robotics的實(shí)驗(yàn)已展示初步成果:結(jié)合視覺感知的推理系統(tǒng),正在讓機(jī)器人具備"慢思考"與"快反應(yīng)"的雙重能力。
這位波蘭裔科學(xué)家的人生軌跡頗具戲劇性。16歲時(shí)為AGI概念提出者Ben Goertzel編寫程序,博士階段攻讀自動(dòng)機(jī)理論,卻在谷歌大腦團(tuán)隊(duì)期間轉(zhuǎn)向深度學(xué)習(xí)研究。作為Transformer架構(gòu)的聯(lián)合發(fā)明人,他先后參與TensorFlow系統(tǒng)開發(fā)和Trax庫構(gòu)建,見證了AI從符號(hào)推理到神經(jīng)網(wǎng)絡(luò)的范式轉(zhuǎn)變。如今他帶領(lǐng)團(tuán)隊(duì)探索的推理模型,或許正在開啟第三個(gè)技術(shù)紀(jì)元。
當(dāng)行業(yè)爭論AGI是否到來時(shí),Kaiser更關(guān)注技術(shù)落地的實(shí)質(zhì)進(jìn)展。他觀察到企業(yè)開始將核心業(yè)務(wù)委托給AI處理,這種信任建立在實(shí)際效能而非概念炒作之上。從代碼生成到科研輔助,從醫(yī)療診斷到金融分析,推理模型正在重塑知識(shí)工作的價(jià)值鏈條。這種變革或許比AGI的哲學(xué)爭論更具現(xiàn)實(shí)意義——當(dāng)機(jī)器開始真正"思考",人類與智能的邊界注定要重新定義。











