近期,人工智能領(lǐng)域正經(jīng)歷一場(chǎng)靜默卻意義深遠(yuǎn)的范式變革。Transformer架構(gòu)聯(lián)合發(fā)明者、現(xiàn)任OpenAI研究科學(xué)家的?ukasz Kaiser在訪談中指出,當(dāng)前AI發(fā)展并非陷入停滯,而是從預(yù)訓(xùn)練階段向推理模型階段過(guò)渡,這種轉(zhuǎn)變的影響力堪比Transformer的誕生。
針對(duì)外界關(guān)于"AI增長(zhǎng)放緩"的質(zhì)疑,Kaiser通過(guò)內(nèi)部視角給出解釋:AI能力提升遵循指數(shù)級(jí)增長(zhǎng)曲線,如同摩爾定律在芯片領(lǐng)域的持續(xù)生效。當(dāng)前技術(shù)迭代速度看似減緩,實(shí)則因底層范式轉(zhuǎn)換導(dǎo)致——預(yù)訓(xùn)練技術(shù)雖未失效,但已進(jìn)入投入產(chǎn)出比下降的階段,行業(yè)資源正轉(zhuǎn)向更具成本效益的推理模型。這種轉(zhuǎn)變導(dǎo)致公眾感知滯后,未察覺(jué)到技術(shù)本質(zhì)的飛躍。
推理模型的核心特征在于引入思維鏈機(jī)制。不同于傳統(tǒng)模型直接輸出結(jié)果,新范式允許模型在生成答案前進(jìn)行多步驟推理,并可調(diào)用外部工具輔助決策。以編程領(lǐng)域?yàn)槔珻odex已改變開發(fā)者工作模式,程序員現(xiàn)在更傾向于先由模型生成基礎(chǔ)代碼,再進(jìn)行人工優(yōu)化。這種協(xié)作方式雖未引發(fā)廣泛關(guān)注,卻標(biāo)志著生產(chǎn)力的根本性提升。
強(qiáng)化學(xué)習(xí)技術(shù)的突破為推理模型發(fā)展提供關(guān)鍵支撐。通過(guò)獎(jiǎng)勵(lì)機(jī)制驅(qū)動(dòng)的自我優(yōu)化,模型能夠自主糾正錯(cuò)誤并改進(jìn)輸出質(zhì)量。Kaiser透露,OpenAI正在探索更復(fù)雜的強(qiáng)化學(xué)習(xí)架構(gòu),包括利用大模型評(píng)估答案質(zhì)量、融入人類偏好數(shù)據(jù)等方向。這種技術(shù)演進(jìn)使得模型不僅能處理文本數(shù)據(jù),更在多模態(tài)推理領(lǐng)域取得初步進(jìn)展,例如Gemini已具備推理過(guò)程中生成圖像的能力。
關(guān)于GPT-5.1的版本更新,Kaiser揭示了命名規(guī)則背后的戰(zhàn)略調(diào)整。新版本看似微小迭代,實(shí)則聚焦穩(wěn)定性提升與用戶體驗(yàn)優(yōu)化:通過(guò)強(qiáng)化后訓(xùn)練階段的安全機(jī)制、減少幻覺(jué)輸出,并引入風(fēng)格定制功能。內(nèi)部開發(fā)模式也發(fā)生轉(zhuǎn)變,預(yù)訓(xùn)練、強(qiáng)化學(xué)習(xí)等多個(gè)項(xiàng)目并行推進(jìn),最終通過(guò)知識(shí)蒸餾技術(shù)整合到統(tǒng)一模型中。這種敏捷開發(fā)方式使OpenAI能夠快速響應(yīng)市場(chǎng)需求,但Kaiser坦承當(dāng)前模型在多模態(tài)遷移能力上仍存在短板。
追溯技術(shù)起源,Kaiser回顧了Transformer的誕生歷程。這位理論計(jì)算機(jī)科學(xué)博士在德國(guó)完成學(xué)業(yè)后,先后任職于法國(guó)學(xué)術(shù)界和谷歌Brain團(tuán)隊(duì)。他透露,Transformer論文的八位作者從未線下會(huì)面,通過(guò)分布式協(xié)作完成了這項(xiàng)顛覆性創(chuàng)新。當(dāng)時(shí)學(xué)界普遍質(zhì)疑通用模型處理多任務(wù)的能力,而團(tuán)隊(duì)堅(jiān)持的注意力機(jī)制最終證明其前瞻性。這種技術(shù)信念促使Kaiser在2018年追隨Ilya Sutskever加入OpenAI,參與構(gòu)建更具靈活性的研發(fā)體系。
在資源分配方面,OpenAI內(nèi)部形成獨(dú)特競(jìng)爭(zhēng)機(jī)制。預(yù)訓(xùn)練項(xiàng)目因計(jì)算需求龐大占據(jù)主要GPU資源,強(qiáng)化學(xué)習(xí)與視頻模型緊隨其后。Kaiser所在的團(tuán)隊(duì)采用項(xiàng)目制運(yùn)作,成員根據(jù)技術(shù)方向自發(fā)組隊(duì),這種模式既保證創(chuàng)新效率,也帶來(lái)資源爭(zhēng)奪的挑戰(zhàn)。他特別指出,多模態(tài)推理與具身智能的融合將成為下一個(gè)突破口,家用機(jī)器人可能引發(fā)比ChatGPT更直觀的技術(shù)革命。
對(duì)于AI就業(yè)影響,Kaiser持審慎樂(lè)觀態(tài)度。他以翻譯行業(yè)為例說(shuō)明:盡管機(jī)器翻譯已能處理多數(shù)語(yǔ)言轉(zhuǎn)換任務(wù),但高風(fēng)險(xiǎn)場(chǎng)景仍需人類專家把關(guān)。這種協(xié)作模式將重塑職業(yè)結(jié)構(gòu)而非消除工作崗位,基礎(chǔ)性工作自動(dòng)化程度提升的同時(shí),也會(huì)催生新的專業(yè)需求。隨著多模態(tài)推理能力的突破,機(jī)器人技術(shù)有望在物理世界實(shí)現(xiàn)類似ChatGPT的認(rèn)知躍遷,硅谷企業(yè)正在研發(fā)的智能硬件或?qū)⒓铀龠@一進(jìn)程。











