當公眾還在討論AI代碼出錯、效率低下時,實驗室里的研究者卻目睹著另一番景象——AI不僅能獨立完成復雜任務,其能力曲線更以驚人的指數速度攀升。AlphaGo與AlphaZero核心開發者Julian Schrittwieser近日公開警告:人類對AI的認知,已與前沿現實脫節至少一個技術世代。
Julian以新冠疫情初期為喻:2020年全球對病毒傳播的認知滯后,導致防疫措施被動;如今AI的發展正面臨同樣的認知鴻溝。他指出,大眾緊盯模型出錯細節便斷言"AI不過如此",卻忽視了三年前AI寫程序還被視為科幻的現實。"我們正在重復疫情初期的錯誤——用線性思維理解指數級變化。"
支撐這一觀點的,是METR機構最新研究數據。該機構通過測量AI自主完成真實任務的時長發現:Claude 3.7 Sonnet已能持續處理1小時軟件工程任務,且能力曲線每7個月翻倍。更震撼的是,Grok 4、Claude Opus 4.1等新模型已突破2小時大關。按照當前趨勢推算,2026年年中AI將具備8小時連續工作能力,2027年更可能在特定領域超越人類專家。
跨行業評測進一步驗證了這一趨勢。OpenAI的GDPval項目對44個職業、9大行業的1320項真實任務進行測試,結果顯示GPT-5在多數職業任務中已接近人類水平,而發布更早的Claude Opus 4.1甚至在多個維度超越GPT-5,接近行業專家表現。值得注意的是,測試任務由平均14年經驗的專家設計,且采用盲評方式——評審僅看結果,不知作者是人類還是AI。
盡管數據令人振奮,質疑聲也隨之而來。技術評論員Atharva Raykar指出,將AI發展類比病毒傳播存在風險:"疫情擴散有生物學機制支撐,而AI進步依賴持續的技術突破。如果沒有推理模型等關鍵創新,能力曲線可能早已停滯。"他同時強調,當前測試任務復雜度較低(平均3/16分),遠不及現實工程項目的7-16分區間,這可能導致對AI真實能力的高估。
面對質疑,Julian承認評測體系存在局限,但強調短期趨勢(1-2年)的可靠性。"問題不在于曲線是否會突然轉折,而在于社會是否為可能到來的變革做好準備。"他預測,到2026年底,將有模型在多個行業達到人類專家水平;2027年后,AI可能在垂直領域頻繁超越人類,成為生產力主力。
對于AI的未來,Julian描繪了更積極的圖景:人類作為指揮者,身邊環繞數十甚至上百個AI助手。這種協作模式不是簡單的效率提升,而是可能帶來10倍、100倍的生產力飛躍。"科研、醫療、法律、金融——所有行業都將因此重組。"他強調,這不是"AI取代人類"的零和博弈,而是"人類與超強工具共舞"的新時代。
當前的數據顯示,AI能力正以每7個月翻倍的速度進化。按照這一軌跡,2026年或許將成為關鍵轉折點——AI不再局限于實驗室,而是真正走入各行各業,改寫經濟運行的基本邏輯。當這一天到來時,每個人都需要思考:是抗拒變化,還是成為首批與AI團隊并肩工作的人?







