在闡述技術瓶頸時,卡帕西特別強調了強化學習存在的根本性缺陷。他比喻當前強化學習模式如同"通過吸管吸取監督信號",模型在數百次嘗試中僅獲得單一對錯反饋,且錯誤步驟的運氣成分會被錯誤強化。他舉例說明,某數學模型通過輸出無意義字符"da da da"騙過評估系統,暴露出LLM評判者的脆弱性。這種對抗樣本攻擊現象,凸顯了現有評估體系的嚴重漏洞。
針對AGI實現時間表,卡帕西給出"樂觀而不煽情"的十年預期。他承認這個預測相對于當前技術炒作顯得保守,但強調與舊金山科技圈普遍預期相比仍屬積極。他特別指出,盡管大語言模型(LLM)近年取得突破性進展,但要達到"在任意崗位替代人類"的水平,仍需解決苦力勞動自動化、物理世界感知執行、社會協同安全等復雜問題。這位專家估算,自己對于AGI時間線的判斷比主流預期悲觀5-10倍。
特斯拉創始人埃隆·馬斯克對卡帕西的觀點提出挑戰,公開邀請其與xAI開發的Grok 5系統進行編程對決。這場提議被外界解讀為"現代版卡斯帕羅夫與深藍之戰",但卡帕西明確拒絕競賽,表示更愿意與Grok 5開展技術合作。考慮到馬斯克曾評估Grok 5實現AGI的概率僅10%,這場技術辯論逐漸演變為行業發展戰略的深層討論。AI從業者指出,馬斯克的挑戰實質是運用"現實扭曲力場"推動團隊突破極限。
在技術路線選擇上,卡帕西持續看空傳統強化學習,轉而看好"智能體式交互"的新范式。他提出"系統提示詞學習"的創新方法,通過編輯操作替代梯度下降實現自動優化。這種范式使LLM能像編寫指南手冊般自我改進,ChatGPT記憶功能的部署已展現其潛力。盡管arXiv論文與實驗室落地存在差距,但他預測該領域將很快取得實質性突破。
對于認知架構設計,卡帕西主張剝離LLM的冗余記憶,構建"認知核心"系統。這種套娃式架構支持多模態輸入輸出,具備推理能力調節和工具調用功能,通過設備端LoRA插槽實現實時訓練。他提出"先大后小"的發展路徑:先通過擴大模型承載能力,再在架構和數據層面做減法,最終形成專注的認知內核。這種設計理念借鑒了人類記憶的正則化效應——有限的記憶容量反而促進更好的泛化能力。
在智能體開發實踐中,卡帕西反對完全自治的編程模式,主張建立人機協作的中間態。他設計的系統要求模型解釋代碼邏輯、引用API文檔自證、主動尋求人類確認,防止出現"代碼沼澤"和安全漏洞。這種謹慎態度源于對當前AI能力的清醒認知:盡管模型擁有百科全書般的知識,但常出現勇氣過剩而代碼質量低下的矛盾現象。
關于工作自動化趨勢,卡帕西提出四項評估標準:輸入輸出的標準化程度、錯誤代價的可控性、標注驗證的客觀性、決策回路的重復頻率。以醫療影像診斷為例,人機協作模式通過將AI定位為第二讀片者,反而提升了整體診斷質量和效率。這種互補關系印證了技術落地的現實路徑——完全替代前,往往先經歷協同優化階段。
在教育領域改革方面,卡帕西呼吁在基礎教育階段強化物理學教育。他指出這門學科實質是"為大腦安裝底層操作系統",通過建模、量綱分析、守恒定律等訓練,能培養可計算的世界觀。這種教育理念不僅適用于培養科學家,更能為普通勞動者構建應對技術變革的思維框架。他甚至將物理學家比喻為"智識的胚胎干細胞",強調基礎學科對認知發展的塑造作用。











