OpenAI在發布GPT-5.2系列模型后迅速推出新一代智能體編碼模型GPT-5.2-Codex,該模型以專業軟件工程和防御性網絡安全為核心突破方向,旨在強化其在AI編程領域的技術優勢。根據官方披露,新模型在編碼性能、網絡安全能力及長周期任務處理方面實現顯著提升,已在付費ChatGPT用戶端全面上線,API接口開放工作正在推進中。
技術測試數據顯示,GPT-5.2-Codex在兩項權威基準測試中刷新紀錄:SWE-Bench Pro測試準確率達56.4%,Terminal-Bench 2.0測試準確率達64.0%。相較于前代模型GPT-5.2(55.6%)和GPT-5.1(50.8%),新模型在解決實際軟件工程任務和真實終端環境操作方面的表現均有提升。OpenAI特別指出,該模型通過上下文壓縮技術優化了長周期工作能力,在代碼重構、系統遷移等復雜項目中展現出更強的穩定性。
網絡安全領域成為此次升級的重點方向。OpenAI披露,從GPT-5-Codex到GPT-5.2-Codex歷經三次能力躍升,新模型已具備解決專業級多步驟安全挑戰的能力。盡管尚未達到"高"級別網絡安全標準,但公司正按照未來模型可能突破該門檻的規格進行規劃。一個典型案例顯示,安全研究人員使用上一代模型GPT-5.1-Codex-Max時,意外發現React框架中三個未知漏洞并協助修復,凸顯AI在防御性安全中的實用價值。
針對模型能力提升帶來的潛在風險,OpenAI推出多重防護機制。在技術層面,新模型集成了專門的安全訓練模塊、智能體沙箱環境和可配置網絡訪問控制;在應用層面,公司啟動"可信訪問計劃"試點,僅向通過審查的安全專業人員和機構開放高級權限。參與該計劃的主體可合法開展漏洞研究、紅隊測試等雙重用途工作,同時解除傳統安全研究中模擬攻擊行為時的操作限制。
OpenAI首席執行官Sam Altman在社交平臺強調,新模型標志著AI技術進入"真實影響階段"。他透露,團隊正在招聘網絡安全領域專業人才,計劃通過持續迭代使Codex系列模型在明年實現百倍性能提升。目前付費用戶已可通過Codex界面體驗新功能,API接口預計在未來數周內完成安全部署并向開發者開放。
行業觀察人士指出,OpenAI此次升級直指谷歌Gemini系列模型的競爭軟肋。上周發布的GPT-5.2Thinking版本已在編碼能力測試中超越人類專家水平,此次針對性強化網絡安全和大規模項目處理能力,進一步鞏固了其在AI編程工具市場的領先地位。隨著可信訪問計劃的實施,專業安全團隊將獲得更強大的技術支撐,但如何平衡創新速度與風險管控仍是行業面臨的共同挑戰。










