滾動資訊

當前位置：首頁 > 資訊 > 信息流 > 正文內容

OpenAI推出GPT-5.1-Codex-Max編程模型性能提升顯著助力開發效率

時間：2025-11-20 16:17:13 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

OpenAI近日正式推出全新智能體編程模型GPT-5.1-Codex-Max，在編程效率與交互能力方面實現重大突破。該模型不僅取代原有GPT-5.1-Codex成為Codex集成界面的默認選項，更在多項關鍵基準測試中超越谷歌Gemini 3 Pro，展現出強大的技術實力。

在SWE-Bench Verified測試中，Codex-Max以77.9%的準確率領先Gemini 3 Pro的76.2%，這項針對實際軟件問題解決的評估凸顯其工程實用性。Terminal-Bench 2.0測試進一步驗證其優勢，58.1%的準確率較對手的54.2%提升顯著。而在競爭激烈的LiveCodeBench Pro編碼Elo基準測試中，雙方以2439分持平的表現，印證了Codex-Max在高端編碼場景的競爭力。

核心技術層面，模型引入的"壓縮"機制成為最大亮點。這項創新架構允許系統在接近上下文窗口極限時，自動篩選關鍵信息并剔除冗余內容，使模型能夠持續處理數百萬token的復雜任務而不會出現性能衰減。內部測試顯示，該模型成功完成持續24小時以上的多步驟代碼重構與自主調試任務，同時將token使用效率提升約30%，有效降低計算成本與響應延遲。

開發工具集成方面，新模型已全面部署于OpenAI的Codex開發生態系統。工程師可通過官方命令行工具、代碼審查平臺及交互式編程環境直接調用模型能力。在可視化界面中，開發者甚至能進行強化學習訓練或光學定律模擬等高級操作，實時交互體驗獲得質的飛躍。雖然公共API尚未開放，但官方承諾即將推出，普通用戶需通過ChatGPT付費版本（Plus/Pro/企業版）獲取服務。

實際應用數據印證了技術升級的價值。OpenAI內部統計顯示，95%的工程師每周使用Codex工具后，平均拉取請求提交量提升70%，開發周期顯著縮短。為確保技術安全可控，模型默認運行于隔離沙盒環境，禁止網絡訪問權限，并自動生成包含終端日志與測試引用的詳細報告，方便人類開發者復核代碼質量。公司特別強調，該系統定位為輔助工具而非人類替代品，旨在通過人機協作提升開發效率。

這項突破性進展標志著AI編程工具進入新階段。從持續工作能力到成本控制，從安全機制到開發效率，Codex-Max在多個維度重新定義了智能編程助手的標準。隨著公共API的即將開放，全球開發者社區有望迎來新一輪生產力變革。

更多>同類資訊

歡聚集團2025年Q3業績亮眼：收入5.4億美元，多業務板塊增長強勁

11-20

大疆布局消費級3D打印領域：投資智能派科技共拓新市場

11-20

聲網2025年Q3財報：營收利潤雙增，客戶規模擴大，Q4展望樂觀

11-20

商務部：1—10月產業電商促轉型農產品農村網絡零售額雙增長

11-20

IDC預測：2025年智能眼鏡技術突破，2026年全球出貨量將超2368.7萬臺

11-20

嫦娥六號月背樣品新發現：月球“生銹”機制揭秘，深化月球演化認知

國家航天局公布，我國科研團隊近日通過分析嫦娥六號從月球背面南極-艾特肯盆地采回的樣品，首次發現大型撞擊事件成因的微米級赤鐵礦和磁赤鐵礦晶體，通俗地講就是“月球上的土壤和巖石也會‘生銹’”。本次研究發現了月…

11-20

矮星系藏宇宙“流浪客”：流浪黑洞或成解鎖早期奧秘的鑰匙

其中，編號為“ID 26”的黑洞在所有三個波段中都表現得非常明亮，而“ID 82”主要在X射線中可見，這可能是因為其光學信號被氣體和塵埃遮擋。盡管目前還不確定蒙大拿州的團隊是否提交了研究提案，但這一研究無疑為…

11-20

跨越130億光年：人類如何用科技觸碰宇宙最遙遠的“星光”？

“最遠”的判定，依賴人類觀測技術的邊界——宇宙膨脹效應下，遙遠天體的距離始終處于動態變化中，我們所說的“最遠”，本質是“當前觀測技術可探測到的最遙遠天體”。或許有一天，我們能觀測到宇宙誕生后1億年內形成的第一…

11-20

木星：龐大身軀下的“宇宙盾牌”，默默守護地球免受撞擊之災

而這一切混亂的集大成者，就是那顆著名的“大紅斑”，這是一場已經持續肆虐了至少300到400年的超級風暴，是太陽系中最大的反氣旋，盡管近年來它的體積有所縮小，但其規模之大，依然足以吞下3個完整的地球。當它飛掠…

11-20

太空旅游漸行漸近：亞軌道飛行票預售，5—10年后或更親民

據媒體報道，這次旅行是亞軌道飛行，預計2027年首飛，每張票價為150萬元，直播間特價100萬元，預售訂金5萬元，已經售罄。關于此次售賣的商品，該商業航天企業曾在微信公眾號上發布了產品概述——“亞軌道旅行飛…

11-20

神舟二十二號或25日發射，無人貨運新形態，為中國空間站添安全保障

神舟二十一號飛船和神舟二十號航天員乘組已經返回地球數日了，神舟二十二號飛船還沒有發射，空間站上三名航天員目前沒有返回飛船可用（神舟二十號因被撞擊有風險），可能大家也等得都有點心急了，不過目前來看發射日期也基本…

11-20

嫦娥六號月背樣品新發現：月球土壤巖石“生銹”，揭示氧化新機制

國家航天局公布，我國科研團隊近日通過分析嫦娥六號從月球背面南極-艾特肯盆地采回的樣品，首次發現大型撞擊事件成因的微米級赤鐵礦和磁赤鐵礦晶體，通俗地講就是“月球上的土壤和巖石也會‘生銹’”。本次研究發現了月…

11-20

倍杰特子公司擬2.25億收購大豪礦業55%股權拓展礦產開采加工業務

11-20

四季度FOF市場熱度攀升：發行端“小高峰”涌現存量規模重返2000億

11-20

俞敏洪南極來信遇冷：理想主義與現實職場代際價值觀的碰撞與對話

11-20

點擊查看更多 +

全站最新

理想汽車秋季戰略會深度反思：坦言效率放緩調整策略應對小米等對手沖擊

不到20個月50萬輛下線！小米汽車刷新紀錄，引領中國智能新能源產業鏈崛起

602天！小米汽車第50萬輛下線

雷軍重申小米汽車安全理念斥部分網友斷章取義歪曲其言論

雷軍：小米汽車50萬輛下線抓安全保品質加速生產 2025年交付或超40萬

科大訊飛牽手白馬星球：AI技術與商業場景融合，共繪智能經濟新藍圖

熱門內容

本欄最新

奇富科技2025年Q3財報：營收52億凈利14億，審慎應對宏觀挑戰謀長遠發展

閃送2025年三季度營收10.1億凈利潤增長8.7% 深耕場景優化騎手生態顯成效

閃送2025年Q3財報：營收10.1億，凈利同比增84%，聚焦核心顯成效

快手CFO金秉透露：可靈AI營收超預期，2025年將追加算力與資本開支

樂摩物聯沖刺港交所：機器按摩服務覆蓋超330城 8個月營收6.3億利潤微降

嘉楠科技2025年三季報：營收1.505億美元挖礦收入大增凈虧收窄至2774萬

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

OpenAI推出GPT-5.1-Codex-Max編程模型 性能提升顯著助力開發效率

OpenAI推出GPT-5.1-Codex-Max編程模型性能提升顯著助力開發效率