滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

GPT-5.2強勢登場：能力大提升反超谷歌Gemini 3 Pro，北大數學人才成核心力量

時間：2025-12-13 06:51:09 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

OpenAI近日發布GPT-5.2系列模型，在實用功能與專業領域表現上實現全面突破。這款新模型不僅延續了前代版本的技術優勢，更在辦公效率、代碼開發、科學研究和復雜任務處理等場景中展現出顯著提升，引發行業廣泛關注。

在辦公場景中，GPT-5.2的"打工能力"得到專項強化。測試數據顯示，其Thinking版本在人力資源表格制作、PPT設計等任務中，效率較前代提升超過30%。面對航班延誤、轉機錯過等復雜行程問題，該模型能自動完成機票改簽、特殊座位安排及賠償申請等全流程操作。投行分析師實測表明，在構建企業財務模型任務中，其得分從59.1%躍升至68.4%，能精準處理三表聯動、杠桿收購等高級建模需求。

代碼開發領域迎來新紀錄。在涵蓋Python、Java、Typescript和Go的SWE-Bench Pro評測中，GPT-5.2 Thinking取得55.6%的得分，特別在前端開發及3D UI設計方面表現突出。早期測試者反饋，該模型能高效處理復雜交互界面，顯著減少開發周期。長文檔處理能力同樣突破性進展，在256k上下文長度的測試中，模型準確率接近100%，雖在8倍長度測試中性能有所下降，但通過簡潔回復模式仍可維持高效工作流。

科學輔助能力成為最大亮點。在研究生水平問答評測GPQA Diamond中，Pro版本以93.2%的準確率領先行業，FrontierMath數學評測解題率達40.3%。實際案例顯示，該模型已能參與統計學習理論的前沿研究，其提出的證明方案經同行評審驗證有效。視覺理解方面，模型對科學圖表的分析錯誤率降低50%，配合Python工具在高分辨率圖形推理測試中得分86.3%。

工具調用能力測試中，GPT-5.2在電信客服場景取得98.7%的準確率，零售場景達82%，展現出強大的端到端問題解決能力。經濟價值評估顯示，在GDPval測試覆蓋的44個職業領域中，模型完成人類需4-8小時任務的速度是專家的11倍，成本不足百分之一，且71%的任務成果達到專業水平。事實準確性方面，幻覺問題發生率從8.8%降至6.2%，但官方仍建議關鍵內容需人工復核。

核心研發團隊呈現新特征。公開信息顯示，主導此次升級的科學家多為2024年后加入的新成員，包括北大數學系校友、斯坦福統計學博士Yu Bai，UC伯克利博士Yaodong Yu等數學專業背景人才。這種人才結構變化，或許解釋了模型在科學計算和復雜邏輯推理方面的顯著進步。目前用戶可通過ChatGPT的Plus、Pro等套餐體驗新功能，生成復雜內容約需數分鐘處理時間。

更多>同類資訊

OpenAI推出GPT-5.2：三版本精準匹配需求，職場效率革新生產力飆升

此舉距上一代GPT-5.1發布不足一月，背后是谷歌Gemini 3引發的“紅色警報”競爭壓力——OpenAI此前緊急叫停廣告、資訊等側項目，將所有資源集中于主模型研發，最終以“職場效率革新”為核心，交出這款…

12-13

扎克伯格煲湯挖OpenAI人才碰壁，OpenAI憑獨特文化與技術戰略穩住核心

更有意思的是，OpenAI首席研究官MarkChen壓根沒慫，直接“以彼之道還施彼身”，也給Meta看中的人才送湯，甚至計劃帶核心團隊去學烹飪，準備打一場“送飯持久戰”。兩年多前更絕，行業主流都覺得預訓練…

12-13

宇樹智元爭春晚贊助席位？智元否認，兩大機器人巨頭資本動作引關注

智元機器人率先開價6000萬元，而宇樹科技直接將報價拉升至1億元。宇樹方面暫無公開表態。今年11月15日，宇樹科技披露IPO輔導工作完成報告。公開資料顯示，宇樹科技是一家專注于消費級、行業級高性能四足機器人…

12-13

榮耀高管聯動AG一諾曝光，“榮耀WIN”真機亮相或深耕電競市場

根據IT之家 11 日的報道，數碼博主 @復讀機002 曾披露一張疑似京東商詳頁截圖，顯示原定發布的榮耀 GT2 已更名為榮耀 WIN系列，并打出了“超神性能雙旗艦”的口號。AG 一諾作為職業電競領域的頂…

12-13

小米回應“不讓賣小米”謠言涉事村支書道歉蹭流量應有底線

今天下午，該事件當事人馮玉寬在抖音賬號「小馮來助農」發布了道歉視頻，說自己的視頻給小米公司造成了影響，浪費了社會資源，以后會規范網絡言行，向大家表示誠摯歉意。小米作為農產品名稱當然可以用，但你模仿人家高管…

12-13

三星攜三折疊新機強勢登場，配置拉滿，與華為同價對決誰能勝出？

智能手機市場的軍備競賽從未停歇，而華為最強勁的對手之一三星，終于攜其首款量產三折疊屏手機三星 Galaxy Z TriFold，向著折疊屏的巔峰王座發起了強有力的挑戰，這是被視為三星“技術集大成者”的超級旗艦…

12-13

小米汽車“現車選購”新增準新車，雷軍回應：沿用同行叫法并非首創

IT之家12月12日消息，今早11點，小米汽車「現車選購」新增準新車上架開售，可在小米汽車App選購。對于“準新車”的說法，小米官方稱是曾因運輸等原因產生維修項的原廠新車，并已完成官方修復及售前附加檢驗。此外…

12-13

殺入“兩田”老家，廣汽計劃明年夏季進軍日本市場

12-13

小米官方澄清“小米公司不讓賣小米”：是徹頭徹尾的歪曲與污蔑

12-13

馬斯克霸氣回懟Waymo：連對抗特斯拉的機會都沒有

12-13

中國首個太空計算實驗室落戶上海交大

12-13

禾賽科技將于CES 2026發布L3級別遠距激光雷達

12-13

“小米公司不讓賣小米”事件當事人道歉

12-13

北京市網信辦通報：“東北雨姐”“貓一杯”等轉世賬號被關閉

12-13

谷歌聯手 Xreal 發布 Project Aura，中國團隊成核心力量

12-13

點擊查看更多 +

全站最新

吉利全球全域安全中心亮相：創多項紀錄開放共享并發布白皮書

小米汽車“現車選購”新增準新車，雷軍回應：沿用同行叫法并非首創

小米汽車現車選購再添新選擇雷軍詳解準新車：運輸致損后經官方修復檢驗

小米汽車上架準新車雷軍回應：官方修復質檢嚴格產能提升促交付

廣發證券“出海”步履不停：三地聯動筑網絡，全球資產配置服務顯成效

時代浪潮中，穩健前行：手握底牌，方能笑對風云變幻

熱門內容

本欄最新

小米汽車“現車選購”新增準新車，雷軍回應：沿用同行叫法并非首創

小米汽車現車選購再添新選擇雷軍詳解準新車：運輸致損后經官方修復檢驗

小米汽車上架準新車雷軍回應：官方修復質檢嚴格產能提升促交付

廣發證券“出海”步履不停：三地聯動筑網絡，全球資產配置服務顯成效

時代浪潮中，穩健前行：手握底牌，方能笑對風云變幻

寒潮來襲羽絨服市場亂象頻出：高校爆款與質量隱患并存引關注

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

GPT-5.2強勢登場：能力大提升反超谷歌Gemini 3 Pro，北大數學人才成核心力量