在人工智能大模型領域,競爭的火藥味愈發濃烈。OpenAI與谷歌等科技巨頭正展開一場激烈的角逐,不斷推出新產品和新技術,試圖在這場變革中占據領先地位。
OpenAI近期正式上線了GPT-5.2,這一動作被視為其鞏固市場地位的重要舉措。此次發布的GPT-5.2包含Instant、Thinking和Pro三款不同層級的模型,旨在滿足不同用戶的需求。OpenAI宣稱,GPT-5.2在專業工作方面表現卓越,其Thinking模型被認為是最能勝任各類現實專業用途的模型。在博士級別的專家推理評估GPQA Diamond中,該模型得分高達92.4%,在最新美國數學邀請賽(AIME2025)中更是拿到滿分。在GDPval測試中,Thinking模型也獲得了70.9%的高分,領先于競爭對手。
在實際應用場景中,GPT-5.2也展現出了強大的能力。它可以制作表格、整理分析數據、制作項目流程圖,在編寫代碼、制作PPT、圖像感知、理解長上下文、使用工具以及處理復雜的多步驟項目方面都表現出色,錯誤率較前代產品大幅降低。一些使用者給予其“最強AI打工人”“職場最佳拍檔”等稱號,對其在實際工作中的表現給予了肯定。
然而,GPT-5.2也面臨著一些挑戰。在輸入輸出價格方面,它比前代貴了40%,輸入價格21美元,輸出價格高達168美元。這一價格調整引發了一些擔憂,此前OpenAI堆算力發展大模型的做法就已受到質疑,此次價格上漲可能會進一步加劇市場的質疑。一些用戶反映Thinking和PRO的應答時間明顯較慢,甚至比前代產品還要慢,這對于逐漸嵌入日常生活和工作的AI產品來說,可能會影響用戶體驗。普通即時版GPT-5.2在一些常識問題上犯錯,也引發了用戶的吐槽。
就在OpenAI發布GPT-5.2的同時,谷歌也展開了反擊。谷歌搶在GPT-5.2前一個小時左右進行了產品更新,宣布其深度研究智能體Gemini Deep Research全面增強,并首次向開發者開放。Gemini Deep Research基于Gemini 3 PRO構建,通過多步強化學習訓練,顯著減少了“幻覺”,在復雜研究任務中表現出更高精度。在人類終極大考(HLE)中,Gemini Deep Research得到46.4%分,比GPT-5.2 Thinking的45.5%要高,僅低于GPT-5 Pro的50%。而且,其成本極低,谷歌產品經理透露,新版智能體在與GPT-5 Pro表現相當的同時,成本僅為后者的十分之一左右,展現出強大的性價比優勢。
谷歌還同步開源了基準測試工具DeepSearchQA,包含覆蓋17個領域的900項復雜任務,為科學評估研究型智能體的能力提供了支持。谷歌憑借更好的性價比、另辟蹊徑的訓練模式、強大的現金流以及自研專用芯片等優勢,持續給OpenAI帶來壓力。
除了谷歌,OpenAI還面臨著其他競爭對手的挑戰。Anthropic等公司也在不斷推出新產品,meta和DeepSeek等競爭者同樣有著令人期待的新品可能面世。此前有消息稱,OpenAI在加速開發自身全新的模型“Garlic”,試圖通過新的方式重建絕對領先的優勢。
在這場大模型之爭中,AI芯片也扮演著重要的角色。英偉達最近與美銀舉辦了一次投資者線上交流會,英偉達方面提到,只依據Gemini 3的表現比GPT5更優,就認為谷歌自研的TPU要好于英偉達的GPU是不合理的。目前大部分的大模型都是用上一代H系列芯片訓練的,用Blackwell訓練的大模型要到2026年才會上線,其優勢到時才會顯現,更不用說還未投入使用的新一代超級芯片Rubin。市場對英偉達的說法看法不一,但這場關于AI芯片的討論也讓明年的大模型之爭更加引人關注。
隨著各大科技巨頭不斷推出新產品和新技術,AI大模型領域的競爭愈發激烈。這場競爭不僅關乎大模型的能力,還涉及到大模型的訓練、發展路徑以及AI芯片的未來走向。2026年,這場激烈的競爭預計還將繼續升級,各方的表現值得期待。






