谷歌旗下人工智能模型Gemini 3近日迎來重大升級,其深度思考模式Deep Think正式面向特定用戶群體開放。這一模式以顯著強化的推理能力為核心,在處理復雜多步驟任務、創新性問題和科學計算領域展現出突破性表現,成為當前大模型技術競爭中的焦點。
在衡量通用智能核心能力的權威基準測試ARC-AGI中,Deep Think模式在兩個子榜單中均登頂榜首。其中基礎抽象推理測試(ARC-AGI-1)中,該模型以87.5%的準確率超越GPT-5系列和Claude Opus 4.5等競爭對手。在更復雜的高階推理測試(ARC-AGI-2)中,其正確率達到45.1%,較非深度思考版本的Gemini 3 Pro提升14個百分點,而GPT-5 Pro在該測試中僅取得18.3%的成績。
該模型在跨學科綜合測試Humanity’s Last Exam(HLE)和量子物理專項測試GPQA Diamond中同樣表現卓越。HLE測試聚焦復雜邏輯與多步驟推理能力,GPQA Diamond則被視為檢驗模型科學理解力的"金標準"。這兩項測試的領先成績,印證了Deep Think在抽象推理與科學知識深度理解方面的雙重突破。
社交媒體反饋顯示,用戶對Deep Think模式的實際表現給予高度評價。有開發者稱該模型成功解決了困擾其數日的棧溢出錯誤,指出答案清晰度優于公開模型中唯一能處理同類問題的Opus 4.5。另有用戶特別贊賞其在創意場景生成任務中的表現,認為輸出質量達到前所未有的水準。不過也有使用者反饋,當前版本存在運行速度較慢的問題,期待后續優化。
谷歌DeepMind同步宣布在新加坡組建全新Gemini研究團隊,由95后華人科學家Yi Tay領銜。該團隊將專注于高級推理、大語言模型與強化學習等前沿領域,直接向Google Brain創始人之一Quoc Le匯報工作。團隊成員構成堪稱"全明星陣容",既包括Transformers發明人Noam Shazeer等傳奇學者,也匯聚了IMO金牌得主、自洽性理論提出者等當代頂尖人才。
據介紹,新團隊將保持精干規模但人才密度極高,近期正在全球招募頂尖研究者。其研究重心涵蓋算法設計、超大規模訓練、多模態系統構建等全鏈條技術,旨在持續推動Gemini系列模型的迭代升級。該團隊的成立,標志著谷歌在AI領域資源整合進入新階段,繼2023年合并Brain與DeepMind后,再次通過組織架構創新強化技術競爭力。
在模型升級的同時,谷歌同步推出辦公自動化平臺Workspace Studio。該平臺深度整合Gmail、Docs、Sheets等辦公套件,用戶無需編程即可創建AI代理,實現郵件自動處理、日程智能安排、跨系統流程自動化等功能。基于Gemini 3的推理能力,平臺可完成情感分析、內容生成、優先級排序等復雜任務,有效減輕職場人士的認知負荷。早期測試者反饋顯示,該工具切實解決了辦公場景中的痛點問題。






