滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

谷歌Gemini 3發布：推理多模態 Agent能力升級，重塑AI協作新范式

時間：2025-11-19 09:04:10 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

谷歌旗下Alphabet公司近日正式推出其最新人工智能模型Gemini 3，這款被業界視為“全能型選手”的模型憑借百萬級上下文窗口、突破性的多模態理解能力、創新的Agent開發平臺以及全棧技術生態，不僅實現了對前代產品的代際超越，更在多個核心基準測試中展現出與GPT-5.1、Claude 4.5等競品抗衡甚至超越的實力，標志著人工智能從“工具輔助”向“主動代理”的重大轉型。

根據公開信息，Gemini 3將被整合至Gemini應用、谷歌AI搜索產品AI Mode與AI Overviews，以及企業級解決方案中。該模型自發布日起向部分訂閱用戶開放，并計劃在未來幾周內擴大覆蓋范圍。此前，谷歌首席執行官桑達爾·皮查伊曾在2025年11月的財報會議中透露開發計劃，強調“前沿模型需要更長時間打磨，既要追求迭代速度，更要確保能力突破”。這種“慢工出細活”的策略在Gemini 3中體現得尤為明顯——其并非對2.5 Pro的簡單優化，而是從架構設計到能力拓展，再到生態構建的全面革新。

在推理能力方面，Gemini 3實現了雙重突破：基礎性能的顯著提升與推理模式的產品化創新。在權威測試中，Gemini 3 Pro在GPQA Diamond（研究生級推理）中取得91.9%的準確率，Humanity’s Last Exam（多步邏輯推理）無工具狀態下得分37.5%，SimpleQA Verified（事實準確性）以72.1%的分數領先行業。這些數據表明，該模型在科學研究、專業咨詢等需要深度思考的場景中已具備高可靠性。例如，它能夠獨立完成托卡馬克裝置等離子體流動的可視化代碼編寫，并同步創作詮釋聚變物理學原理的詩歌，實現理性與感性的融合。

多模態推理同樣是Gemini 3的強項。在MMMU-Pro測試中，該模型獲得81%的分數，Video-MMMU測試中更達到87.6%，展現出處理科學、數學等復雜領域問題的卓越能力。谷歌推出的Gemini 3 Deep Think增強推理模式通過“思維簽名”和“思考等級”兩大技術，將思維鏈（Chain of Thought）產品化：思維簽名在API返回中嵌入加密推理過程，確保長鏈路任務邏輯連貫；思考等級允許開發者根據任務復雜度調整模型“思考時間”，平衡速度與精度。測試顯示，增強模式在Humanity's Last Exam中得分41.0%，GPQA Diamond中達93.8%，ARC-AGI-2測試中創下45.1%的紀錄，凸顯其解決新挑戰的潛力。該模式目前正在接受安全評估，未來將向Google AI Ultra訂閱用戶開放。

長上下文處理能力是Gemini 3的另一大亮點。其支持的100萬tokens上下文窗口（約相當于700頁英文書籍或2小時4K視頻）遠超當前主流模型——GPT-4 Turbo的12.8萬tokens和Claude 3.5的20萬tokens，較谷歌自身的Gemini 2提升7倍，且信息保留率超過90%。這一特性使AI從“短對話”邁向“復雜任務”成為可能。

在多模態理解領域，Gemini系列自誕生起便以“原生多模態”為核心優勢，而Gemini 3則進一步實現從“處理多模態”到“理解多模態關聯”的跨越。在權威基準測試中，Gemini 3 Pro的多模態能力全面領先：MMMU-Pro得分81%，Video-MMMU以87.6%的成績重塑行業標準，被譽為“全球最先進的多模態理解模型”。

編碼與Agent能力是Gemini 3的“實踐工具”。谷歌通過“代理式編碼（Agentic Coding）”和“可視化編碼（Vibe Coding）”兩大創新，重新定義了開發者與AI的協作模式。在代碼生成領域，Gemini 3在LiveCodeBench Pro測試（接近ICPC/Codeforces難度的競技編程）中以2439的Elo得分超越GPT-5.1的2243和Claude 4.5的1418，接近專業程序員水平。Agent能力的躍升更具顛覆性：模型不再是被動的指令響應者，而是能自主規劃、拆解任務、調用工具的“數字代理”。在Terminal-Bench 2.0測試（終端操作能力）中，它以54.2%的得分展現強大工具使用能力；在Vending-Bench 2測試（長程規劃能力）中，Gemini 3 Pro在模擬運營自動售貨機業務的年度周期中通過一致決策和工具使用實現更高回報，位居榜首。這種能力使AI能夠獨立完成復雜工作流，例如自動爬取數據、分析趨勢、生成報告并部署可視化界面，全程無需人工干預。為支持Agent能力落地，谷歌同步推出開發平臺Google Antigravity，允許開發者在更高抽象層級進行任務導向型編程。

新模型還支持“生成式界面”，以數字雜志形式呈現答案。例如，當被要求結合梵高生平解讀其作品時，系統會為每幅畫作生成圖文并茂、色彩豐富的闡釋。此前未發布的Gemini 3測試版本已在專業領域展現突破性進展。加拿大勞瑞爾大學歷史學教授Mark Humphries通過Google AI Studio測試發現，該模型在識別18世紀手寫文稿時字符錯誤率僅0.56%，詞錯誤率1.22%，較前代Gemini 2.5 Pro提升50%-70%，達到專家級人類水平。更引人注目的是其推理能力：模型能自發進行逐步符號推理，例如將18世紀商人賬本中的“145”推斷為“14磅5盎司”，這不僅是對文本的識別，更是對經濟和文化系統的理解。

對于谷歌而言，Gemini 3的發布具有戰略意義。自2022年底ChatGPT問世以來，谷歌曾被視為AI競賽中的追趕者，甚至內部曾發布“紅色警報”。Business Insider援引內部人士稱，新模型可能幫助谷歌奪回領先地位，尤其是在OpenAI的ChatGPT-5未能立即產生重大影響之后。盡管起步較晚，谷歌仍擁有獨特優勢：自研專用芯片、在線搜索約90%的市場份額，以及數百萬Gmail、Google Docs等用戶——這些產品正逐步融入AI功能。谷歌上月公布的創紀錄收入及數十億美元的AI投資計劃，進一步凸顯其決心。

對企業和開發者而言，Gemini 3的價值不僅在于其強大能力，更在于它提供了一個“可擴展、可定制、可落地”的智能基座。隨著生態完善，AI有望加速從實驗室走向實際應用，滲透至日常生活與工作中。對于行業而言，Gemini 3的發布將推動競爭對手加速技術創新，促進AI在推理、多模態融合、Agent開發等領域的全面進步，為用戶和開發者帶來更強大的工具與全新的交互方式。

此外，這款手機還提供了1-120Hz動態刷新率，不僅可以流暢應對用戶日常刷社交平臺和短視頻等場景下的使用，而且還可以提升手機的續航能力。如果你是手機重度玩家也不用擔心手機的續航問題，畢竟它還提供了80W有線快…

11-19

Gemini 3 Pro預覽版發布，多領域表現亮眼，AI圈格局或生變？

11-19

福特智趣烈馬開啟預售：22.98萬起售，雙動力+豐富配置打造硬核SUV新選擇

11-19

谷歌重磅發布Gemini 3：多模態能力卓越，開啟AI發展新征程

11-19

Google發布Gemini 3：配套工具全升級，開啟AI開發與應用新篇章

11-19

阿里千問App上線首日沖入免費榜前四，AI生活入口未來可期

11月17日，阿里巴巴正式宣布“千問”項目，并將其視為“AI時代的未來之戰”。其近期發布的旗艦模型Qwen3-Max，在性能上已超過GPT-4、Claude3 Opus等國際頂尖模型。除了智能對話，“能辦事…

11-19

谷歌Gemini 3重磅登場，推理多模態能力超群，AI新紀元開啟

11-19

華為技術賦能！嵐圖泰山攜三腔空懸與800V超混，37.99萬起入局豪華SUV市場

11-19

嵐圖泰山攜三腔空懸入局50萬級市場，能否定義中國豪華新標準？

11-19

谷歌重磅發布Gemini 3：多模態能力領先，開啟AGI新征程

11-19

谷歌Gemini 3 Pro強勢登場：AI領域新王加冕，重塑技術新格局

11-19

谷歌Gemini 3 Pro模型卡亮相：架構升級，多模態及多項能力實現新突破

11-19

小米盧偉冰談存儲成本上漲：保供為先，漲價與優化結構雙管齊下

11-19

Intuit牽手OpenAI：1億美元合作，財務工具入駐ChatGPT開啟新融合

11-19

太空數據中心成新賽道：馬斯克領跑，谷歌布局，中國公司也已入局探索

11月2日，美國StarCloud公司成功發射搭載英偉達H100芯片與谷歌Gemini大模型的技術試驗星。據財聯社，由于人工智能數據中心的能源消耗巨大，谷歌近日設想，將其張量處理單元（TPU）搭載在配備太…

11-19

點擊查看更多 +

全站最新

福特智趣烈馬開啟預售：22.98萬起售，硬核配置+雙動力滿足多元需求

廣州車展啟幕在即，新獅鉑拓界領銜，悅達起亞多元陣容共赴出行新程

平鄉小卡布M9“口袋車”：技術突破創新，獲歐洲客青睞訂單不斷

瑪莎拉蒂Grecale Folgore降至30多萬，品牌誘惑與產品力如何抉擇？

產能飆升銷量走俏！小米汽車即將完成35萬臺年度交付目標

百度發布最新財報：整體營收下滑，AI業務收入同比激增超五成

熱門內容

本欄最新

東風奕派eπ007+深圳煥新登場：14萬級激光雷達加持，四驅轎跑新選擇

24.9萬起售！全新奔馳純電CLA攜四大突破，重塑豪華純電新標桿

東風奕派兩周年獻禮，eπ007+攜四大優勢登場，助力新能源賽道加速跑

東風奕派兩周年獻禮：eπ007+攜四大優勢登場，為年輕人出行注入新動力

東風奕派eπ007+高能登場，以“奕派速度”為年輕人解鎖百萬級出行新體驗

嵐圖泰山來襲：外觀大氣內飾豪華能否在高端SUV市場分一杯羹？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

谷歌Gemini 3發布：推理多模態 Agent能力升級，重塑AI協作新范式