谷歌近日正式上線了其最新旗艦模型Gemini 3 Pro,這款被公司稱為迄今為止“最智能”且“最準確”的模型,不僅在編碼和推理能力上實現了顯著提升,還大幅減少了“諂媚式”回應,轉而提供更加直接和實用的信息。這一舉措被視為谷歌對競爭對手ChatGPT的直接回應,標志著人工智能領域的新一輪競爭正式拉開帷幕。
Gemini 3 Pro的最大亮點在于其“原生多模態”特性,能夠同時處理文本、圖像和音頻,打破了傳統模型僅限于文本交互的局限。谷歌官方演示中,該模型不僅流暢地處理了RNA數據,還展示了翻譯菜譜照片為食譜、根據視頻講座創建交互式學習卡片等實用功能。在Gemini應用中,用戶還能利用內置的Canvas構建功能更全面的程序,支持“生成式界面”,創建包含圖片的雜志式視覺格式,或根據用戶提示定制動態布局的用戶界面。
搜索功能方面,Gemini 3 Pro同樣表現出色。它能夠根據用戶搜索呈現圖像、表格、網格和模擬等視覺元素,通過分解問題并理解用戶意圖,找到之前可能遺漏的新內容。谷歌DeepMind高級總監兼產品負責人Tulsee Doshi表示,這一模型將助力谷歌實現“人人皆可獲取且人人皆可使用”的信息目標,推動搜索引擎向更豐富、更完整的實際內容展示邁進。
在回應風格上,Gemini 3 Pro也進行了顯著調整。谷歌強調,該模型的回復將更加“智能、簡潔、直接”,摒棄陳詞濫調和奉承,提供真正的洞見。這一變化被視為對ChatGPT等模型空洞奉承式回應的直接挑戰,旨在為用戶提供更加實用和有價值的信息。
除了上述改進外,Gemini 3 Pro還具備更強大的推理和智能代理能力,能夠完成更復雜的任務并可靠地進行長期規劃。谷歌表示,該模型為Gemini Agent的實驗性功能提供支持,可在應用內幫助用戶執行查看和整理電子郵件、搜索和預訂旅行等任務。
在性能方面,Gemini 3 Pro在官方21項基準測試中表現優異,除OCR和代理編碼外,其他指標均遙遙領先。谷歌還特別強調了人類最終測試、終端工作臺2.0和SimpleQA Verified三個指標,矛頭直指Claude Sonnet4.5和GPT-5.1等競爭對手,試圖證明其在標準化知識生成、AI工具使用乃至“人工智能”整體指標上的全方位優勢。
與此同時,谷歌還推出了基于Gemini 3 Pro及其他第三方模型的開發工具Antigravity。這款工具支持多個智能體直接訪問編輯器、終端和瀏覽器,旨在面向“智能體優先的未來”。Antigravity具有生成“工件”文件以驗證工作進度、報告操作和外部工具使用情況等功能,并提供了編輯器視圖和管理器視圖兩種主要使用視圖,方便用戶同時控制多個代理。
谷歌表示,Antigravity中的代理能夠從過去的工作中學習,保留特定代碼片段或執行任務所需步驟。在官方演示中,該工具成功構建并測試了一個基本的航班跟蹤應用程序,并通過瀏覽器錄制報告了測試結果。目前,Antigravity已推出公開預覽版,兼容Windows、macOS和Linux系統。
谷歌此次的發布不僅限于一個大模型,更展示了其構建從模型、應用到開發者的完整生態閉環的野心。隨著多模態交互的普及,AI正從一位博學的“對話者”轉變為能看、能聽、能行動、能規劃的“執行者”。這一轉變預示著未來3D和全景、沉浸式交互競賽的臨近,人工智能領域將迎來更加激烈的競爭和更加廣闊的發展前景。











