谷歌近日在人工智能領域再次發力,一口氣推出三項重要舉措,涵蓋Agent功能更新、開源基準測試以及全新交互接口,進一步鞏固其在AI賽道的領先地位。此次更新不僅提升了現有技術的實用性,還為開發者提供了更強大的工具鏈,推動AI應用向更深層次發展。
作為核心更新,Deep Research Agent迎來功能升級并首次向開發者開放。該Agent基于Gemini 3 Pro模型構建,專為處理長期上下文采集與綜合任務設計。通過多步強化學習技術,它能夠自主導航復雜信息環境,實現高精度搜索。此次更新重點優化了網頁搜索能力,使其能夠深入特定網站挖掘數據,同時降低了生成研究報告的成本。據測試數據顯示,新版本在完整HLE測試中得分46.4%,超越Gemini 3 Pro的43.2%和GPT-5 Pro的38.9%,在DeepSearchQA和BrowseComp基準測試中也以微弱優勢領先。目前該技術已應用于金融服務、生物技術及市場調研等領域,幫助用戶完成初步調研任務。
為評估Agent在網絡研究任務中的全面性,谷歌同步開源了新基準測試DeepSearchQA。該基準包含900個手工設計的"因果鏈"任務,覆蓋17個專業領域,每項任務均需多步推理完成。與傳統事實性測試不同,DeepSearchQA更注重答案的詳盡程度,要求Agent生成包含完整推理鏈的解答集。這種設計不僅考察準確性,還評估信息檢索的記憶能力。測試發現,當允許Agent執行更多搜索步驟時,其性能顯著提升,為衡量"思考時長"效率提供了新工具。
全新推出的交互API(Interactions API)為開發者提供了統一入口,支持與Gemini模型及Agent的高效交互。該接口原生集成復雜上下文管理功能,可處理交錯消息、思維鏈、工具調用等場景。開發者通過ADK開發套件和A2A協議即可調用服務,享受服務器端狀態管理、可解釋數據模型等特性。特別值得關注的是,API內置了Deep Research Agent,未來還將擴展支持更多谷歌內置Agent及第三方定制Agent。技術文檔顯示,該接口采用單一RESTful端點設計,支持通過模型參數或Agent參數進行靈活調用,并提供背景執行、遠程MCP工具支持等高級功能。
這些更新標志著谷歌AI生態進入新階段。通過降低研究型Agent的使用門檻,提供標準化評估體系,以及構建統一開發接口,谷歌正在為AI應用開發創造更友好的環境。據悉,后續更新將聚焦于可視化輸出能力,包括原生圖表生成功能,同時通過MCP協議支持更便捷的數據源接入,最終目標是將Deep Research技術引入企業級Vertex AI平臺。









