滾動資訊

當(dāng)前位置：首頁 > 資訊 > 信息流 > 正文內(nèi)容

谷歌Gemini 2.5計算機使用模型亮相：為AI智能體賦予GUI交互新能力

時間：2025-10-08 12:48:36 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

谷歌近日宣布推出Gemini 2.5計算機使用模型，這是一款基于Gemini 2.5 Pro視覺理解與推理能力打造的專用工具，旨在讓AI智能體具備直接操作圖形用戶界面（GUI）的能力，包括點擊、輸入文字和滾動屏幕等人類操作。

開發(fā)者現(xiàn)已可通過Google AI Studio和Vertex AI中的Gemini API訪問該模型的公開預(yù)覽版。相關(guān)文檔已同步上線，開發(fā)者可參考鏈接了解具體使用方法。

谷歌指出，當(dāng)前AI模型主要通過結(jié)構(gòu)化API與軟件交互，但許多日常數(shù)字任務(wù)仍需直接操作圖形界面，例如填寫表單、提交信息等。這類任務(wù)要求AI智能體能像人類一樣瀏覽網(wǎng)頁和應(yīng)用程序，而原生支持表單填寫、下拉菜單操作和登錄后操作的能力，是構(gòu)建通用型智能體的關(guān)鍵突破。

該模型的核心功能通過Gemini API新增的computer_use工具實現(xiàn)，采用循環(huán)運行機制。其工作流程分為四步：首先接收用戶請求、屏幕截圖和操作歷史作為輸入，開發(fā)者可指定排除某些操作或添加自定義函數(shù)；隨后模型分析輸入并生成UI操作指令，如點擊或輸入；客戶端代碼執(zhí)行操作后，將新的屏幕截圖和URL反饋給模型，形成持續(xù)迭代，直至任務(wù)完成或因安全、用戶決策等原因終止。

技術(shù)文檔顯示，該模型特別針對Web瀏覽器環(huán)境優(yōu)化，同時在移動UI控制任務(wù)中展現(xiàn)出潛力，但尚未適配桌面操作系統(tǒng)級別的深度控制。

性能測試表明，Gemini 2.5計算機使用模型在多個Web和移動控制基準(zhǔn)測試中表現(xiàn)優(yōu)異。在Browserbase平臺的Online-Mind2Web測試中，該模型在瀏覽器控制質(zhì)量和響應(yīng)延遲方面均領(lǐng)先于市場主流方案。

針對AI控制計算機可能引發(fā)的安全風(fēng)險，谷歌構(gòu)建了多層次防護體系。模型訓(xùn)練階段即融入安全功能，重點防范三類核心威脅：用戶濫用、意外行為及Web環(huán)境中的提示注入攻擊。開發(fā)者可通過兩項安全控制工具進一步約束模型行為：逐步安全服務(wù)會在每次操作前進行獨立評估，系統(tǒng)指令功能則允許開發(fā)者設(shè)定高風(fēng)險操作（如繞過驗證碼、控制醫(yī)療設(shè)備）的拒絕或用戶確認(rèn)規(guī)則。

這些安全措施旨在幫助開發(fā)者規(guī)避系統(tǒng)破壞、安全威脅等高風(fēng)險行為，確保AI智能體在合規(guī)框架內(nèi)運行。

更多>同類資訊

從實驗室到真實世界：我國量子計算解鎖科學(xué)新工具的多元實踐

量子比特的登場帶來了“疊加”與“糾纏”兩把鑰匙：一把讓0和1同時存在，一把讓比特間產(chǎn)生超越距離的默契。中科院團隊去年發(fā)布的一項工作，把一種含幾十個電子的催化劑模型搬上超導(dǎo)量子處理器，通過變分量子本征求解器（V…

11-03

禾賽科技與廣和通攜手，激光雷達方案落地頭部公司賦能多領(lǐng)域機器人

IT之家 11 月 3日消息，據(jù)禾賽科技官方今日消息，其近日與廣和通達成戰(zhàn)略合作，聯(lián)合發(fā)布了基于激光雷達的機器人多模態(tài)融合感知與控制解決方案。本次合作則以 3D激光雷達技術(shù)及 AI 視覺算法為核心，聚焦具…

11-03

2026 JapanDrone：聚焦技術(shù)落地，共探無人機行業(yè)新機遇與挑戰(zhàn)

該展會是日本無人機領(lǐng)域規(guī)模較大、影響力較強的專業(yè)展會之一，旨在為行業(yè)搭建交流平臺，促進技術(shù)創(chuàng)新與應(yīng)用落地。展會設(shè)置了無人機基礎(chǔ)研討會，由行業(yè)專家分享技術(shù)進展；另一方面，創(chuàng)新研討會將聚焦市場趨勢與商業(yè)模式，幫助…

11-03

我國天文學(xué)者解密熱木星：為何能棲身恒星近旁？“穿越”研究探行星演化未來

11-03

80億光年外現(xiàn)“神秘?zé)艋\”：持續(xù)亮三年，天文學(xué)家苦尋宇宙謎底

11-03

木星看似“軟氣球”，實則暗藏玄機，小行星撞擊為何難穿其“身”？

11-03

霍尼韋爾推進航空航天業(yè)務(wù)分拆，2026年將按新四大板塊披露業(yè)績

11-03

熱木星“逆天”安居恒星旁我國學(xué)者解密其軌道遷移的時空密碼

11-03

數(shù)據(jù)盲區(qū)成過去式：分銷小程序為社區(qū)團購裝上“智慧導(dǎo)航儀”

它將用戶、商品、訂單、團長、財務(wù)等所有環(huán)節(jié)的數(shù)據(jù)，匯聚成一張動態(tài)的“作戰(zhàn)地圖”。模塊關(guān)鍵數(shù)據(jù)指標(biāo)決策價值用戶分析- 新增用戶數(shù)數(shù)據(jù)決策：在“用戶分析” 中篩選“近30天未下單”的沉睡用戶（共8000人）。…

11-03

快手智能云烏蘭察布公司注冊資本大增增幅達400%至2.5億

11-03

奶皮子糖葫蘆成新晉網(wǎng)紅：40元一串引排隊，原料漲價供不應(yīng)求

11-03

全新BMW M3旅行版登場：性能實用雙在線，續(xù)寫M品牌出行傳奇

11-03

起亞Telluride測試車披"藝術(shù)偽裝"亮相，創(chuàng)意彩蛋致敬命名地

11-03

信托業(yè)新規(guī)落地：強化私募定位提升投資者門檻促行業(yè)轉(zhuǎn)型

11-03

三季度末險資A股持倉超6500億金融股仍為“壓艙石”制造業(yè)居次席

11-03

點擊查看更多 +

全站最新

Gemini 3 2025年發(fā)布在即，AI人工智能ETF(512930)短期回調(diào)長期仍具潛力

石頭科技雙十一“成績單”亮眼：構(gòu)建多元矩陣，從室內(nèi)到庭院全域領(lǐng)跑

重慶50臺小米汽車后備箱集市吸睛，雷軍點贊，年輕用戶群體成亮點

小米SU7 Pro行駛22萬公里電池僅衰減5%，展現(xiàn)電動車技術(shù)新高度

小米SU7 Pro行駛22萬公里：電池僅衰減5%，展現(xiàn)電動汽車高耐久新實力

小米SU7 Pro車主實測22萬公里：高強度使用下電池衰減僅5%，耐用性獲驗證

熱門內(nèi)容

本欄最新

起亞Telluride測試車披"藝術(shù)偽裝"亮相，創(chuàng)意彩蛋致敬命名地

30萬級6座SUV新角逐：2026款騰勢N8L與理想L8，誰更合家庭心意？

遠程湘潭基地智能制造賦能超級VAN，推動新能源商用車產(chǎn)業(yè)高質(zhì)量發(fā)展

每日一書

湖北神秘事件：磨山710棵樹幾分鐘盡數(shù)斬斷，目擊者：看見了龍

宇宙“千眼”開機！南半球最強光譜儀智利首秀，宇宙秘密藏不住了

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

谷歌Gemini 2.5計算機使用模型亮相：為AI智能體賦予GUI交互新能力