滾動資訊

當(dāng)前位置：首頁 > 資訊 > 信息流 > 正文內(nèi)容

谷歌Gemini Robotics-ER 1.5登場：為機器人注入具身推理“智慧芯”

時間：2025-09-27 09:19:14 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

谷歌近日推出了一款革命性的機器人具身推理模型——Gemini Robotics-ER 1.5，標(biāo)志著機器人技術(shù)領(lǐng)域的重要突破。這款模型作為首個向全體開發(fā)者開放的Gemini機器人系列，旨在為機器人提供高級推理能力，使其能夠更智能地與物理世界互動。

Gemini Robotics-ER 1.5是一款視覺-語言模型（VLM），通過將Gemini的智能體功能引入機器人技術(shù)，賦予機器人理解復(fù)雜指令、推理物理環(huán)境并執(zhí)行任務(wù)的能力。與傳統(tǒng)模型不同，它專為增強機器人的感知能力和現(xiàn)實世界互動能力而設(shè)計，能夠解讀視覺數(shù)據(jù)、執(zhí)行空間推理，并根據(jù)自然語言命令規(guī)劃行動。

在操作層面，該模型可與現(xiàn)有機器人控制器和行為無縫配合，通過按順序調(diào)用機器人API，編排復(fù)雜行為以完成長時程任務(wù)。例如，用戶可以用自然語言下達“將物品分類到廚余、可回收和普通垃圾桶”的指令，機器人需自主查找本地垃圾分類規(guī)則、識別物品并完成投放。這種多步驟、上下文相關(guān)的任務(wù)處理能力，使其在學(xué)術(shù)和內(nèi)部基準(zhǔn)測試中達到行業(yè)頂尖水平。

模型的核心優(yōu)勢之一是其快速而精確的空間推理能力。基于Gemini Flash模型的低延遲特性，它能夠生成語義精確的2D坐標(biāo)點，支持“指出所有可拿起物體”等指令。在測試中，當(dāng)被要求標(biāo)記廚房場景圖片中的物品（如洗潔精、水龍頭）時，模型能準(zhǔn)確提供歸一化坐標(biāo)，并拒絕標(biāo)記不存在的物品，避免“幻覺”錯誤。

時間推理能力是另一大亮點。通過分析視頻幀，模型可理解物體與行為之間的因果關(guān)系。例如，在機械臂整理書寫工具的視頻中，模型能按時間戳精確描述每一步操作，甚至可根據(jù)要求對特定時間段進行逐秒分解，輸出包含開始時間、結(jié)束時間和描述的JSON格式數(shù)據(jù)。

對于長周期任務(wù)，Gemini Robotics-ER 1.5展現(xiàn)了強大的協(xié)調(diào)能力。在制作咖啡的示例中，模型不僅能標(biāo)記咖啡機下方放杯子的位置、頂部放膠囊的倉位，還能生成關(guān)閉咖啡機蓋子的8點軌跡，并指示清洗杯子的水槽位置。這種“空間錨定”計劃將文本指令與物理動作緊密結(jié)合，使機器人能高效完成復(fù)雜任務(wù)。

開發(fā)者可通過靈活調(diào)整“思考預(yù)算”來平衡模型的延遲與準(zhǔn)確性。對于物體檢測等簡單任務(wù)，小預(yù)算即可實現(xiàn)高性能；而對于多步組裝等復(fù)雜任務(wù)，增加預(yù)算可顯著提升結(jié)果質(zhì)量。這一特性使模型能同時滿足快速響應(yīng)和精確推理的需求。

安全性方面，模型改進了語義安全過濾器，能識別并拒絕違反物理約束的計劃（如超出機器人載荷能力的操作），為開發(fā)者提供更可靠的構(gòu)建環(huán)境。

目前，Gemini Robotics-ER 1.5預(yù)覽版已開放體驗。開發(fā)者可通過Google AI Studio實驗?zāi)Ｐ停喿x開發(fā)者文檔獲取快速入門指南和API參考，或通過Colab筆記本查看實際應(yīng)用案例。完整技術(shù)報告也已發(fā)布，為技術(shù)社區(qū)提供深入分析。

這款模型被視為機器人的“高級大腦”，能夠理解復(fù)雜指令、推理長周期任務(wù)并協(xié)調(diào)行為。無論是調(diào)用硬件API、專用抓取模型，還是運動控制模型，它都能將用戶請求分解為可執(zhí)行的計劃，推動機器人技術(shù)向更智能、更自主的方向發(fā)展。

09-27

2025年9月27日我國成功發(fā)射風(fēng)云三號08星助力氣象監(jiān)測與防災(zāi)減災(zāi)

09-27

固態(tài)電池設(shè)備產(chǎn)業(yè)鏈崛起：七大核心企業(yè)引領(lǐng)擴產(chǎn)與技術(shù)創(chuàng)新浪潮

2025年上半年，固態(tài)濕法涂布、輥壓、轉(zhuǎn)印等設(shè)備批量交付至國內(nèi)多條中試線，適應(yīng)不同類型電極材料和電解質(zhì)，支持規(guī)模化工藝創(chuàng)新。公司已與多家新能源科技企業(yè)開展戰(zhàn)略級合作，技術(shù)路線覆蓋“氧化物+鋰金屬”“硫化物+硅…

09-27

錢塘江畔電商潮涌：500萬新人入局，算法升級下的直播新生態(tài)

09-27

永輝前副總裁彭華生再出發(fā)，小優(yōu)生鮮北京首店11月啟幕，帶來新期待

09-27

川大學(xué)子與頂尖學(xué)者共探黑洞奧秘學(xué)術(shù)報告激發(fā)天文探索熱情

09-27

諾氏風(fēng)神翼龍：翼展12米、重250公斤的遠古巨獸如何翱翔天際？

09-27

深圳永輝“胖東來模式”調(diào)改收官在即本地化融合綻放消費新活力

09-27

英偉達與阿里巴巴攜手，云平臺集成物理AI開發(fā)工具共拓AI新局

09-27

跨境支付新趨勢：AI賦能升級，支付機構(gòu)“牽手”商戶共拓海外市場

09-27

優(yōu)艾智合9月26日遞表港交所，劍指“移動操作機器人第一股”領(lǐng)航地位

09-27

AI取代放射科醫(yī)生為時尚早？Karpathy發(fā)聲：軟件工程師崗位或仍將穩(wěn)固

09-27

海天味業(yè)上半年業(yè)績穩(wěn)增，國內(nèi)經(jīng)銷商調(diào)整，海外業(yè)務(wù)待發(fā)力

09-27

雷軍演講成凡客轉(zhuǎn)折點？陳年哽咽回應(yīng)，雷軍同款T恤熱銷斷貨

09-27

嘀嗒出行2025上半年成績單：營收近3億，用戶超3.95億，將推聚合出行服務(wù)

09-27

點擊查看更多 +

全站最新

市場監(jiān)管總局發(fā)布會聚焦熱點：充電寶電動自行車安全監(jiān)管舉措與成效

小米汽車開啟定制服務(wù)新篇章，每月限40單，YU7與SU7 Ultra率先嘗鮮

小米汽車推深度定制服務(wù)：YU7、SU7 Ultra車主享專屬個性，每月僅40個名額

雷軍2025年度演講：小米17系列發(fā)布 YU7交付破4萬定制服務(wù)開啟豪華平權(quán)新篇

重度聽損老人福音：科大訊飛鴻語版助聽器，舒適降噪助溝通

雷軍談YU7：頂住壓力做運動SUV，年初拆3輛Model Y零件研究

熱門內(nèi)容

本欄最新

雷軍年度演講談玄戒O1項目：小米造芯決心堅定，至少十年投入500億

雷軍第99次健身打卡收官在即，年度演講與小米17系列發(fā)布同日將啟

天回航天“巧龍一號”發(fā)動機完成超低工況熱試車，展現(xiàn)深度推力調(diào)節(jié)潛力

2025秋季搜狐視頻播主大會三亞啟幕，多元互動共探關(guān)注流社交新生態(tài)

NVIDIA50億美元投資Intel，臺積電風(fēng)險可控，先進制程優(yōu)勢或延續(xù)至2030年

復(fù)旦團隊繪制代謝組圖譜：解鎖疾病早期預(yù)警密碼，助力精準(zhǔn)醫(yī)療

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

谷歌Gemini Robotics-ER 1.5登場：為機器人注入具身推理“智慧芯”