滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

GAIR 2025：三維生成與世界模型之爭(zhēng)，3D如何為AI安全感筑基？

時(shí)間：2025-12-13 23:40:51 來(lái)源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

在香港中文大學(xué)（深圳），一間名為GAP的實(shí)驗(yàn)室正試圖彌合虛擬與現(xiàn)實(shí)之間的界限。實(shí)驗(yàn)室負(fù)責(zé)人韓曉光教授將研究重心從三維重建轉(zhuǎn)向具身智能與世界模型構(gòu)建，這一轉(zhuǎn)變?cè)趯W(xué)術(shù)界引發(fā)關(guān)注。他通過(guò)社交平臺(tái)持續(xù)分享技術(shù)思考，將專(zhuān)業(yè)討論與公眾互動(dòng)結(jié)合，形成獨(dú)特的學(xué)術(shù)傳播模式。這種開(kāi)放姿態(tài)折射出新一代科研工作者突破傳統(tǒng)邊界的探索精神。

三維生成技術(shù)正經(jīng)歷關(guān)鍵轉(zhuǎn)型期。早期研究聚焦于特定類(lèi)別物體的三維重建，例如椅子、車(chē)輛等，通過(guò)深度學(xué)習(xí)模型實(shí)現(xiàn)單張圖像到三維模型的轉(zhuǎn)換。隨著Stable Diffusion等文本生成圖像技術(shù)的成熟，開(kāi)放世界三維生成成為新熱點(diǎn)。研究者開(kāi)始嘗試用自然語(yǔ)言直接生成三維模型，盡管生成速度仍需優(yōu)化，但已突破類(lèi)別限制。當(dāng)前技術(shù)已進(jìn)入大模型階段，商業(yè)應(yīng)用如混元3D等工具，能夠基于單張圖片生成高質(zhì)量三維模型。

技術(shù)演進(jìn)中暴露的矛盾促使行業(yè)重新思考發(fā)展方向。傳統(tǒng)三維內(nèi)容創(chuàng)作流程包含概念設(shè)計(jì)、建模、紋理貼圖等十余個(gè)環(huán)節(jié)，最終輸出視頻成果。視頻生成技術(shù)的突破性進(jìn)展，使得文本到視頻的生成成為可能，這對(duì)三維生成領(lǐng)域構(gòu)成直接沖擊。三維生成技術(shù)面臨的物理真實(shí)性不足、空間一致性缺失、內(nèi)容可控性差等問(wèn)題，在視頻生成領(lǐng)域同樣存在，但后者在交互可控性方面的進(jìn)展引發(fā)危機(jī)感。

視頻生成模型的可控性突破成為關(guān)鍵轉(zhuǎn)折點(diǎn)。最新推出的Sora2和Veo3系統(tǒng)已展示初步交互能力，用戶(hù)可控制視角變化實(shí)現(xiàn)場(chǎng)景漫游。這種發(fā)展態(tài)勢(shì)迫使行業(yè)重新審視三維技術(shù)的必要性。三維生成領(lǐng)域提出四種技術(shù)路徑應(yīng)對(duì)挑戰(zhàn)：完全摒棄三維的端到端生成、利用三維仿真作為世界模擬器、將三維信息作為控制信號(hào)輸入、使用三維合成數(shù)據(jù)輔助訓(xùn)練。這些方案均試圖在保持生成效率的同時(shí)，解決物理真實(shí)性和長(zhǎng)程記憶問(wèn)題。

世界模型構(gòu)建引發(fā)多維技術(shù)路線(xiàn)爭(zhēng)論。該領(lǐng)域可劃分為三類(lèi)：服務(wù)于人類(lèi)認(rèn)知的宏觀模型、滿(mǎn)足個(gè)性化體驗(yàn)的虛擬世界、賦能機(jī)器的具身智能模型。在可交互場(chǎng)景中，三維技術(shù)展現(xiàn)出不可替代性。以自動(dòng)駕駛為例，車(chē)輛決策需預(yù)測(cè)環(huán)境變化，這要求世界模型具備物理規(guī)律建模能力。VR設(shè)備提供的沉浸式體驗(yàn)同樣依賴(lài)三維空間感知，觸覺(jué)反饋等交互需求進(jìn)一步強(qiáng)化三維技術(shù)的必要性。

具身智能發(fā)展凸顯三維技術(shù)的基礎(chǔ)地位。機(jī)器人學(xué)習(xí)人類(lèi)操作行為時(shí)，需精確捕捉人手與物體的三維交互動(dòng)態(tài)。仿真環(huán)境訓(xùn)練要求生成可交互的三維場(chǎng)景，確保機(jī)器人安全試錯(cuò)。制造領(lǐng)域從數(shù)字模型到實(shí)體產(chǎn)品的轉(zhuǎn)化過(guò)程，完全依賴(lài)三維數(shù)據(jù)支撐。牙齒生成等醫(yī)療項(xiàng)目證明，高精度三維模型是智能制造的基石。

技術(shù)路線(xiàn)分歧聚焦于顯式與隱式建模之爭(zhēng)。隱式方法通過(guò)端到端神經(jīng)網(wǎng)絡(luò)處理任務(wù)，將物理規(guī)律編碼于潛變量中，但形成"黑箱"系統(tǒng)。顯式方法則分步建模，先重建三維幾何模型，再結(jié)合物理參數(shù)進(jìn)行計(jì)算。汽車(chē)碰撞預(yù)警系統(tǒng)的對(duì)比顯示，顯式可視化方案能提供更強(qiáng)的安全感。人類(lèi)認(rèn)知局限決定三維建模的不可替代性，高維潛變量難以理解，而三維空間是人類(lèi)直覺(jué)可感知的維度。

可解釋性成為AI發(fā)展的關(guān)鍵平衡點(diǎn)。當(dāng)前技術(shù)發(fā)展過(guò)度側(cè)重性能提升，忽視解釋性需求。三維技術(shù)因其直觀性，成為建立人機(jī)信任的重要橋梁。正如古代帝王追求長(zhǎng)生不老卻不懂煉丹原理的隱喻，現(xiàn)代AI系統(tǒng)若缺乏可解釋性，終將引發(fā)使用者信任危機(jī)。三維建模提供的可視化路徑，為破解這一困境提供了可能方向。

更多>同類(lèi)資訊

AI賦能智慧交通：從信號(hào)燈革新到人形機(jī)器人探索的多元突破

12-13

全球開(kāi)發(fā)者先鋒大會(huì)上，高校實(shí)戰(zhàn)工作坊為AI人才產(chǎn)教融合“破局”

12-13

輕舟智航與地平線(xiàn)軟硬協(xié)同，以創(chuàng)新技術(shù)推動(dòng)智駕與安全普惠未來(lái)

12-13

天橋腦科學(xué)研究院成立尖峰智能實(shí)驗(yàn)室探索AI與腦科學(xué)深度融合新路徑

12-13

姚期智院士談具身智能：突破模仿局限，探索推理新路與協(xié)同發(fā)展

12-13

OpenAI GPT-5.2發(fā)布首日API調(diào)用超萬(wàn)億tokens，多版本滿(mǎn)足不同需求

12-13

AI戰(zhàn)場(chǎng)硝煙彌漫，微博憑“智搜”與“羅伯特”走出特色增長(zhǎng)之路

12-13

ChatGPT 5.2：重塑專(zhuān)業(yè)工作新范式，多領(lǐng)域展現(xiàn)超越人類(lèi)實(shí)力

這些結(jié)果突顯了其應(yīng)對(duì)復(fù)雜挑戰(zhàn)的能力，從優(yōu)化工作流程到解決技術(shù)問(wèn)題，其先進(jìn)的推理能力使其成為各行各業(yè)專(zhuān)業(yè)人士的重要工具，使他們能夠自信應(yīng)對(duì)獨(dú)特而不斷發(fā)展的需求。無(wú)論是在優(yōu)化工作流程、解決復(fù)雜編碼項(xiàng)目，還是提升大…

12-13

華為Atlas 800T A3超節(jié)點(diǎn)：為大模型訓(xùn)練打造高性能AI智算新引擎

Atlas 800TA3超節(jié)點(diǎn)是華為面向互聯(lián)網(wǎng)、運(yùn)營(yíng)商、金融等行業(yè)大模型訓(xùn)練場(chǎng)景推出的AI智算產(chǎn)品，以高性能、高可靠、易部署為核心優(yōu)勢(shì)，適配通用風(fēng)冷機(jī)房部署，為數(shù)據(jù)中心基礎(chǔ)設(shè)施提供強(qiáng)勁硬件支撐。靈衢總線(xiàn)…

12-13

廣東構(gòu)建具身智能“1+1+N”體系深圳領(lǐng)航機(jī)器人友好示范城區(qū)建設(shè)

“1”個(gè)廣東核心中樞—— 廣東省具身智能訓(xùn)練場(chǎng)（簡(jiǎn)稱(chēng)“省訓(xùn)練場(chǎng)”），由主訓(xùn)練場(chǎng)和管理中心兩部分構(gòu)成。2025 年 1—10月，全省人工智能核心產(chǎn)業(yè)規(guī)模超 2300 億元；工業(yè)機(jī)器人、服務(wù)機(jī)器人產(chǎn)量分別為…

12-13

中國(guó)EUV光刻機(jī)早布局顯決心，量子光子芯片技術(shù)或與美并肩

促使中國(guó)關(guān)注EUV光刻技術(shù)，在于2018年中國(guó)一家芯片企業(yè)下單采購(gòu)EUV光刻機(jī)遇阻，由此中國(guó)芯片行業(yè)開(kāi)始認(rèn)識(shí)到發(fā)展先進(jìn)芯片技術(shù)恐怕不會(huì)那么容易，西方可能會(huì)在先進(jìn)設(shè)備方面予以阻撓，只是沒(méi)想到西方這么多年過(guò)去放…

12-13

宇樹(shù)科技人形機(jī)器人App Store上線(xiàn)！一鍵下載解鎖李小龍經(jīng)典武術(shù)動(dòng)作

12-13

OpenAI GPT-5.2正式發(fā)布，首日API調(diào)用超萬(wàn)億tokens且增長(zhǎng)態(tài)勢(shì)迅猛

12-13

星途ET5云貴上市：以五境實(shí)力開(kāi)啟智慧出行，重塑15萬(wàn)級(jí)智電SUV新標(biāo)桿

12-13

2026年3月車(chē)市盛宴！四款大五座SUV即將登場(chǎng)，誰(shuí)能脫穎而出？

12-13

點(diǎn)擊查看更多 +

全站最新

AI技術(shù)落地實(shí)用化，TCL借勢(shì)發(fā)力白電賽道謀突破

靈巧手：中國(guó)具身智能突破關(guān)鍵“一厘米”，產(chǎn)業(yè)前景與挑戰(zhàn)并存

小米汽車(chē)“準(zhǔn)新車(chē)”引爭(zhēng)議，雷軍回應(yīng)沿襲同行稱(chēng)呼，透明銷(xiāo)售獲部分認(rèn)可

小米公司投訴村支書(shū)短視頻引熱議，雙方最新回應(yīng)澄清事實(shí)還原真相

小米汽車(chē)“準(zhǔn)新車(chē)”上架引熱議，雷軍回應(yīng)沿用同行稱(chēng)呼，透明銷(xiāo)售獲部分認(rèn)可

北京高端翻譯優(yōu)選信實(shí)：專(zhuān)業(yè)意大利語(yǔ)主持，資質(zhì)深厚服務(wù)多元

熱門(mén)內(nèi)容

本欄最新

星途ET5云貴上市：以五境實(shí)力開(kāi)啟智慧出行，重塑15萬(wàn)級(jí)智電SUV新標(biāo)桿

2026年3月車(chē)市盛宴！四款大五座SUV即將登場(chǎng)，誰(shuí)能脫穎而出？

從碰撞到環(huán)境：吉利全域安全中心如何以系統(tǒng)協(xié)同守護(hù)出行安全？

全新奔馳GLB官圖發(fā)布，空間升級(jí)智能進(jìn)階，電動(dòng)化轉(zhuǎn)型能否再掀熱潮？

華為2025年Atlas 800T A3超節(jié)點(diǎn)：高性能AI智算，為大模型訓(xùn)練筑牢硬件根基

日產(chǎn)攜手Wayve：融合前沿技術(shù)，共筑下一代智能駕駛輔助新未來(lái)

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類(lèi)資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶(hù)提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

GAIR 2025：三維生成與世界模型之爭(zhēng)，3D如何為AI安全感筑基？