在人工智能與機(jī)器人領(lǐng)域,陳佳玉的名字正逐漸被更多人熟知。這位兼具學(xué)術(shù)背景與產(chǎn)業(yè)實(shí)踐的年輕研究者,本科畢業(yè)于北京大學(xué)工學(xué)院,早期專注于自動(dòng)駕駛技術(shù)研究,博士后階段在卡內(nèi)基梅隆大學(xué)(CMU)將強(qiáng)化學(xué)習(xí)應(yīng)用于核聚變反應(yīng)堆控制,如今同時(shí)擔(dān)任香港大學(xué)博士生導(dǎo)師與原力無(wú)限資深研究科學(xué)家,將研究重心轉(zhuǎn)向通用家用機(jī)器人開(kāi)發(fā)。
陳佳玉的科研軌跡始終圍繞復(fù)雜系統(tǒng)智能控制展開(kāi)。從自動(dòng)駕駛的感知與決策,到強(qiáng)化學(xué)習(xí)理論深化,再到核聚變等離子體控制,看似跨度極大的研究方向背后,是強(qiáng)化學(xué)習(xí)這一核心方法的貫穿。"無(wú)論是核聚變控制還是機(jī)器人操作,本質(zhì)上都是用強(qiáng)化學(xué)習(xí)解決高維非線性連續(xù)控制問(wèn)題。"他解釋道,這類問(wèn)題需要定義觀測(cè)、動(dòng)作與評(píng)價(jià)函數(shù)三個(gè)要素,傳統(tǒng)控制方法難以應(yīng)對(duì),而強(qiáng)化學(xué)習(xí)的優(yōu)勢(shì)恰好在此。
這種技術(shù)路徑的選擇源于他對(duì)研究本質(zhì)的追求。"強(qiáng)化學(xué)習(xí)的學(xué)習(xí)過(guò)程具有類人特性,其綜合了控制理論、統(tǒng)計(jì)學(xué)與優(yōu)化理論,對(duì)數(shù)理基礎(chǔ)要求極高。"陳佳玉坦言,早期曾誤認(rèn)為挑戰(zhàn)最難問(wèn)題就是研究?jī)r(jià)值所在,如今更強(qiáng)調(diào)從需求出發(fā):"用簡(jiǎn)潔方式解決本質(zhì)問(wèn)題,既能影響廣泛領(lǐng)域,也符合工程實(shí)踐需求。"這種理念在他博士與博士后階段分別受兩位導(dǎo)師影響形成——博士導(dǎo)師Vanita Gawva教會(huì)他從數(shù)學(xué)原理剖析算法可行性,博后導(dǎo)師Joshua Rendell則讓他領(lǐng)悟到工程迭代的重要性。
當(dāng)前陳佳玉正致力于持續(xù)性強(qiáng)化學(xué)習(xí)研究,試圖讓AI具備持續(xù)學(xué)習(xí)新任務(wù)而不遺忘舊知識(shí)的能力。"這需要理論突破與工程技術(shù)的雙重支撐。"他以正在開(kāi)展的原型機(jī)研究為例,在原力無(wú)限聯(lián)合實(shí)驗(yàn)室中,團(tuán)隊(duì)既在算法層面探索理論創(chuàng)新,又通過(guò)快速工程迭代推動(dòng)技術(shù)落地。這種雙軌并進(jìn)的模式,源于他對(duì)學(xué)術(shù)研究與產(chǎn)業(yè)實(shí)踐耦合關(guān)系的深刻認(rèn)知:"在港大做通用機(jī)器人研究面臨資金、場(chǎng)地與算力三重困境,而產(chǎn)業(yè)界能提供這些關(guān)鍵資源。"
選擇加入原力無(wú)限,陳佳玉看重的是其構(gòu)建的商業(yè)-技術(shù)正向循環(huán)。該公司FORCE系列、MASTER COFFEE系列及輪式人形機(jī)器人AstroDroid AD-01的市場(chǎng)成功,證明了團(tuán)隊(duì)的產(chǎn)品化能力。"更關(guān)鍵的是技術(shù)共識(shí)。"他強(qiáng)調(diào),雙方都認(rèn)同具身智能的未來(lái)在于"一腦多身"的通用物理世界模型,這種理念契合度促使他以創(chuàng)業(yè)合伙人身份深度參與。
對(duì)于為何聚焦家用機(jī)器人,陳佳玉從技術(shù)集成與市場(chǎng)需求兩個(gè)維度給出解釋:"機(jī)器人學(xué)是人工智能技術(shù)的試驗(yàn)場(chǎng),通用機(jī)器人需要整合CV、NLP、大模型、控制理論等多領(lǐng)域技術(shù);而家庭場(chǎng)景對(duì)通用性的需求遠(yuǎn)高于商業(yè)與工業(yè)場(chǎng)景,用戶不希望為不同任務(wù)配置專用機(jī)器人。"這種判斷使他將攀登具身智能高峰的目標(biāo)鎖定在家庭場(chǎng)景。
面對(duì)大廠競(jìng)爭(zhēng),陳佳玉認(rèn)為初創(chuàng)公司的機(jī)會(huì)在于找到專屬賽道:"必須選擇垂直領(lǐng)域深耕,通過(guò)快速落地驗(yàn)證技術(shù)價(jià)值。"他預(yù)測(cè)短期機(jī)會(huì)在B端工業(yè)場(chǎng)景,但長(zhǎng)期看C端家庭市場(chǎng)潛力更大:"工廠可部署專用機(jī)器人提升效率,而家庭需要的是能處理多種任務(wù)的通用型產(chǎn)品。"
在核心技術(shù)突破方向上,陳佳玉提出兩大重點(diǎn):持續(xù)性強(qiáng)化學(xué)習(xí)與以Agent為中心的世界模型。針對(duì)后者,他批評(píng)當(dāng)前多數(shù)世界模型研究采用第三人稱視角,缺乏對(duì)智能體行為指揮的針對(duì)性。"我們希望構(gòu)建每個(gè)Agent獨(dú)有的世界模型,就像人類基于自身經(jīng)驗(yàn)理解物理世界。"這種差異化的研究路徑,體現(xiàn)在對(duì)因果建模的重視上——通過(guò)理解動(dòng)作背后的物理原理(如杯子掉落會(huì)破碎),實(shí)現(xiàn)經(jīng)驗(yàn)遷移(從拿杯子到拿水壺)。
對(duì)于具身智能領(lǐng)域的技術(shù)評(píng)估,陳佳玉直言當(dāng)前泛化性被高估,持續(xù)學(xué)習(xí)被忽視。"多數(shù)論文宣稱的泛化缺乏理論保證,而持續(xù)學(xué)習(xí)作為Richard Sutton和Ilya Sutskever都強(qiáng)調(diào)的難題,尚未得到足夠關(guān)注。"他預(yù)測(cè)行業(yè)將經(jīng)歷任務(wù)泛化、推廣部署、場(chǎng)景泛化三個(gè)階段,其中數(shù)據(jù)飛輪的啟動(dòng)是關(guān)鍵轉(zhuǎn)折點(diǎn):"當(dāng)千臺(tái)機(jī)器人部署到千個(gè)家庭持續(xù)產(chǎn)生數(shù)據(jù)時(shí),算法突破與海量數(shù)據(jù)的結(jié)合可能催生跨場(chǎng)景通用機(jī)器人。"
作為年輕博導(dǎo),陳佳玉給新入行研究者的建議強(qiáng)調(diào)問(wèn)題定義與資源獲取的雙重重要性:"先確定真正重要的研究問(wèn)題,再整合算力、設(shè)備、場(chǎng)景等資源。"他鼓勵(lì)學(xué)生拆解頂尖學(xué)者的研究體系,但拒絕盲從:"要博采眾長(zhǎng)構(gòu)建自己的認(rèn)知框架,從中推導(dǎo)出獨(dú)特的研究問(wèn)題。"這種方法論,或許正是他能在多個(gè)領(lǐng)域取得突破的關(guān)鍵。











