在人工智能與機器人技術快速迭代的浪潮中,陳佳玉的科研軌跡呈現出獨特的跨學科融合特征。這位兼具學術研究者與產業實踐者雙重身份的科學家,從北京大學工學院到卡內基梅隆大學,再到香港大學與原力無限聯合實驗室,始終在探索復雜系統的智能控制邊界。其研究領域橫跨自動駕駛、核聚變控制與通用家用機器人,形成了一條以強化學習為核心的技術演進路徑。
強化學習的本質吸引力驅動著陳玉佳的持續探索。這種起源于認知科學、經計算機科學深化的技術范式,因其類人的學習機制與跨學科特性成為研究核心。陳佳玉指出,該領域融合了控制理論、統計學與優化理論,對數理基礎的高要求恰好契合其學術偏好。但他的研究理念已從早期追求理論難度轉向問題導向的實用主義,"解決現實需求的技術突破比單純攻克難題更有價值"成為現階段的指導原則。
在核聚變控制與人形機器人這兩個看似相去甚遠的領域,陳佳玉發現了深層的數學共性。無論是等離子體約束還是機器人抓取水杯,本質上都是高維非線性連續控制問題,均可建模為馬爾可夫決策過程。這種底層邏輯的統一性,使得強化學習成為破解兩類難題的通用鑰匙。他特別強調持續性強化學習的重要性——這項旨在讓AI保持舊任務記憶的同時學習新任務的技術,正是當前研究攻克的關鍵方向。
雙棲發展模式源于現實考量。在香港開展通用家用機器人研究面臨資金、場地與算力的三重制約,而原力無限提供的產業資源恰好形成互補。陳佳玉坦言,選擇這家創業公司不僅因其構建了商業技術閉環,更看重團隊"實干家"氣質帶來的高效執行力。雙方在"一腦多身"技術路線上的共識,促使他以聯合實驗室負責人的身份,推動原型機研發與理論突破的同步進行。
通用機器人被視為人工智能領域的終極挑戰。陳佳玉認為,家庭場景對通用性的苛刻要求,使其成為檢驗技術成熟度的理想試驗場。相較于工業場景對專用效率的追求,家庭用戶更期待單一機器人完成多樣化任務。這種需求差異決定了技術落地的不同路徑:短期看B端工廠應用,長期則指向C端家庭市場。原力無限在商業循環構建與產品落地方面的經驗,為技術突破提供了關鍵支撐。
世界模型構建成為新的研究焦點。區別于主流的第三人稱視角建模,陳佳玉團隊致力于開發以智能體為中心的因果模型。這種方案通過教授物理規律而非動作序列,使機器人獲得更強的泛化能力。例如理解"杯子掉落會破碎"的因果鏈,遠比記憶抓取動作更具遷移價值。這種本質性突破,正是其區別于VLA(視覺-語言-動作)方案的核心差異。
數據獲取難題的解決路徑逐漸清晰。陳佳玉設想通過"數據工廠"完成初期積累,最終依賴真實部署場景產生持續數據流。當1000臺機器人進入家庭日夜工作時,海量跨場景數據將形成正反饋閉環,推動技術跨越從任務泛化到場景泛化的關鍵門檻。他特別指出,數據飛輪的啟動時刻將成為行業發展的分水嶺。
面對"少年天才"的標簽,陳佳玉更關注問題定義與資源整合的能力。他坦言科研生涯充滿試錯成本,但失敗經驗終將沉淀為技能儲備。對于年輕研究者,他建議優先構建完整的研究體系:"拆解頂尖學者的思考框架,結合自身特長形成獨特體系,再從中推導值得投入的核心問題。"這種從體系到問題的研究路徑,或許正是其持續突破的關鍵密碼。











