在智能汽車與自動駕駛技術競爭日益激烈的當下,行業核心玩家正加速向強化學習與云端生成式世界模型轉型。這一趨勢在近期舉辦的國際計算機視覺大會(ICCV)上得到充分印證,特斯拉與理想汽車等頭部企業紛紛展示最新技術路徑,共同指向自動駕駛發展的新階段。
特斯拉自動駕駛副總裁在主題演講中透露,其團隊正通過世界模擬器對車端模型進行系統性評估。幾乎同時,理想汽車VLA模型負責人圍繞世界模型展開深度分享,提出從數據閉環向訓練閉環躍遷的技術框架。這一觀點引發行業共鳴,標志著自動駕駛技術范式迎來關鍵轉折。
傳統數據閉環體系面臨顯著局限,其循環機制難以覆蓋復雜邊緣場景。理想汽車率先提出訓練閉環解決方案,通過云端構建世界模型訓練環境,形成全球首個將世界模型與強化學習深度融合的量產自動駕駛架構。該體系包含三大核心能力:區域級仿真評估、合成數據生成與強化學習引擎,共同支撐訓練目標的動態迭代。
在仿真技術領域,理想采用重建與生成協同的混合路線。其與浙江大學等機構聯合研發的Hierarchy UGP模型,通過分層架構實現大規模動態場景精準重建,在Waymo公開數據集上刷新行業紀錄。同時,團隊提出的ReconDreamer范式開創了補充生成新視角的重建方法,相關成果獲CVPR收錄。盡管重建技術取得突破,但理想預測生成技術將主導未來仿真方向,其低成本、高泛化的特性更適應復雜場景需求。
合成數據技術層面,理想構建了場景編輯、遷移與全場景生成的三層應用體系。通過數據增強策略,模型訓練場景覆蓋度提升300%,極端案例數量增長15倍。這種數據分布優化直接推動模型性能躍升,特別是在低光照、復雜交通等挑戰性場景中表現顯著改善。
強化學習引擎作為訓練閉環的核心組件,面臨五大技術挑戰。其中仿真智能體建模被視為最大瓶頸,其復雜度甚至超過單車L4級自動駕駛。理想創新性地采用多智能體約束優化方法,通過動態獎勵權重調整實現行為分布控制,在保證樣本多樣性的同時確保訓練穩定性。該技術已支撐理想在園區道路實現類L4級輔助駕駛能力。
技術突破的背后是理想持續加碼的研發投入。2023-2024年研發支出連續突破百億大關,2025年上半年即投入53億元。巨額投入不僅催生上層算法創新,更孕育出底層操作系統級突破。其自主研發的星環OS實現軟硬件解耦,將芯片適配周期壓縮至4周,在AEB制動場景中縮短7米剎停距離,該成果已開源惠及16家產業鏈企業,形成涵蓋長城汽車、英飛凌等企業的技術生態聯盟。
學術認可進一步驗證技術實力。ICCV收錄的理想開源數據集3DRealCar包含2500輛真實汽車的高精度3D模型,提供360度視角與多光照條件數據,成為行業首個可商用開源數據集。與此同時,其機器人操作仿真系統RoboPearls等預研成果持續亮相頂會,展現技術儲備的深度與廣度。
這種技術驅動的轉型正在重塑企業定位。理想內部已明確空間機器人企業發展戰略,依托造車業務構建的研產閉環體系發揮關鍵作用。量產團隊反饋的真實需求直接指引研究方向,DriveVLM雙系統架構等成果實現快速落地,形成獨特的"技術預研-量產驗證"飛輪效應。這種模式與特斯拉形成東西呼應,共同勾勒出車企技術轉型的典型路徑。

















