特斯拉AI團(tuán)隊(duì)負(fù)責(zé)人阿肖克·埃盧斯瓦米近日通過(guò)社交平臺(tái)深入闡釋了該公司自動(dòng)駕駛技術(shù)(FSD)的核心方法論。這項(xiàng)基于端到端神經(jīng)網(wǎng)絡(luò)的創(chuàng)新方案,正推動(dòng)自動(dòng)駕駛從傳統(tǒng)工程學(xué)問(wèn)題向純AI領(lǐng)域轉(zhuǎn)型,其技術(shù)路徑與行業(yè)主流方案形成鮮明對(duì)比。
傳統(tǒng)自動(dòng)駕駛系統(tǒng)普遍采用模塊化架構(gòu),將感知、預(yù)測(cè)、規(guī)劃三大功能拆分為獨(dú)立模塊。特斯拉工程師指出,這種設(shè)計(jì)存在接口復(fù)雜、優(yōu)化困難等弊端,尤其在處理現(xiàn)實(shí)駕駛中的"微型電車難題"時(shí)表現(xiàn)乏力。例如當(dāng)車輛需要選擇碾過(guò)水坑還是短暫借道逆行時(shí),模塊化系統(tǒng)難以通過(guò)預(yù)設(shè)規(guī)則做出符合人類價(jià)值觀的決策。
特斯拉的解決方案是構(gòu)建端到端神經(jīng)網(wǎng)絡(luò),直接接收攝像頭像素、車輛運(yùn)動(dòng)數(shù)據(jù)、音頻及導(dǎo)航信息,同步輸出轉(zhuǎn)向與加速指令。這種架構(gòu)的優(yōu)勢(shì)在于實(shí)現(xiàn)系統(tǒng)級(jí)優(yōu)化,梯度信號(hào)可從控制端直接回傳至傳感器輸入層。更關(guān)鍵的是,通過(guò)海量人類駕駛數(shù)據(jù)訓(xùn)練,AI能潛移默化地掌握"避免逆行"等隱性決策規(guī)則。
技術(shù)團(tuán)隊(duì)特別強(qiáng)調(diào)了系統(tǒng)對(duì)復(fù)雜場(chǎng)景的理解能力。在處理"雞群過(guò)馬路"與"鵝群閑逛"的差異時(shí),端到端模型通過(guò)潛在空間分析,能準(zhǔn)確判斷動(dòng)物群體的行動(dòng)意圖。這種對(duì)潛在意圖的解析能力,在模塊化系統(tǒng)中因本體論構(gòu)建困難而難以實(shí)現(xiàn)。
支撐這套系統(tǒng)的數(shù)據(jù)規(guī)模堪稱行業(yè)奇跡。特斯拉車隊(duì)每日產(chǎn)生的駕駛數(shù)據(jù)相當(dāng)于500年人類駕駛時(shí)長(zhǎng),通過(guò)智能篩選機(jī)制提取最具價(jià)值的數(shù)據(jù)樣本。在雨天路滑的典型案例中,系統(tǒng)提前5秒預(yù)判前車失控軌跡并主動(dòng)減速,展現(xiàn)出對(duì)二階效應(yīng)的驚人預(yù)測(cè)能力。
為破解端到端模型的可解釋性難題,研發(fā)團(tuán)隊(duì)開發(fā)了兩項(xiàng)關(guān)鍵技術(shù)。其一"生成式高斯?jié)姙R"能在220毫秒內(nèi)重建動(dòng)態(tài)3D環(huán)境模型,使工程師可視化AI的感知世界;其二語(yǔ)言解釋模塊通過(guò)自然語(yǔ)言推理,已在FSD v14.x版本中實(shí)現(xiàn)駕駛決策的語(yǔ)義化輸出。
在系統(tǒng)評(píng)估環(huán)節(jié),特斯拉構(gòu)建的神經(jīng)世界模擬器創(chuàng)造了新的測(cè)試范式。這個(gè)能實(shí)時(shí)生成逼真虛擬場(chǎng)景的AI系統(tǒng),既可復(fù)現(xiàn)歷史事故數(shù)據(jù),也能創(chuàng)造極端測(cè)試場(chǎng)景。通過(guò)7×24小時(shí)的閉環(huán)壓力測(cè)試,系統(tǒng)在虛擬環(huán)境中完成數(shù)百萬(wàn)次駕駛迭代,相當(dāng)于在現(xiàn)實(shí)世界中行駛數(shù)百年。
值得關(guān)注的是,這項(xiàng)技術(shù)棧展現(xiàn)出強(qiáng)大的跨領(lǐng)域遷移能力。模擬器生成的虛擬場(chǎng)景已成功應(yīng)用于擎天柱人形機(jī)器人的工廠導(dǎo)航測(cè)試,證明其核心算法可無(wú)縫適配不同形態(tài)的機(jī)器人系統(tǒng)。這種技術(shù)通用性為通用人工智能的落地開辟了新路徑。











