2024年11月,卓馭官宣成行智駕由兩段式端到端算法升級為可解釋端到端算法,并且新增全國都可開的無圖城市領(lǐng)航高階智駕功能。實際體驗和背后玄機到底如何?我們先來通過一段平臺車的實測視頻一探究竟!
端到端算法基于數(shù)據(jù)驅(qū)動,即從傳感器數(shù)據(jù)輸入,到軌跡或控制信號輸出,通過駕駛數(shù)據(jù)的學(xué)習(xí)進行端到端訓(xùn)練,其核心在于訓(xùn)練階段軌跡或控制的監(jiān)督信號能反傳到上游模塊,可持續(xù)對智駕系統(tǒng)進行全局的優(yōu)化。盡管針對目前端到端算法原理已有共識,但因為在端到端訓(xùn)練中所投入的數(shù)據(jù)質(zhì)量高低、訓(xùn)練效率、數(shù)量多寡、以及模型優(yōu)化部署的差異,讓端到端智駕系統(tǒng)在最終的實際場景體驗上也有所不同。因此,是否足夠聰明擬人,也成為了在產(chǎn)品體驗上衡量端到端智駕系統(tǒng)的標準之一。
01 優(yōu)質(zhì)數(shù)據(jù)+高效訓(xùn)練,提升端到端智駕體驗上限
從上述的定義可知,端到端模型本質(zhì)是從大量數(shù)據(jù)中學(xué)習(xí)傳感器數(shù)據(jù)→軌跡的映射關(guān)系。端到端智駕系統(tǒng)的能力上限由數(shù)據(jù)驅(qū)動獲得,通過傳感器的數(shù)據(jù)輸入直出駕駛軌跡,以此在城市領(lǐng)航的場景中實現(xiàn)路口左右轉(zhuǎn)、避障繞行、領(lǐng)航變道、智能調(diào)速等等能力,同時能夠讓駕駛更擬人,體驗更絲滑。這些能力實現(xiàn)和提升,關(guān)鍵在于高質(zhì)量的數(shù)據(jù)獲取,以及高效率的數(shù)據(jù)訓(xùn)練。
卓馭自成立以來,就已建立自有的數(shù)據(jù)研采車隊,加上近年來隨著越來越多合作伙伴車型的規(guī)?;慨a(chǎn),在數(shù)據(jù)的獲取上覆蓋全國的高質(zhì)量場景?;谧狂S多模態(tài)大模型的數(shù)據(jù)挖掘技術(shù),可提供高質(zhì)量人類駕駛數(shù)據(jù)進行端到端訓(xùn)練,確保數(shù)據(jù)有“質(zhì)”且有“量”,可真正閉環(huán)驅(qū)動算法迭代。
此外,單目/異構(gòu)雙目系統(tǒng)依靠大量數(shù)據(jù)學(xué)習(xí)圖像→軌跡的映射,其數(shù)據(jù)訓(xùn)練效率低,需覆蓋大量長尾數(shù)據(jù)。相對于此,卓馭所特有的雙目增強端到端架構(gòu),可提供圖像+點云幾何信息,讓數(shù)據(jù)訓(xùn)練效率提升10-20倍,即達到同樣性能所需訓(xùn)練數(shù)據(jù)量只需常規(guī)單目/異構(gòu)單目方案的10%左右,極大降低長尾數(shù)據(jù)需求。卓馭獨創(chuàng)的雙目增強全向OCC技術(shù)可將障礙物感知精度提升至0.05~0.1米的范圍,不僅支持異形車、雪糕筒、水馬、石塊等任意類型障礙物檢測和避讓,實現(xiàn)更強駕駛安全性;落到端到端算法上,更可通過AI模型和雙目點云雙冗余感知技術(shù),使其性能上限更高,障礙物檢測更魯棒。
02 從用戶實際使用出發(fā),打造100%場景數(shù)據(jù)驅(qū)動的端到端智駕體驗
高質(zhì)量的數(shù)據(jù)獲取,加上高效率的數(shù)據(jù)訓(xùn)練,是端到端算法的核心基礎(chǔ);那么能從用戶實際場景出發(fā),讓數(shù)據(jù)來驅(qū)動智駕體驗,則是端到端算法的落地關(guān)鍵。
在卓馭成行智駕的城市領(lǐng)航功能上,基于產(chǎn)品導(dǎo)向軟硬件聯(lián)合優(yōu)化的能力,以及結(jié)合AI和機器人科學(xué)上的空間智能積累,卓馭科技實現(xiàn)了100%場景下100%功能體驗的數(shù)據(jù)驅(qū)動。無論是橫向的車道保持、繞行避障、交互博弈、變道超車、上下匝道、領(lǐng)航選路,還是縱向的車速控制、禮讓行人、紅綠燈啟停等功能,均已實現(xiàn)100%體驗數(shù)據(jù)驅(qū)動。
這兩個100%,既是卓馭成行智駕在技術(shù)上的核心競爭力,也是區(qū)別于其它端到端方案的差異點。同時,100%體驗數(shù)據(jù)驅(qū)動技術(shù)不僅為成行智駕的城市領(lǐng)航能力在體驗上奠定了基礎(chǔ),同時體驗可通過數(shù)據(jù)驅(qū)動持續(xù)提升,越開越好。而安全推理框架的應(yīng)用,也為端到端技術(shù)澆筑了安全底線。
03 高效部署端到端模型 安全推理框架保障安全底線
在算力優(yōu)化方面,卓馭始終保持著探索和努力,讓領(lǐng)先的端側(cè)算力優(yōu)化技術(shù),為端到端算法架構(gòu)的升級提供極致的部署優(yōu)化能力,尤其是針對芯片特性優(yōu)化的模型架構(gòu),即便是有限算力也可實現(xiàn)端到端模型部署。
正是基于這樣的部署優(yōu)化能力,成行智駕可解釋端到端架構(gòu)最終通過一個AI模型打通感知、預(yù)測、決策和規(guī)劃多個模塊,這樣一方面讓智能駕駛系統(tǒng)信息傳遞損失更少,同時提升了響應(yīng)速度;另一方面,在端到端模型內(nèi)保留感知、預(yù)測模塊的可解釋輸出,使整個模型具備一定的可解釋性。所有通過端到端模型輸出的智駕軌跡,最終在安全推理框架的合理篩選下保留安全且擬人化程度最高的軌跡,確保自車行為在智駕狀態(tài)下的可控性。
類比人類駕駛員在駕駛時會思考多種駕駛方式,端到端網(wǎng)絡(luò)所輸出的也是多模態(tài)候選軌跡。每條候選軌跡都對應(yīng)著一種駕駛方式,在部分場景中,這些候選軌跡可能會有很大差異。根據(jù)不同的場景和駕駛習(xí)慣,我們借助安全推理框架篩選出最合適的軌跡并發(fā)送給車輛進行控制,同時還會針對候選軌跡的安全性以及其他指標進行進一步的交叉驗證,從而堅守端到端算法的安全底線。
安全推理框架由“軌跡評估模塊”與“安全校驗?zāi)K”這兩大部分構(gòu)成,其運行原理如下圖所示,即根據(jù)需求和場景集,構(gòu)建輔助駕駛行為的“黑名單”。
?軌跡評估模塊:在端到端網(wǎng)絡(luò)直出軌跡時,神經(jīng)網(wǎng)絡(luò)也會給出各個候選軌跡的評分,軌跡評估模塊則能夠基于此,結(jié)合安全、交規(guī)、導(dǎo)航等維度的評估,高效篩選出在安全前提下足夠擬人化的候選軌跡。
?安全驗證模塊:該模塊承擔(dān)冗余兜底的作用,通過冗余的軟件和算法,參照功能安全機制,對最終輸出軌跡的質(zhì)量和安全性予以進一步保障。
讓先進的端到端技術(shù)實現(xiàn)輕松標配,讓更多消費者體驗到智能駕駛行業(yè)最新的技術(shù)成果,是卓馭一直以來對“為所有人,提供安全,輕松出行體驗”使命的踐行。這同時要求端到端技術(shù)落地的實際體驗,不僅需要滿足智能駕駛系統(tǒng)“上限足夠高”的預(yù)期,也應(yīng)在所謂“端到端下限”的安全性和可解釋性上具有充分的保障。
成行智駕可解釋端到端算法即將落地量產(chǎn),通過卓馭在數(shù)據(jù)驅(qū)動,算力優(yōu)化,模型部署等方面深厚的技術(shù)賦能,這套智駕系統(tǒng)的實際體驗中足以達到“上限夠高,下限也高”的預(yù)期。隨著不斷優(yōu)化和完善,成行智駕可解釋端到端還將不斷提升和演進,持續(xù)在功能和體驗上帶來更多驚喜和創(chuàng)新。