據(jù)外媒報(bào)道,中國(guó)浙江大學(xué)(Zhejiang University)、北京大學(xué)(Peking University,)與浙江綠色智行科創(chuàng)有限公司(Zhejiang Green Zhixing Technology co., ltd)的研究人員合作研發(fā)了一款突破性模型ScoreLiDAR,可將3D場(chǎng)景的構(gòu)建完成速度提高5倍,為實(shí)時(shí)自動(dòng)駕駛車輛感知技術(shù)的發(fā)展鋪平了道路。

場(chǎng)景重建(圖片來源:浙江大學(xué))
背景
利用車載傳感器進(jìn)行高效且精確的環(huán)境識(shí)別,對(duì)于確保自動(dòng)駕駛汽車的安全運(yùn)行至關(guān)重要。在眾多傳感器中,3D激光雷達(dá)(LiDAR)因高精度和廣泛的探測(cè)范圍而成為一款不可或缺的組件。不過,激光雷達(dá)生成的3D點(diǎn)云往往比較稀疏,特別是在有遮擋或復(fù)雜駕駛場(chǎng)景下,這對(duì)于場(chǎng)景理解造成了挑戰(zhàn)。因此,需要對(duì)激光雷達(dá)場(chǎng)景進(jìn)行補(bǔ)全,即通過稀疏的輸入信息重建出密集的3D場(chǎng)景,從而實(shí)現(xiàn)更好的感知。
傳統(tǒng)的激光雷達(dá)場(chǎng)景補(bǔ)全方法包括基于深度補(bǔ)全和基于有符號(hào)距離場(chǎng)(SDF)的技術(shù)。此類方法有一定效果,但是通常存在細(xì)節(jié)丟失或受制于體素分辨率等的不足。最近,擴(kuò)散模型被引入到激光雷達(dá)補(bǔ)全領(lǐng)域,并顯示出強(qiáng)大的訓(xùn)練穩(wěn)定性及高質(zhì)量的生成結(jié)果。例如,LiDiff和擴(kuò)散語義場(chǎng)景補(bǔ)全(DiffSSC)技術(shù)通過改進(jìn)噪聲調(diào)度和融合語義任務(wù),顯著提升了生成場(chǎng)景的豐富度。不過,此類模型的采樣過程緩慢,限制了其應(yīng)用于實(shí)時(shí)應(yīng)用,而此類實(shí)時(shí)應(yīng)用對(duì)于自動(dòng)駕駛汽車而言至關(guān)重要。
為了解決上述問題,研究人員們推出了新型蒸餾框架ScoreLiDAR,專為基于擴(kuò)散模型的激光雷達(dá)場(chǎng)景補(bǔ)全而設(shè)計(jì)。ScoreLiDAR通過將蒸餾框架引入訓(xùn)練過程,用一個(gè)預(yù)訓(xùn)練的教師擴(kuò)散模型訓(xùn)練一個(gè)精簡(jiǎn)的學(xué)生模型,以及結(jié)合結(jié)構(gòu)損失提升幾何精度,極大地加快了場(chǎng)景補(bǔ)全的速度,同時(shí)保持了卓越的場(chǎng)景質(zhì)量,而且通過廣泛的實(shí)驗(yàn)得到了驗(yàn)證。