受訪(fǎng)嘉賓:
智己汽車(chē)CMO 李微萌
智己汽車(chē)副CTO 郭輝
智己汽車(chē)智駕中心總監(jiān) 賀錦鵬
智己智駕項(xiàng)目總監(jiān) 王康
Momenta CEO 曹旭東
Q:如何評(píng)價(jià)端到端?智己與Momenta的端到端和友商比較有什么差別?
曹旭東:今年,端到端大模型概念很火。實(shí)際上,行業(yè)里端到端大模型是多條途徑,包括橫向、縱向,但真正做到這些的并不多。一些所謂的端到端大模型,只輸出橫向,沒(méi)有縱向輸出。但我們的端到端是比較完整體的端到端:首先是一段式,感知和規(guī)控是完全打通的;其次,我們端到端軌跡同時(shí)控制橫向與縱向,相當(dāng)于橫縱向通過(guò)大模型同時(shí)得到很好的優(yōu)化,在智能性、舒適性、安全性上都能達(dá)到了更高的天花板水平。
我們有一個(gè)概念,叫做有直覺(jué) “有直覺(jué)”就是“車(chē)隨心動(dòng)”,想到什么,車(chē)就做了,而且非常絲滑。當(dāng)你看到一個(gè)場(chǎng)景,你覺(jué)得這個(gè)車(chē)應(yīng)該那樣開(kāi)的時(shí)候,它立刻馬上那樣開(kāi)了,這就非常直覺(jué)。
智己聯(lián)合Momenta打造的一段式端到端智駕大模型,不光是擁有“人的直覺(jué)”,而且擁有“海量的好司機(jī)直覺(jué)”。我們收集了海量數(shù)據(jù),從中篩選好司機(jī)的駕駛行為,同時(shí)還有一些好的指標(biāo),比如,智駕的橫向避讓比人避讓的多還是少?比人加速的多還是少?最終基于海量的數(shù)據(jù)分布,運(yùn)用老司機(jī)、好司機(jī)的駕駛行為指導(dǎo)智駕學(xué)習(xí)。當(dāng)然,不僅僅是老司機(jī)、好司機(jī)的行為,還有絕大部分被認(rèn)可的駕駛行為習(xí)慣。
Q:智己的一段式端到端大模型實(shí)現(xiàn)機(jī)制是什么樣的?
李微萌:一段式端到端的技術(shù)路線(xiàn)非常好。五、六年前,大家還不覺(jué)得城市NOA這么快實(shí)現(xiàn)的時(shí)候,更多專(zhuān)注于高速高架NOA的研發(fā)。那時(shí)候有兩個(gè)技術(shù)流派:一個(gè)技術(shù)流派是rule-based(基于規(guī)則),另一個(gè)技術(shù)流派就是我們和Momenta所堅(jiān)定走的Data-Driven(數(shù)據(jù)驅(qū)動(dòng))的技術(shù)路線(xiàn)。今天,為什么有人是兩段式端到端,我們直接做了一段式端到端?我們覺(jué)得一段式端到端一定是未來(lái)領(lǐng)先的。智駕到最后一定是像人一樣開(kāi)車(chē),人開(kāi)車(chē)的時(shí)候不會(huì)先認(rèn)識(shí)這是瓶子,再做規(guī)劃。
當(dāng)年為什么有人選擇rule-based,因?yàn)樗梢钥焖俚淖兂善?chē)的賣(mài)點(diǎn)給到用戶(hù)。但是Data-Driven(數(shù)據(jù)驅(qū)動(dòng))要的訓(xùn)練量很大,一開(kāi)始的起步?jīng)]有那么的好,沒(méi)有那么快,需要不停的累計(jì)學(xué)習(xí)。當(dāng)時(shí)rule-based都已經(jīng)把這些場(chǎng)景做出來(lái)了,可以做好。但今天我們來(lái)看,當(dāng)年選擇Data-Driven(數(shù)據(jù)驅(qū)動(dòng))是對(duì)的,因?yàn)橹邱{一定會(huì)實(shí)現(xiàn)城區(qū)NOA,以及L3、L4也會(huì)實(shí)現(xiàn)。
曹旭東:我們和智己對(duì)于數(shù)據(jù)驅(qū)動(dòng)特別有信仰,Transformer在2018年就出來(lái)了,到2020年已經(jīng)用Transformer做Planning(規(guī)劃)。那時(shí)候,行業(yè)里很多人說(shuō)用Planning做Planning,或者數(shù)據(jù)驅(qū)動(dòng)做Planning,肯定是不太可能的。放到當(dāng)時(shí)場(chǎng)景,有理由的,那時(shí)候發(fā)現(xiàn)用Deep Learning Planning(深度學(xué)習(xí)規(guī)劃)做Planning,在有些場(chǎng)景會(huì)有驚艷的表現(xiàn),但是也會(huì)在很多場(chǎng)景有很多匪夷所思的問(wèn)題。我們研發(fā)體系和智己打磨,2021、2022年,到2023年初,我們才真正的把智己Deep Learning Planning(深度學(xué)習(xí)規(guī)劃)做到量產(chǎn)。
現(xiàn)在回過(guò)去看,那時(shí)候我們做到的相當(dāng)于現(xiàn)在行業(yè)里兩段式端到端,只不過(guò)那時(shí)候沒(méi)有流線(xiàn)的數(shù)據(jù)。為什么先做兩段式,因?yàn)殚_(kāi)發(fā)難度更小一些,先把兩段式先做出來(lái),在去年成功量產(chǎn)。我們用Deep Learning 做Planning比特斯拉更早,特斯拉今年上半年才上了端到端,Planning變成深度學(xué)習(xí)。今年,我們已經(jīng)有兩段式,再加上背后一整套研發(fā)體系的支撐,在今年成功實(shí)現(xiàn)一段式端到端。一段式端到端的優(yōu)點(diǎn)天花板更高,缺點(diǎn)是研發(fā)難度更大,包括怎么Debug問(wèn)題的可解釋性以及怎么高效的解決問(wèn)題,它需要很強(qiáng)的研發(fā)體系支撐才有可能做到。
賀錦鵬:兩段式端到端和一段式端到端,行業(yè)各種各樣的解釋方式,有說(shuō)各種各樣模型堆疊在一起屬于兩段式或者多段式。我們?cè)?023年蘇州發(fā)布會(huì)講過(guò)了”認(rèn)知智能“和”感知智能“同樣重要,基于這個(gè)前提,我們做了幾種Planning的Deep Learning(深度學(xué)習(xí))。那時(shí)候沒(méi)有用兩段式端到端的名詞,結(jié)果兩個(gè)模型的顯示傳遞,現(xiàn)在行業(yè)所提到兩段式端到端,不管什么樣的技術(shù),最終目的是能夠擬人,并超越人。
《新機(jī)器智能》作者霍金斯被稱(chēng)為腦科學(xué)領(lǐng)域的科技怪人,他提出人腦運(yùn)行機(jī)理類(lèi)似于經(jīng)驗(yàn)+預(yù)測(cè)大模型,跟我們當(dāng)前大家所做的一段式端到端基本理念是一樣,經(jīng)驗(yàn)是做的訓(xùn)練、大數(shù)據(jù),海量的優(yōu)質(zhì)的數(shù)據(jù),預(yù)測(cè)是端到端本身的輸出。不管對(duì)自己行為預(yù)測(cè)還是對(duì)周邊障礙物預(yù)期目標(biāo)軌跡的輸出,也是完全暗合了人腦腦科學(xué)發(fā)展領(lǐng)域和趨勢(shì)。這是我們認(rèn)為的“為什么一段式端到端上限更高”,同時(shí)我們不排斥在有些模擬推理上工作內(nèi)容也會(huì)疊加在端到端上。
Q:智己的“快慢系統(tǒng)”、“短期記憶和長(zhǎng)期記憶”,與其他車(chē)企的區(qū)別是什么?
賀錦鵬:我認(rèn)為現(xiàn)階段大家比的是對(duì)行業(yè)技術(shù)趨勢(shì)的理解,以及資源投入。如何實(shí)現(xiàn)快速迭代?各家會(huì)有差異化,這個(gè)答案不是標(biāo)準(zhǔn)答案。就行業(yè)趨勢(shì)而言,是相同的,頭部幾家都在做一段式端到端大模型;難點(diǎn)是海量、優(yōu)質(zhì)的數(shù)據(jù),以及怎么做快速迭代。在相同趨勢(shì)的基礎(chǔ)上,智己提出額外內(nèi)容,通過(guò)“快系統(tǒng)”“慢系統(tǒng)”相互配合,通過(guò)仿真人腦,用“直覺(jué)推理+邏輯分析”的方式正確處理問(wèn)題??煜到y(tǒng)即直覺(jué)推理,善于直覺(jué)與經(jīng)驗(yàn)快速處理問(wèn)題,形成決策。這是我們認(rèn)為有差異點(diǎn)的地方。后續(xù)我們也會(huì)和Momenta在增大云端總體算力,增強(qiáng)大模型的快速產(chǎn)出的能力。
Q:智己與Momenta的合作模式,兩家如何配合?
郭輝:智己與Momenta的合作堪稱(chēng)行業(yè)典范,智駕領(lǐng)域強(qiáng)強(qiáng)聯(lián)合模式建立起領(lǐng)先優(yōu)勢(shì),把大家的優(yōu)勢(shì)組合起來(lái),轉(zhuǎn)化成最好的產(chǎn)品,給到用戶(hù)極致的體驗(yàn),這才是我們的終極目標(biāo)。在整個(gè)合作過(guò)程中,Momenta基于深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò),以及數(shù)據(jù)方面的知識(shí)和能力,為智己帶來(lái)了非常大的幫助。從智己角度來(lái)講,我們?cè)诠こ袒矫娴慕?jīng)驗(yàn),包括對(duì)整車(chē)的理解,包括怎么能夠讓智駕系統(tǒng)在車(chē)上實(shí)現(xiàn)十萬(wàn)輛乃至更大規(guī)模的技術(shù)落地,我們要做大量的工作,無(wú)論從整車(chē)層級(jí)的系統(tǒng)性開(kāi)發(fā),抑或是硬件和底軟相關(guān)的開(kāi)發(fā)和驗(yàn)證,以及到最后測(cè)試過(guò)程中如何做好數(shù)據(jù)閉環(huán),這些都非常重要。
曹旭東:智己和Momenta雖然是兩個(gè)公司,但是勝似一個(gè)團(tuán)隊(duì),整個(gè)合作迭代效率非常高。剛剛和郭博在聊,我們重點(diǎn)在討論兩個(gè)事,一個(gè)是如何超越智駕摩爾定律,之前說(shuō)智駕摩爾定律兩年十倍,但是我們追求是遠(yuǎn)比這個(gè)要高,可能兩年一百倍甚至更快的速度,怎么實(shí)現(xiàn)這個(gè)目標(biāo)?實(shí)現(xiàn)這個(gè)目標(biāo)需要兩邊非常高的迭代效率,整個(gè)數(shù)據(jù)閉環(huán)的效率提升,可能從以月為單位加速到以周為單位,再以周為單位加速到天為單位,兩邊團(tuán)隊(duì)通過(guò)多年的合作形成默契后,這個(gè)效率提升放在任何一家公司,內(nèi)部的團(tuán)隊(duì)能夠達(dá)到這樣的效率,都是非常鳳毛麟角的,只有這個(gè)行業(yè)最高端的一部分的企業(yè)能夠做到。
賀錦鵬:我們?cè)?023年,花了八個(gè)月時(shí)間開(kāi)通全國(guó)高速高架NOA;城市NOA 2024年初在上海首發(fā),到9月底全新LS6上市開(kāi)通全國(guó)無(wú)圖城市NOA,在這個(gè)過(guò)程中經(jīng)歷過(guò)技術(shù)方案的切換,從原來(lái)的高精地圖方案切換成輕地圖或者無(wú)圖,這個(gè)技術(shù)方案的變更非常大,挑戰(zhàn)也非常大,八個(gè)月的周期,我們完成了全國(guó)無(wú)圖的開(kāi)通。從結(jié)果來(lái)看,雙方的合作達(dá)到了預(yù)期目標(biāo),也證明早期決策是非常正確的。
關(guān)于主機(jī)廠(chǎng)如何平衡與開(kāi)發(fā)商的關(guān)系,整車(chē)企業(yè)要不要做全棧,行業(yè)里有各種各樣的聲音。在早期的經(jīng)典汽車(chē)時(shí)代,日本豐田、本田都是自研自造。后期,部分零配件自研團(tuán)隊(duì)成為獨(dú)立的公司,開(kāi)始做零部件。我們現(xiàn)在講的汽車(chē)產(chǎn)業(yè)鏈和產(chǎn)業(yè)協(xié)同都是在這個(gè)時(shí)期形成。這就有點(diǎn)像三國(guó)時(shí)代,分分合合,分久必合,合久必分。我們認(rèn)為,如何能夠快速迭代,達(dá)到市場(chǎng)預(yù)期,就是最好的方案。
用端到端做L4是不是偽命題?
郭輝:從智己的角度來(lái)看,我們搭建的是全級(jí)別的智駕平臺(tái),支撐IM AD的智駕系統(tǒng)快速迭代。所以我們從一開(kāi)始就選擇了數(shù)據(jù)驅(qū)動(dòng)這一條路。我們的L2、L3、L4采取了共平臺(tái)開(kāi)發(fā)策略,共享數(shù)據(jù)池和一段式端到端大模型。我們也是全國(guó)首個(gè)同時(shí)具備L2、L3、L4智能駕駛量產(chǎn)能力的品牌。
我們的理解是從L2到L3、L4,在技術(shù)上有相同的部分,也有不同的部分。我們剛才講的是技術(shù)上的相同部分,在硬件架構(gòu)上L2++、L3、L4完全可以做增量。舉例,在今天L2++智能輔助駕駛上,現(xiàn)在是12個(gè)攝像頭,加上三個(gè)毫米波雷達(dá),加上一個(gè)激光雷達(dá),增加冗余的攝像頭,可以滿(mǎn)足L3級(jí)自動(dòng)駕駛需求。如果到L4級(jí)自動(dòng)駕駛,需要增加三個(gè)激光雷達(dá),當(dāng)然也包括執(zhí)行器要做一些增量配置,控制器的冗余配置也要做增量。此外,在架構(gòu)上,還要做算法和安全增強(qiáng),來(lái)做增量,我們有著非常清晰的路徑。反過(guò)來(lái)說(shuō),L2++輔助駕駛,以及L3和L4級(jí)自動(dòng)駕駛在技術(shù)上也有不同的部分,以L(fǎng)3級(jí)自動(dòng)駕駛為例,核心是做好高速高架場(chǎng)景。L4級(jí)自動(dòng)駕駛要求會(huì)更高,包含城區(qū)場(chǎng)景下能夠脫手脫眼。從技術(shù)路徑上,我們也會(huì)有不同,比如加更多的安全增強(qiáng),這都是在合作中要考慮的。
曹旭東:補(bǔ)充一點(diǎn),有一個(gè)說(shuō)法L2++做得越好,距離L4越遠(yuǎn),完全是偽概念,這個(gè)偽概念是曾經(jīng)一小部分L4公司為了增加自己的所謂技術(shù)壁壘創(chuàng)造出來(lái)的概念,已經(jīng)被證偽了?,F(xiàn)在說(shuō)的人已經(jīng)不多了,甚至做L4的公司不好意思提這個(gè)說(shuō)法了。
Q:智己在L3-L4方向上,是否參與了標(biāo)準(zhǔn)的制定?
王康:隨著IM AD在自動(dòng)駕駛行業(yè)里分量和地位不斷提升,影響力不斷擴(kuò)大。很多國(guó)家相關(guān)部門(mén)、國(guó)家級(jí)檢測(cè)機(jī)構(gòu)均跟我們進(jìn)行了高頻交流,包括去年L3準(zhǔn)入等行業(yè)標(biāo)準(zhǔn)的起草,我們都有深度參與。我們不僅要聚焦產(chǎn)品,同時(shí)也希望為中國(guó)自動(dòng)駕駛不斷向前發(fā)展,多做點(diǎn)貢獻(xiàn)。
Q:智己的技術(shù)特點(diǎn)和競(jìng)品有什么不同?
郭輝:在智能化賽道,核心抓手是智能駕駛,可以認(rèn)為它是技術(shù)底座。對(duì)于智己來(lái)講,我們的品牌優(yōu)勢(shì)是靈蜥數(shù)字底盤(pán)。就以我們的“云臺(tái)車(chē)身”為例,依托智駕系統(tǒng)對(duì)環(huán)境的精準(zhǔn)感知,能夠識(shí)別大曲率的彎道,對(duì)底盤(pán)進(jìn)行智能調(diào)整,讓乘客獲得舒適平穩(wěn)的駕乘體驗(yàn)。這是典型的跨域融合的例子,數(shù)字底盤(pán)也會(huì)用到智駕感知能力,同時(shí)在人駕情況下提供舒適的駕駛體驗(yàn)。這個(gè)例子說(shuō)明了,我們可以把數(shù)字底盤(pán)和智能駕駛的優(yōu)勢(shì)融合在一起。當(dāng)然,前提是我們的智駕技術(shù)要非常優(yōu)秀,要在第一梯隊(duì),要有突出的表現(xiàn)。
賀錦鵬:補(bǔ)充一下,比如我們有靈蜥數(shù)字底盤(pán),在城市開(kāi)啟高階智駕,遇到調(diào)頭工況時(shí)會(huì)用到靈蜥數(shù)字底盤(pán)的智慧四輪轉(zhuǎn)向,讓調(diào)頭更輕松,實(shí)現(xiàn)更小半徑的調(diào)頭,我們認(rèn)為智駕體驗(yàn)是否讓用戶(hù)感到舒適,有沒(méi)有頓挫、均要有好的底盤(pán)來(lái)做“手腳,眼、腦”的協(xié)調(diào)工作,只有做到這樣,才能算是真正好用的智能駕駛。
Q:智己LS6上市一個(gè)月表現(xiàn)怎么樣?Model Y要改款了,你們擔(dān)心嗎?
李微萌:訂單超三萬(wàn)多。這個(gè)月交付量會(huì)達(dá)到八千左右,下個(gè)月破萬(wàn)。中國(guó)品牌合圍Model Y,合力把它拉下神壇,肯定是中國(guó)品牌最開(kāi)心的事情。中國(guó)品牌各自把自己的看家本領(lǐng)拿出來(lái),互相促進(jìn)變得更好,讓消費(fèi)者有更大的獲益。