以三年為時間界限,可以說,自動駕駛盈利的時間節(jié)點近在咫尺。
對此,王曉剛有兩個角度的考慮,其一是開源,整車企業(yè)的車型項目越來越多;其二是節(jié)流,“比較重要的是合作的模式,能夠以更高的性價比的方式去完成交付,實際上還包括新技術(shù)和新產(chǎn)品的開發(fā)。”
同時,王曉剛認(rèn)為,現(xiàn)階段,市場的競爭態(tài)勢和虧損的現(xiàn)狀很不合理,導(dǎo)致整個行業(yè)和智駕領(lǐng)域都存在問題。破局的方法便是避免同質(zhì)化競爭,“要做出既有用戶價值,還有特色功能的產(chǎn)品出來”。也就是說,“從產(chǎn)品設(shè)計、技術(shù)發(fā)展路線上,找到自己獨特的路線和價值。”
01 AGI將為商湯絕影打開新局面
媒體采訪之前的發(fā)布會上,商湯絕影發(fā)布了三款產(chǎn)品,分別針對智艙、智駕和世界模型。
智艙領(lǐng)域,商湯絕影首次發(fā)布智艙座艙大模型創(chuàng)新產(chǎn)品「A New Member For U」(你的家庭新成員)。
王曉剛介紹:“在座艙里面我們的New Member,它的設(shè)計跟今天市面上大模型的使用是有本質(zhì)的差別,實際上背后是有很多新技術(shù)的支撐,包括我們對于產(chǎn)品體驗的要求。”
相較以往被動接受指令的車機,「A New Member For U」依靠原生流式多模態(tài)大模型、車載類人記憶框架和持續(xù)運行框架等前沿AI大模型技術(shù),能夠感知用戶的語音、表情、手勢、以及環(huán)境數(shù)據(jù),并進行深度理解和推理思考,進而在車內(nèi)空間與人進行主動互動。
在《人機對話交易中的響應(yīng)時間》的論文中,羅伯特·米勒指出,人類幾乎察覺不到100毫秒以下的延遲。而「A New Member For U」的數(shù)據(jù)延遲控制在1毫秒以下,首包延時最快只需60毫秒。
在智能駕駛領(lǐng)域,商湯絕影構(gòu)建了「車云一體」的產(chǎn)品矩陣,發(fā)布涵蓋高速、城區(qū)以及泊車等全場景的高階智駕、端到端智駕等絕影量產(chǎn)智駕產(chǎn)品體系。
基于J6E、J6M、Orin等不同算力平臺,商湯絕影打造了全場景高階智駕、端到端智駕等絕影量產(chǎn)智駕產(chǎn)品體系。基于J6平臺的智駕方案預(yù)計2025年第二季度將量產(chǎn)交付,而量產(chǎn)端到端智駕方案則預(yù)計會在明年年底量產(chǎn)落地。
在世界模型方面,商湯科技全新升級「開悟」世界模型,以此打造堅實的數(shù)據(jù)基礎(chǔ)設(shè)施。
對于世界模型來說,其基礎(chǔ)與核心能力便是生成高質(zhì)量視頻數(shù)據(jù)。官方數(shù)據(jù)顯示,在真實的基礎(chǔ)上,「開悟」生成的場景視頻,時間最長為150秒、分辨率可達(dá)1080P、視角可以實現(xiàn)11V。
另外,通過多模態(tài)大模型,「開悟」世界模型可以支持多樣化的自動駕駛場景及Corner case的可控生成。目前商湯絕影基于1024類場景,能夠泛化出更多的平行世界,打造了千萬級的生成場景庫,預(yù)計2025年對行業(yè)開放。
王曉剛認(rèn)為:“我們已經(jīng)站在AGI時代的門口。作為加速智能汽車駛?cè)階GI時代的戰(zhàn)略合作伙伴,商湯絕影將牢牢把握住新一輪智能汽車變革的時間窗口,與車企伙伴進行全方位深度合作,共享大算力與大模型,共建數(shù)據(jù)基礎(chǔ)設(shè)施,共同打造智能汽車大模型創(chuàng)新應(yīng)用。”
02 數(shù)據(jù)很重要
進入AGI時代,數(shù)據(jù)的重要性愈發(fā)明顯。
王曉剛表示:“傳統(tǒng)的是模塊化分工,Tier-1負(fù)責(zé)集成,作為整體黑盒標(biāo)準(zhǔn)化的交付;但是未來在端到端自動駕駛到來的時候,更多是要依賴數(shù)據(jù)的驅(qū)動。”
如何解決數(shù)據(jù)數(shù)量、質(zhì)量和完備性的問題?
王曉剛分析:“過去一年多的發(fā)展,實際上大模型在快速發(fā)展的時候是把互聯(lián)網(wǎng)上公開的數(shù)據(jù)價值快速榨取了?;ヂ?lián)網(wǎng)上的數(shù)據(jù)已經(jīng)被用到了。新的數(shù)據(jù)很大方向就是垂直行業(yè)里面,比如說在自動駕駛里面采集的各種數(shù)據(jù),端到端自動駕駛。”
對此,王曉剛強調(diào):“有新的數(shù)據(jù),才能實現(xiàn)新的突破。”
然而,作為整車使用過程中的一部分,數(shù)據(jù)與汽車企業(yè)的關(guān)系要比Tier 1企業(yè)更進一步。因此,王曉剛判斷:“數(shù)據(jù)就在主機廠手里,所以誰能夠更接近數(shù)據(jù),誰就能夠在未來發(fā)展過程當(dāng)中占據(jù)主動。”
數(shù)據(jù),不僅是企業(yè)智能化發(fā)展的必備資源,也將是改變市場格局的決定因素。
“以前大家關(guān)注的,誰的算法比較先進或者有沒有芯片,能不能進行垂直的整合,這四家(地平線、大疆、華為、Momenta)可能多多少少都有類似的特點。” 王曉剛分析,對比前后兩個時段,競爭因素正在發(fā)生變化。
“接下來端到端最核心的點,不一定是軟硬一體或者進行垂直整合,而是數(shù)據(jù)。誰離數(shù)據(jù)最近,誰的數(shù)據(jù)基礎(chǔ)設(shè)施最強,誰能把這些數(shù)據(jù)基礎(chǔ)設(shè)施鋪到主機廠,誰在未來發(fā)展和競爭當(dāng)中就有主動權(quán)。”
基于此,王曉剛判斷,市場格局將會因此而改變。
“今天畢竟還是技術(shù)驅(qū)動的行業(yè),當(dāng)技術(shù)發(fā)生變革的時候,這里面生產(chǎn)力核心要素就會發(fā)生變化,這也意味著給市場上競爭的態(tài)勢帶來新的變化。”
目前,商湯絕影通過實車采集和仿真生成兩種方式解決數(shù)據(jù)數(shù)量的問題。對于仿真幻覺導(dǎo)致數(shù)據(jù)質(zhì)量不足的問題,商湯絕影的方式是提前干預(yù)。
王曉剛介紹:“所謂幻覺的問題,跟模型訓(xùn)練的方式還是密切相關(guān)的。我們說語言模型,多模態(tài)模型,它實際上也都存在幻覺的問題,但是我們在數(shù)據(jù)準(zhǔn)備,輸入監(jiān)督信號,事件模型,輸入的時候不光是用自然語言做這些描述去生成視頻,這里面還會給它非常精準(zhǔn)的信號。”
03 數(shù)據(jù)基礎(chǔ)設(shè)施更重要
從動態(tài)發(fā)展的角度,數(shù)據(jù)基礎(chǔ)設(shè)施將是比數(shù)據(jù)更為重要的競爭要素。
王曉剛強調(diào):“如果更加準(zhǔn)確的來說,數(shù)據(jù)并不是最關(guān)鍵的,而是數(shù)據(jù)的基礎(chǔ)設(shè)施和數(shù)據(jù)管線是最重要的。”
是因為,“有效的數(shù)據(jù)是隨著算法的變化而變化的。我永遠(yuǎn)不可能去存儲最原始的數(shù)據(jù)。因為無論是通訊,還是存儲成本都太高了。算法和模型變的時候,提取數(shù)據(jù)的方式就會發(fā)生變化。”
因此市場競爭的底層邏輯便指向:“你只要有這樣一套有效的數(shù)據(jù)生產(chǎn)的管線隨時隨地都可以有新的數(shù)據(jù)高效地引進來。”
在這個邏輯指引下,商湯絕影與奇瑞大卓、東風(fēng)汽車分別在智駕和智艙領(lǐng)域建立戰(zhàn)略合作關(guān)系,共享數(shù)據(jù)資源。
基于此的戰(zhàn)略合作,將帶來兩個明顯的改善。
其一,節(jié)約資源。王曉剛認(rèn)為:“很多是重復(fù)性的投入,這就在于基礎(chǔ)的設(shè)施數(shù)據(jù),大家沒有進行對齊。今天之所以會出現(xiàn)成本高的問題,在于機制上大家合作的模式。”
王曉剛強調(diào),現(xiàn)階段的競爭方式不具備可持續(xù)性。以商湯科技為例,“像大模型,商湯在這方面累計投入超過100個億,后面還會持續(xù)在這方面投入,那任何一家公司在這里面,如果在基礎(chǔ)設(shè)施方面持續(xù)投入的話也是難以承受的。”
因此,王曉剛建議:“大家要找到自己的定位,形成比較有效的合作,而不是惡性競爭和取代的關(guān)系。這樣的話才能夠達(dá)到共贏共生,長久持續(xù)的發(fā)展。”
其二,高效協(xié)同。王曉剛介紹:“我們跟主機廠和自研團隊的協(xié)同,重要的是我們能夠提供基礎(chǔ)算力和數(shù)據(jù)平臺化能力,包括工具鏈。我們要能夠去對齊數(shù)據(jù)生產(chǎn)的標(biāo)準(zhǔn)和算法的架構(gòu)。”與此同時,王曉剛還強調(diào):“如果這些東西對不齊的話,在不同車型上采集的數(shù)據(jù)是沒有辦法進行兼容的。”那么,人工智能發(fā)展的底層基礎(chǔ)也將不復(fù)存在。
以商湯絕影與奇瑞大卓的合作為例,王曉剛介紹:“如果我們跟主機廠自研團隊在數(shù)據(jù)、工具鏈、算法架構(gòu)上對齊以后,當(dāng)涉及到具體交付車型的時候,大家就會比較靈活。有的時候你可以多做一點,有的時候我來多做一點。”
唯此,汽車領(lǐng)域的智能化,才能形成技術(shù)、產(chǎn)品、商業(yè)三者協(xié)同進化的良性發(fā)展。