以三年為時(shí)間界限,可以說(shuō),自動(dòng)駕駛盈利的時(shí)間節(jié)點(diǎn)近在咫尺。
對(duì)此,王曉剛有兩個(gè)角度的考慮,其一是開(kāi)源,整車(chē)企業(yè)的車(chē)型項(xiàng)目越來(lái)越多;其二是節(jié)流,“比較重要的是合作的模式,能夠以更高的性?xún)r(jià)比的方式去完成交付,實(shí)際上還包括新技術(shù)和新產(chǎn)品的開(kāi)發(fā)。”
同時(shí),王曉剛認(rèn)為,現(xiàn)階段,市場(chǎng)的競(jìng)爭(zhēng)態(tài)勢(shì)和虧損的現(xiàn)狀很不合理,導(dǎo)致整個(gè)行業(yè)和智駕領(lǐng)域都存在問(wèn)題。破局的方法便是避免同質(zhì)化競(jìng)爭(zhēng),“要做出既有用戶(hù)價(jià)值,還有特色功能的產(chǎn)品出來(lái)”。也就是說(shuō),“從產(chǎn)品設(shè)計(jì)、技術(shù)發(fā)展路線(xiàn)上,找到自己獨(dú)特的路線(xiàn)和價(jià)值。”
01 AGI將為商湯絕影打開(kāi)新局面
媒體采訪之前的發(fā)布會(huì)上,商湯絕影發(fā)布了三款產(chǎn)品,分別針對(duì)智艙、智駕和世界模型。
智艙領(lǐng)域,商湯絕影首次發(fā)布智艙座艙大模型創(chuàng)新產(chǎn)品「A New Member For U」(你的家庭新成員)。
王曉剛介紹:“在座艙里面我們的New Member,它的設(shè)計(jì)跟今天市面上大模型的使用是有本質(zhì)的差別,實(shí)際上背后是有很多新技術(shù)的支撐,包括我們對(duì)于產(chǎn)品體驗(yàn)的要求。”
相較以往被動(dòng)接受指令的車(chē)機(jī),「A New Member For U」依靠原生流式多模態(tài)大模型、車(chē)載類(lèi)人記憶框架和持續(xù)運(yùn)行框架等前沿AI大模型技術(shù),能夠感知用戶(hù)的語(yǔ)音、表情、手勢(shì)、以及環(huán)境數(shù)據(jù),并進(jìn)行深度理解和推理思考,進(jìn)而在車(chē)內(nèi)空間與人進(jìn)行主動(dòng)互動(dòng)。
在《人機(jī)對(duì)話(huà)交易中的響應(yīng)時(shí)間》的論文中,羅伯特·米勒指出,人類(lèi)幾乎察覺(jué)不到100毫秒以下的延遲。而「A New Member For U」的數(shù)據(jù)延遲控制在1毫秒以下,首包延時(shí)最快只需60毫秒。
在智能駕駛領(lǐng)域,商湯絕影構(gòu)建了「車(chē)云一體」的產(chǎn)品矩陣,發(fā)布涵蓋高速、城區(qū)以及泊車(chē)等全場(chǎng)景的高階智駕、端到端智駕等絕影量產(chǎn)智駕產(chǎn)品體系。
基于J6E、J6M、Orin等不同算力平臺(tái),商湯絕影打造了全場(chǎng)景高階智駕、端到端智駕等絕影量產(chǎn)智駕產(chǎn)品體系?;贘6平臺(tái)的智駕方案預(yù)計(jì)2025年第二季度將量產(chǎn)交付,而量產(chǎn)端到端智駕方案則預(yù)計(jì)會(huì)在明年年底量產(chǎn)落地。
在世界模型方面,商湯科技全新升級(jí)「開(kāi)悟」世界模型,以此打造堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)設(shè)施。
對(duì)于世界模型來(lái)說(shuō),其基礎(chǔ)與核心能力便是生成高質(zhì)量視頻數(shù)據(jù)。官方數(shù)據(jù)顯示,在真實(shí)的基礎(chǔ)上,「開(kāi)悟」生成的場(chǎng)景視頻,時(shí)間最長(zhǎng)為150秒、分辨率可達(dá)1080P、視角可以實(shí)現(xiàn)11V。
另外,通過(guò)多模態(tài)大模型,「開(kāi)悟」世界模型可以支持多樣化的自動(dòng)駕駛場(chǎng)景及Corner case的可控生成。目前商湯絕影基于1024類(lèi)場(chǎng)景,能夠泛化出更多的平行世界,打造了千萬(wàn)級(jí)的生成場(chǎng)景庫(kù),預(yù)計(jì)2025年對(duì)行業(yè)開(kāi)放。
王曉剛認(rèn)為:“我們已經(jīng)站在AGI時(shí)代的門(mén)口。作為加速智能汽車(chē)駛?cè)階GI時(shí)代的戰(zhàn)略合作伙伴,商湯絕影將牢牢把握住新一輪智能汽車(chē)變革的時(shí)間窗口,與車(chē)企伙伴進(jìn)行全方位深度合作,共享大算力與大模型,共建數(shù)據(jù)基礎(chǔ)設(shè)施,共同打造智能汽車(chē)大模型創(chuàng)新應(yīng)用。”
02 數(shù)據(jù)很重要
進(jìn)入AGI時(shí)代,數(shù)據(jù)的重要性愈發(fā)明顯。
王曉剛表示:“傳統(tǒng)的是模塊化分工,Tier-1負(fù)責(zé)集成,作為整體黑盒標(biāo)準(zhǔn)化的交付;但是未來(lái)在端到端自動(dòng)駕駛到來(lái)的時(shí)候,更多是要依賴(lài)數(shù)據(jù)的驅(qū)動(dòng)。”
如何解決數(shù)據(jù)數(shù)量、質(zhì)量和完備性的問(wèn)題?
王曉剛分析:“過(guò)去一年多的發(fā)展,實(shí)際上大模型在快速發(fā)展的時(shí)候是把互聯(lián)網(wǎng)上公開(kāi)的數(shù)據(jù)價(jià)值快速榨取了。互聯(lián)網(wǎng)上的數(shù)據(jù)已經(jīng)被用到了。新的數(shù)據(jù)很大方向就是垂直行業(yè)里面,比如說(shuō)在自動(dòng)駕駛里面采集的各種數(shù)據(jù),端到端自動(dòng)駕駛。”
對(duì)此,王曉剛強(qiáng)調(diào):“有新的數(shù)據(jù),才能實(shí)現(xiàn)新的突破。”
然而,作為整車(chē)使用過(guò)程中的一部分,數(shù)據(jù)與汽車(chē)企業(yè)的關(guān)系要比Tier 1企業(yè)更進(jìn)一步。因此,王曉剛判斷:“數(shù)據(jù)就在主機(jī)廠手里,所以誰(shuí)能夠更接近數(shù)據(jù),誰(shuí)就能夠在未來(lái)發(fā)展過(guò)程當(dāng)中占據(jù)主動(dòng)。”
數(shù)據(jù),不僅是企業(yè)智能化發(fā)展的必備資源,也將是改變市場(chǎng)格局的決定因素。
“以前大家關(guān)注的,誰(shuí)的算法比較先進(jìn)或者有沒(méi)有芯片,能不能進(jìn)行垂直的整合,這四家(地平線(xiàn)、大疆、華為、Momenta)可能多多少少都有類(lèi)似的特點(diǎn)。” 王曉剛分析,對(duì)比前后兩個(gè)時(shí)段,競(jìng)爭(zhēng)因素正在發(fā)生變化。
“接下來(lái)端到端最核心的點(diǎn),不一定是軟硬一體或者進(jìn)行垂直整合,而是數(shù)據(jù)。誰(shuí)離數(shù)據(jù)最近,誰(shuí)的數(shù)據(jù)基礎(chǔ)設(shè)施最強(qiáng),誰(shuí)能把這些數(shù)據(jù)基礎(chǔ)設(shè)施鋪到主機(jī)廠,誰(shuí)在未來(lái)發(fā)展和競(jìng)爭(zhēng)當(dāng)中就有主動(dòng)權(quán)。”
基于此,王曉剛判斷,市場(chǎng)格局將會(huì)因此而改變。
“今天畢竟還是技術(shù)驅(qū)動(dòng)的行業(yè),當(dāng)技術(shù)發(fā)生變革的時(shí)候,這里面生產(chǎn)力核心要素就會(huì)發(fā)生變化,這也意味著給市場(chǎng)上競(jìng)爭(zhēng)的態(tài)勢(shì)帶來(lái)新的變化。”
目前,商湯絕影通過(guò)實(shí)車(chē)采集和仿真生成兩種方式解決數(shù)據(jù)數(shù)量的問(wèn)題。對(duì)于仿真幻覺(jué)導(dǎo)致數(shù)據(jù)質(zhì)量不足的問(wèn)題,商湯絕影的方式是提前干預(yù)。
王曉剛介紹:“所謂幻覺(jué)的問(wèn)題,跟模型訓(xùn)練的方式還是密切相關(guān)的。我們說(shuō)語(yǔ)言模型,多模態(tài)模型,它實(shí)際上也都存在幻覺(jué)的問(wèn)題,但是我們?cè)跀?shù)據(jù)準(zhǔn)備,輸入監(jiān)督信號(hào),事件模型,輸入的時(shí)候不光是用自然語(yǔ)言做這些描述去生成視頻,這里面還會(huì)給它非常精準(zhǔn)的信號(hào)。”
03 數(shù)據(jù)基礎(chǔ)設(shè)施更重要
從動(dòng)態(tài)發(fā)展的角度,數(shù)據(jù)基礎(chǔ)設(shè)施將是比數(shù)據(jù)更為重要的競(jìng)爭(zhēng)要素。
王曉剛強(qiáng)調(diào):“如果更加準(zhǔn)確的來(lái)說(shuō),數(shù)據(jù)并不是最關(guān)鍵的,而是數(shù)據(jù)的基礎(chǔ)設(shè)施和數(shù)據(jù)管線(xiàn)是最重要的。”
是因?yàn)椋?ldquo;有效的數(shù)據(jù)是隨著算法的變化而變化的。我永遠(yuǎn)不可能去存儲(chǔ)最原始的數(shù)據(jù)。因?yàn)闊o(wú)論是通訊,還是存儲(chǔ)成本都太高了。算法和模型變的時(shí)候,提取數(shù)據(jù)的方式就會(huì)發(fā)生變化。”
因此市場(chǎng)競(jìng)爭(zhēng)的底層邏輯便指向:“你只要有這樣一套有效的數(shù)據(jù)生產(chǎn)的管線(xiàn)隨時(shí)隨地都可以有新的數(shù)據(jù)高效地引進(jìn)來(lái)。”
在這個(gè)邏輯指引下,商湯絕影與奇瑞大卓、東風(fēng)汽車(chē)分別在智駕和智艙領(lǐng)域建立戰(zhàn)略合作關(guān)系,共享數(shù)據(jù)資源。
基于此的戰(zhàn)略合作,將帶來(lái)兩個(gè)明顯的改善。
其一,節(jié)約資源。王曉剛認(rèn)為:“很多是重復(fù)性的投入,這就在于基礎(chǔ)的設(shè)施數(shù)據(jù),大家沒(méi)有進(jìn)行對(duì)齊。今天之所以會(huì)出現(xiàn)成本高的問(wèn)題,在于機(jī)制上大家合作的模式。”
王曉剛強(qiáng)調(diào),現(xiàn)階段的競(jìng)爭(zhēng)方式不具備可持續(xù)性。以商湯科技為例,“像大模型,商湯在這方面累計(jì)投入超過(guò)100個(gè)億,后面還會(huì)持續(xù)在這方面投入,那任何一家公司在這里面,如果在基礎(chǔ)設(shè)施方面持續(xù)投入的話(huà)也是難以承受的。”
因此,王曉剛建議:“大家要找到自己的定位,形成比較有效的合作,而不是惡性競(jìng)爭(zhēng)和取代的關(guān)系。這樣的話(huà)才能夠達(dá)到共贏共生,長(zhǎng)久持續(xù)的發(fā)展。”
其二,高效協(xié)同。王曉剛介紹:“我們跟主機(jī)廠和自研團(tuán)隊(duì)的協(xié)同,重要的是我們能夠提供基礎(chǔ)算力和數(shù)據(jù)平臺(tái)化能力,包括工具鏈。我們要能夠去對(duì)齊數(shù)據(jù)生產(chǎn)的標(biāo)準(zhǔn)和算法的架構(gòu)。”與此同時(shí),王曉剛還強(qiáng)調(diào):“如果這些東西對(duì)不齊的話(huà),在不同車(chē)型上采集的數(shù)據(jù)是沒(méi)有辦法進(jìn)行兼容的。”那么,人工智能發(fā)展的底層基礎(chǔ)也將不復(fù)存在。
以商湯絕影與奇瑞大卓的合作為例,王曉剛介紹:“如果我們跟主機(jī)廠自研團(tuán)隊(duì)在數(shù)據(jù)、工具鏈、算法架構(gòu)上對(duì)齊以后,當(dāng)涉及到具體交付車(chē)型的時(shí)候,大家就會(huì)比較靈活。有的時(shí)候你可以多做一點(diǎn),有的時(shí)候我來(lái)多做一點(diǎn)。”
唯此,汽車(chē)領(lǐng)域的智能化,才能形成技術(shù)、產(chǎn)品、商業(yè)三者協(xié)同進(jìn)化的良性發(fā)展。