2月18日第一電動消息,蘋果公司在自動駕駛領域取得重大突破。蘋果將自博弈技術引入自動駕駛,通過10天生成16億公里的模擬數(shù)據(jù),訓練算法無需真實數(shù)據(jù)。這一技術的核心是GIGAFLOW模擬器,它能夠以極低的成本生成海量的模擬數(shù)據(jù),實現(xiàn)SOTA(State-of-the-art,當前最佳)的效果。蘋果的這一成果在CARLA、nuPlan和Waymo開放數(shù)據(jù)集上進行了零樣本獨立測試,均獲得了SOTA表現(xiàn),證明了其泛化性和魯棒性。
蘋果的自博弈技術類似于自對抗生成網(wǎng)絡(GAN),通過智能體與自我的副本或歷史版本博弈實現(xiàn)進化。在自動駕駛領域,蘋果設計了極簡的獎勵函數(shù),無需真實數(shù)據(jù),而是生成大規(guī)模的模擬數(shù)據(jù),讓多個智能體在地圖上進行自博弈,實現(xiàn)算法進化。這種方法的優(yōu)勢在于速度快、成本低,依靠公共云上的8張A100,蘋果每小時可模擬和學習44億次狀態(tài)轉移,相當于720萬公里的駕駛經(jīng)驗,速度比利用真實數(shù)據(jù)快了36萬倍。