重構(gòu)人機(jī)交互范式 ViLLA架構(gòu)實(shí)現(xiàn)多模態(tài)深度融合
區(qū)別于傳統(tǒng)單模態(tài)大模型,啟元模型通過(guò)三層異構(gòu)神經(jīng)網(wǎng)絡(luò)構(gòu)建感知決策閉環(huán):視覺(jué)模塊采用動(dòng)態(tài)注意力機(jī)制處理環(huán)境信息,語(yǔ)言引擎集成多輪對(duì)話上下文記憶,而獨(dú)創(chuàng)的Latent Action空間則將抽象指令轉(zhuǎn)化為可執(zhí)行的動(dòng)作序列。在測(cè)試中,模型展現(xiàn)出跨場(chǎng)景任務(wù)遷移能力——面對(duì)"整理雜亂書(shū)桌"指令時(shí),系統(tǒng)能自主規(guī)劃路徑、識(shí)別物品類別并完成精準(zhǔn)抓取擺放,全程無(wú)需人工干預(yù)。
全場(chǎng)景落地加速 智能終端迎來(lái)革命性升級(jí)
基于啟元基座開(kāi)發(fā)的具身智能終端已進(jìn)入規(guī)模化測(cè)試階段。在工業(yè)質(zhì)檢領(lǐng)域,搭載該模型的機(jī)械臂可將零件缺陷識(shí)別準(zhǔn)確率提升至99.7%,同時(shí)將操作效率提高3倍;智能家居系統(tǒng)中,家庭服務(wù)機(jī)器人可通過(guò)三維語(yǔ)義理解實(shí)現(xiàn)"擦桌子時(shí)避開(kāi)裝飾品"等精細(xì)化動(dòng)作。更值得關(guān)注的是醫(yī)療護(hù)理場(chǎng)景,經(jīng)過(guò)專業(yè)數(shù)據(jù)訓(xùn)練的機(jī)器人已能協(xié)助完成導(dǎo)診分診、康復(fù)器械操作等專業(yè)任務(wù),為老齡化社會(huì)提供解決方案。
產(chǎn)學(xué)研聯(lián)動(dòng)構(gòu)建生態(tài)壁壘
智元科技聯(lián)合清華大學(xué)、中科院自動(dòng)化所等機(jī)構(gòu)成立"具身智能聯(lián)合實(shí)驗(yàn)室",計(jì)劃年內(nèi)開(kāi)放百萬(wàn)級(jí)參數(shù)級(jí)的開(kāi)源訓(xùn)練框架。公司CEO李峰透露:"我們將持續(xù)投入超20億元研發(fā)資金,年內(nèi)推出支持多國(guó)語(yǔ)言、適配主流硬件的開(kāi)發(fā)者套件,與合作伙伴共建具身智能產(chǎn)業(yè)生態(tài)。"隨著國(guó)家"新一代人工智能發(fā)展規(guī)劃"的深入推進(jìn),智元科技此次突破或?qū)⒓铀傥覈?guó)在通用人工智能賽道上的國(guó)際競(jìng)爭(zhēng)力。