今日,智元具身研究中心宣布推出第二代一體化具身大小腦系統(tǒng)GenieReasoner。該系統(tǒng)針對VLA模型中語義推理與動作控制的模態(tài)對齊難題,提出了一種支持統(tǒng)一離散化預(yù)訓(xùn)練的模型架構(gòu),并通過流匹配技術(shù)緩解了傳統(tǒng)離散Tokenizer的動作精度瓶頸。這一創(chuàng)新不僅提升了推理能力,還在跨本體真機(jī)實(shí)驗中展現(xiàn)了卓越的泛化性。
智元具身研究中心進(jìn)一步開源了ERIQ,這是一個聚焦于真機(jī)操控全流程的具身推理評測基準(zhǔn),旨在解耦量化評估VLA中具身大腦不同維度的推理能力。實(shí)驗結(jié)果表明,GenieReasoner在推理能力上達(dá)到了SOTA(State of the Art),并且在端到端動作執(zhí)行表現(xiàn)上也有顯著提升,驗證了ERIQ的評估價值。
智元具身研究中心計劃從“邏輯深度”與“執(zhí)行精度”兩個維度持續(xù)推進(jìn)研究,并致力于實(shí)現(xiàn)具身大小腦、世界模型與真機(jī)強(qiáng)化學(xué)習(xí)的閉環(huán)協(xié)同。ERIQBenchmark現(xiàn)已完全開源,可通過提供的項目地址訪問。



來源:一電快訊
返回第一電動網(wǎng)首頁 >
以上內(nèi)容由AI創(chuàng)作,如有問題請聯(lián)系admin#d1ev.com(#替換成@)溝通,AI創(chuàng)作內(nèi)容并不代表第一電動網(wǎng)(m.cslysp.cn)立場。
文中圖片源自互聯(lián)網(wǎng)或AI創(chuàng)作,如有侵權(quán)請聯(lián)系郵件刪除。