日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 科技  > 數(shù)碼

VLA模型:具身智能的突破與挑戰(zhàn)

來源: 責(zé)編: 時(shí)間:2025-06-04 08:03:22 41觀看
導(dǎo)讀在具身智能領(lǐng)域,視覺-語言-動(dòng)作模型(VLA)作為一種新興范式,正逐漸嶄露頭角。該模型通過整合視覺信息、語言指令和行動(dòng)決策,顯著提升了機(jī)器人對復(fù)雜環(huán)境的理解和適應(yīng)能力,為機(jī)器人從單一任務(wù)執(zhí)行向多樣化場景自主決策的轉(zhuǎn)變

在具身智能領(lǐng)域,視覺-語言-動(dòng)作模型(VLA)作為一種新興范式,正逐漸嶄露頭角。該模型通過整合視覺信息、語言指令和行動(dòng)決策,顯著提升了機(jī)器人對復(fù)雜環(huán)境的理解和適應(yīng)能力,為機(jī)器人從單一任務(wù)執(zhí)行向多樣化場景自主決策的轉(zhuǎn)變提供了強(qiáng)大支持。VLA因此成為學(xué)術(shù)界和工業(yè)界的研究熱點(diǎn)。HT028資訊網(wǎng)——每日最新資訊28at.com

近期,雷峰網(wǎng)與AI科技評論GAIR Live品牌聯(lián)合舉辦了一場線上圓桌沙龍,主題為“具身智能之VLA的實(shí)踐與突破”。此次沙龍由北京大學(xué)計(jì)算機(jī)學(xué)院助理教授仉尚航主持,并邀請了清華大學(xué)交叉信息院的助理教授高陽、趙行,以及北京大學(xué)人工智能研究院的助理教授楊耀東,共同探討VLA的最新進(jìn)展和未來方向。HT028資訊網(wǎng)——每日最新資訊28at.com

HT028資訊網(wǎng)——每日最新資訊28at.com

沙龍上,仉尚航首先引導(dǎo)討論了VLA的定義、起源及其與其他相關(guān)模型的區(qū)別。隨后,各位嘉賓深入分析了VLA的技術(shù)路線和新成果,探討了不同技術(shù)路線的優(yōu)缺點(diǎn),并圍繞機(jī)器人常見任務(wù),剖析了核心技術(shù)瓶頸和主流輸出范式。還討論了強(qiáng)化學(xué)習(xí)與VLA的結(jié)合、泛化能力的提升、異構(gòu)數(shù)據(jù)的利用以及協(xié)同訓(xùn)練等議題。HT028資訊網(wǎng)——每日最新資訊28at.com

高陽指出,推理與數(shù)據(jù)是當(dāng)前VLA面臨的兩大核心挑戰(zhàn)。盡管已有不少研究探索了VLA與推理的結(jié)合路徑,但尚未找到最優(yōu)方案。同時(shí),VLA的數(shù)據(jù)量級遠(yuǎn)不及訓(xùn)練大語言模型(VLM)的數(shù)據(jù),且多樣性嚴(yán)重不足,這限制了模型的能力提升。趙行表示,VLA在實(shí)際應(yīng)用中的系統(tǒng)運(yùn)行頻率單一化問題,以及高低頻自適應(yīng)閉環(huán)系統(tǒng)的設(shè)計(jì),仍是未解決的課題。楊耀東則提到,當(dāng)前VLA訓(xùn)練存在割裂問題,大腦(VLM)和小腦(底層策略模型)多分開訓(xùn)練,缺乏端到端訓(xùn)練及類似人類大小腦的雙向交互。HT028資訊網(wǎng)——每日最新資訊28at.com

在討論VLA的前世今生時(shí),高陽回顧了VLA的起源和發(fā)展,指出其源于大模型的技術(shù)變革。楊耀東則從大模型視角和行為動(dòng)作決策控制視角闡述了VLA的重要性。趙行則分享了GPT-4發(fā)布對其研究方向的啟發(fā),以及VLA在解決長尾問題上的潛力。HT028資訊網(wǎng)——每日最新資訊28at.com

對于VLA的技術(shù)路線和最新進(jìn)展,高陽提到了架構(gòu)與數(shù)據(jù)兩方面的進(jìn)展,并強(qiáng)調(diào)了數(shù)據(jù)多樣性的重要性。楊耀東從模型架構(gòu)角度分類了VLA,并探討了行為動(dòng)作空間的表征方式。趙行則關(guān)注雙系統(tǒng)設(shè)計(jì),并介紹了不同團(tuán)隊(duì)在VLA方面的研究成果。HT028資訊網(wǎng)——每日最新資訊28at.com

在探討VLA的核心技術(shù)瓶頸時(shí),高陽強(qiáng)調(diào)推理和數(shù)據(jù)的挑戰(zhàn),趙行提到高低頻自適應(yīng)閉環(huán)系統(tǒng)的設(shè)計(jì)難題,楊耀東則指出端到端訓(xùn)練和測試時(shí)計(jì)算閉環(huán)的缺乏。對于強(qiáng)化學(xué)習(xí)與VLA的結(jié)合,嘉賓們一致認(rèn)為這是VLA發(fā)展的必由之路,但仍面臨許多未解問題。HT028資訊網(wǎng)——每日最新資訊28at.com

在數(shù)據(jù)使用方面,高陽強(qiáng)調(diào)數(shù)據(jù)的多樣性比絕對數(shù)量更重要,并介紹了千尋智能如何利用互聯(lián)網(wǎng)數(shù)據(jù)優(yōu)化VLA模型。楊耀東則提出,互聯(lián)網(wǎng)數(shù)據(jù)雖然豐富,但信噪比低,且對具體任務(wù)的適用性有限。趙行則認(rèn)為,仿真數(shù)據(jù)可以作為真實(shí)數(shù)據(jù)的補(bǔ)充,通過技術(shù)手段縮小sim to real gap。HT028資訊網(wǎng)——每日最新資訊28at.com

對于VLA的泛化能力,嘉賓們提出了多種提升策略,包括利用大量互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行聯(lián)合訓(xùn)練、創(chuàng)新模型架構(gòu)、實(shí)現(xiàn)具身認(rèn)知等。在探討VLA與本體構(gòu)型設(shè)計(jì)的關(guān)系時(shí),嘉賓們認(rèn)為VLA模型與機(jī)器人本體沒有必然綁定,但硬件局限和VLA能力需相互匹配。HT028資訊網(wǎng)——每日最新資訊28at.com

最后,關(guān)于VLA是否能完成長程任務(wù),嘉賓們持不同觀點(diǎn)。高陽認(rèn)為,先通過VLM拆解任務(wù)再由VLA執(zhí)行是更實(shí)際的方法。楊耀東則強(qiáng)調(diào)VLA具備完成長程任務(wù)的潛力,并指出需賦予模型推理能力和測試時(shí)計(jì)算閉環(huán)。趙行則提出,需先定義和評測推理能力,再探索VLA在長程任務(wù)中的應(yīng)用。HT028資訊網(wǎng)——每日最新資訊28at.com

在落地場景方面,嘉賓們一致認(rèn)為工業(yè)場景是VLA最先落地的選擇,但也提到了商業(yè)領(lǐng)域和ToBC模式等新場景的可能性。HT028資訊網(wǎng)——每日最新資訊28at.com

此次圓桌沙龍為觀眾帶來了VLA領(lǐng)域的深入洞察和前沿思考,對于推動(dòng)VLA技術(shù)的發(fā)展和應(yīng)用具有重要意義。HT028資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-24-155818-0.htmlVLA模型:具身智能的突破與挑戰(zhàn)

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 賽力斯5月銷量穩(wěn)健增長,鴻蒙智行全系交付再創(chuàng)新高!

下一篇: 雷軍透露:小米汽車工廠試用機(jī)器人,汽車芯片即將面世

標(biāo)簽:
  • 熱門焦點(diǎn)
Top 主站蜘蛛池模板: 千阳县| 叶城县| 江山市| 保德县| 临泽县| 文水县| 叶城县| 吉林市| 甘谷县| 子洲县| 梅河口市| 汪清县| 栖霞市| 营口市| 甘谷县| 安达市| 驻马店市| 米林县| 富蕴县| 依安县| 北宁市| 敖汉旗| 旬阳县| 永善县| 固阳县| 曲沃县| 彝良县| 民县| 宁化县| 苏尼特左旗| 淮北市| 收藏| 威远县| 靖宇县| 三亚市| 阜康市| 集安市| 西华县| 呼图壁县| 普洱| 庆云县|