在人工智能領(lǐng)域迎來新突破之際,智元機(jī)器人于近日震撼發(fā)布了其首個(gè)通用具身基座模型——智元啟元大模型Genie Operator-1(簡稱GO-1)。這一創(chuàng)新成果不僅標(biāo)志著機(jī)器人在智能化道路上邁出了重要一步,更預(yù)示著具身智能正加速向通用化、開放化轉(zhuǎn)型。
GO-1的核心在于其提出的Vision-Language-Latent-Action(ViLLA)框架,該框架巧妙融合了VLM(多模態(tài)大模型)與MoE(混合專家)技術(shù)。這一組合賦予了GO-1強(qiáng)大的場景感知、理解能力以及動(dòng)作規(guī)劃、執(zhí)行能力,使得機(jī)器人能夠在極少數(shù)據(jù)甚至零樣本的情況下快速適應(yīng)新場景、新任務(wù)。
具體而言,VLM作為GO-1的主干網(wǎng)絡(luò),通過繼承開源多模態(tài)大模型的權(quán)重,并利用互聯(lián)網(wǎng)上的大規(guī)模純文本和圖文數(shù)據(jù),使機(jī)器人具備了廣泛的場景感知和理解能力。而MoE中的隱動(dòng)作專家模型和動(dòng)作專家模型,則分別利用互聯(lián)網(wǎng)上的大規(guī)模人類操作和跨本體操作視頻,以及高質(zhì)量的仿真數(shù)據(jù)和真機(jī)數(shù)據(jù),讓機(jī)器人學(xué)會(huì)了動(dòng)作的理解和精細(xì)執(zhí)行。
GO-1的五大特點(diǎn)尤為引人注目:采訓(xùn)推一體化設(shè)計(jì),實(shí)現(xiàn)了數(shù)據(jù)采集、模型訓(xùn)練、模型推理的無縫銜接;小樣本快速泛化能力,讓機(jī)器人在極少數(shù)據(jù)下就能快速適應(yīng)新場景、新任務(wù);一腦多形功能,使得GO-1能夠在不同機(jī)器人形態(tài)之間遷移,快速適配到不同本體;持續(xù)進(jìn)化特性,借助智元的數(shù)據(jù)回流系統(tǒng),機(jī)器人能夠從實(shí)際執(zhí)行中遇到的問題數(shù)據(jù)中持續(xù)學(xué)習(xí)、不斷進(jìn)步;人類視頻學(xué)習(xí)能力,讓機(jī)器人能夠結(jié)合互聯(lián)網(wǎng)視頻和真實(shí)人類示范進(jìn)行學(xué)習(xí),增強(qiáng)對人類行為的理解。
在構(gòu)建過程中,GO-1基于具身領(lǐng)域的數(shù)字金字塔架構(gòu),從底層到頂層依次吸收了互聯(lián)網(wǎng)的大規(guī)模純文本與圖文數(shù)據(jù)、人類操作/跨本體視頻、仿真數(shù)據(jù)以及高質(zhì)量的真機(jī)示教數(shù)據(jù)。這一全面的“基礎(chǔ)教育”和“能力培訓(xùn)”,使GO-1能夠輕松面對多種多樣的環(huán)境和物體,快速學(xué)習(xí)新的操作。
在實(shí)際應(yīng)用中,GO-1展現(xiàn)出了驚人的表現(xiàn)。用戶只需用平常講話的方式告訴機(jī)器人要做的事情,比如“掛衣服”,機(jī)器人就能根據(jù)所看到的畫面以及所學(xué)過的知識(shí),理解指令的含義和要求,并快速規(guī)劃出執(zhí)行步驟,精準(zhǔn)完成整個(gè)任務(wù)。從家庭場景中的準(zhǔn)備餐食、收拾桌面,到辦公和商業(yè)場景中的接待訪客、發(fā)放物品,GO-1都能游刃有余。
GO-1還具備持續(xù)進(jìn)化的能力。例如,當(dāng)機(jī)器人在做咖啡時(shí)不小心把杯子放歪了,它就能從這次失敗中汲取經(jīng)驗(yàn),通過數(shù)據(jù)回流系統(tǒng)持續(xù)學(xué)習(xí),直到成功完成任務(wù)。這種不斷學(xué)習(xí)和進(jìn)步的能力,讓GO-1在應(yīng)對多變真實(shí)世界時(shí)更加從容不迫。
智元機(jī)器人還預(yù)告了未來幾個(gè)月將推出基于強(qiáng)化學(xué)習(xí)的仿真模型,以及新的人形機(jī)器人。這無疑將為GO-1的應(yīng)用場景拓展提供更多可能性,也讓人們對未來機(jī)器人的智能化水平充滿了期待。
本文鏈接:http://www.www897cc.com/showinfo-45-11422-0.html智元機(jī)器人發(fā)布通用基座大模型GO-1,新人形機(jī)器人亮相在即
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com