在人工智能領(lǐng)域的熱門賽道上,具身智能正掀起一場前所未有的風(fēng)暴。然而,這一領(lǐng)域的發(fā)展并非一帆風(fēng)順,數(shù)據(jù)瓶頸和多場景泛化難題如同兩座大山,阻擋著前行者的腳步。近日,在世界人工智能大會(WAIC)上,一個名為“悟能”的全新具身智能平臺橫空出世,為行業(yè)帶來了新的曙光。
“悟能”平臺以世界模型為引擎,旨在賦予機(jī)器人強(qiáng)大的感知、導(dǎo)航和多模態(tài)交互能力。在WAIC的展覽現(xiàn)場,各式各樣的機(jī)器人吸引了眾多目光,但行業(yè)內(nèi)的專業(yè)人士深知,這些機(jī)器人雖火爆一時,卻普遍面臨著數(shù)據(jù)短缺和訓(xùn)練效率低的困境,導(dǎo)致自主解決問題能力較弱。
商湯科技,作為人工智能領(lǐng)域的佼佼者,在此次大會上推出了其精心打造的“悟能”平臺。該平臺能夠僅憑一句自然語言描述的場景,生成符合物理規(guī)則、多視角統(tǒng)一、真實(shí)世界還原度極高的多視角視頻,從而破解了仿真數(shù)據(jù)輸出的難題。
想象一下,你仿佛置身于城市的街頭,手握方向盤,腳踩油門,周圍的光影變幻莫測,而這一切,都通過七個攝像頭構(gòu)建出的無比真實(shí)的世界呈現(xiàn)在你眼前。但這并非游戲場景,而是你與AI共同“開悟”的體驗。
“悟能”平臺的出現(xiàn),標(biāo)志著AI將不再僅僅是工具,而是成為了人類的合作者、探索者和創(chuàng)造者。這一平臺之所以能為具身智能帶來如此顯著的賦能,得益于其四大核心功能:感知、導(dǎo)航、交互以及世界模型的構(gòu)建。
在感知方面,商湯憑借其強(qiáng)大的視覺感知能力,為機(jī)器人提供了對世界萬物的識別和理解。無論是機(jī)器狗還是機(jī)器人,都能通過其視覺系統(tǒng),實(shí)時感知周圍環(huán)境,識別場景中的物件和行人。這一能力被完美嵌入到機(jī)器人的核心芯片中,實(shí)現(xiàn)了端側(cè)的高效處理。
導(dǎo)航功能則是“悟能”平臺的另一大亮點(diǎn)。盡管全自主的無人駕駛車已經(jīng)問世,但全自主的機(jī)器狗和機(jī)器人仍屬罕見。商湯的絕影團(tuán)隊,在無人駕駛領(lǐng)域積累了豐富的經(jīng)驗,這些技術(shù)同樣可以應(yīng)用于機(jī)器狗和機(jī)器人的導(dǎo)航上。通過實(shí)時路徑規(guī)劃和避障功能,機(jī)器狗和機(jī)器人能夠在復(fù)雜環(huán)境中自如穿梭。
交互功能則展現(xiàn)了“悟能”平臺的幽默感和全局記憶能力。在現(xiàn)場演示中,一個機(jī)器人通過AI生成的PPT,繪聲繪色地講解了《長安的荔枝》的故事。它不僅能夠自己翻頁,還能在嘈雜環(huán)境中保持主線任務(wù),繼續(xù)講解。這一功能同樣適用于機(jī)器狗,展現(xiàn)了“悟能”平臺在不同形態(tài)硬件上的廣泛適用性。
而世界模型的構(gòu)建,則是“悟能”平臺的核心所在。通過“人、物、場”的構(gòu)建,平臺能夠生成一個4D的真實(shí)世界。用戶只需給出一張具身關(guān)節(jié)模型和簡單的指令,平臺就能生成連續(xù)的視頻和位姿。這些視頻和位姿具有時空一致性,可以從多個角度進(jìn)行觀察,為機(jī)器人的交互訓(xùn)練提供了高質(zhì)量的數(shù)據(jù)。
在自動駕駛領(lǐng)域,“悟能”平臺已經(jīng)能夠用一句自然語言生成一個七視角攝像頭的視頻。這些視頻在空間和時序上都具有一致性,甚至可以進(jìn)行實(shí)時編輯和替換。這些新生成的數(shù)據(jù),為AI進(jìn)入現(xiàn)實(shí)世界提供了閉環(huán)交互訓(xùn)練的解決方案。
如今,商湯將“開悟”世界模型進(jìn)一步擴(kuò)展到具身智能領(lǐng)域,并賦予了它新的名字——“悟能”。這一平臺不僅解決了具身智能領(lǐng)域的數(shù)據(jù)瓶頸問題,還為機(jī)器人的多場景泛化提供了可能。未來,隨著“悟能”平臺的不斷推廣和應(yīng)用,機(jī)器人將成為人類生活中不可或缺的“超級隊友”,在智能制造、醫(yī)療護(hù)理、家庭服務(wù)等多個領(lǐng)域發(fā)揮巨大作用。
本文鏈接:http://www.www897cc.com/showinfo-22-174353-0.html商湯悟能平臺亮相WAIC,具身智能機(jī)器人邁向“覺醒”新時代
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 紅米REDMI Note 14 SE印度發(fā)布:天璣7025 Ultra處理器,配備6.67英寸AMOLED屏