在科技日新月異的當(dāng)下,機(jī)器人領(lǐng)域的發(fā)展令人矚目。舞臺(tái)上翩翩起舞的機(jī)器人、格斗賽場(chǎng)上靈活翻轉(zhuǎn)的機(jī)器人身影,已不再是新鮮事。然而,在這股“技術(shù)炫風(fēng)”背后,一個(gè)核心問題亟待解答:具身智能如何才能真正融入我們的生產(chǎn)和生活?目前面臨哪些技術(shù)障礙?哪些技能才是最具實(shí)際應(yīng)用價(jià)值的?
近期,在為期兩天的2025北京智源大會(huì)上,多位行業(yè)領(lǐng)袖就此展開了深入探討。智源研究院理事長(zhǎng)黃鐵軍、北京人形機(jī)器人創(chuàng)新中心總經(jīng)理熊友軍、宇樹科技CEO王興興、Physical Intelligence聯(lián)合創(chuàng)始人兼CEO Karol Hausman、北京大學(xué)助理教授及銀河通用創(chuàng)始人兼CTO王鶴、穹徹智能聯(lián)合創(chuàng)始人盧策吾等,共同聚焦具身智能的現(xiàn)實(shí)挑戰(zhàn)與未來趨勢(shì)。
宇樹科技CEO王興興和Physical Intelligence的Karol Hausman認(rèn)為,盡管機(jī)器人比賽更多被視為技術(shù)展示窗口,有助于提升公眾認(rèn)知和產(chǎn)業(yè)關(guān)注度,但其本質(zhì)仍是邁向?qū)嵱没闹匾襟E。王興興指出,人形機(jī)器人在實(shí)用性上雖未全面突破,但通過表演、比賽等形式展示全身動(dòng)作能力,有助于市場(chǎng)教育和科普,同時(shí)具備一定的商業(yè)價(jià)值。他強(qiáng)調(diào),這些“炫技”表演是通往真正實(shí)用化階段的中間橋梁。
王興興進(jìn)一步解釋,他們希望通過參與這些活動(dòng),展示技術(shù)成果,并進(jìn)行商業(yè)化拓展。他堅(jiān)信,當(dāng)AI技術(shù),尤其是具身智能技術(shù)發(fā)展到一定階段時(shí),家用機(jī)器人不僅能跳舞、參加格斗賽,更能勝任家務(wù)、工廠作業(yè)等多種任務(wù)。他坦言,目前讓人形機(jī)器人立即進(jìn)入家庭和工廠還不太現(xiàn)實(shí),但這些活動(dòng)為技術(shù)落地提供了寶貴的實(shí)踐機(jī)會(huì)。
北京大學(xué)助理教授王鶴及穹徹智能聯(lián)合創(chuàng)始人盧策吾則提出,未來機(jī)器人比賽應(yīng)從觀賞性向?qū)嵱眯赞D(zhuǎn)變,聚焦實(shí)際應(yīng)用場(chǎng)景,通過“生產(chǎn)力比賽”推動(dòng)核心技能的形成與優(yōu)化。他們認(rèn)為,“移動(dòng)抓取與放置”是最具突破潛力的通用任務(wù),既適用于藥房、倉(cāng)儲(chǔ)等多種場(chǎng)景,又是實(shí)現(xiàn)具身智能商業(yè)化的關(guān)鍵。
盧策吾強(qiáng)調(diào),力反饋和對(duì)物理世界的深度理解,對(duì)于機(jī)器人應(yīng)對(duì)真實(shí)復(fù)雜環(huán)境至關(guān)重要。他提出,在視覺語言行動(dòng)模型(VLA)框架內(nèi)引入物理世界知識(shí),尤其是力反饋等多模態(tài)信息,能夠提升模型對(duì)復(fù)雜任務(wù)的應(yīng)對(duì)能力和系統(tǒng)魯棒性。
在具身智能的發(fā)展路徑上,VLA逐漸成為行業(yè)共識(shí)。Karol Hausman認(rèn)為,VLA是通往通用智能的重要基石,能夠從多源數(shù)據(jù)中學(xué)習(xí)并轉(zhuǎn)化為具體行動(dòng)。他致力于構(gòu)建一個(gè)通用模型,以跨平臺(tái)控制不同機(jī)器人完成多種任務(wù)。他指出,當(dāng)前挑戰(zhàn)在于提升算法效率與模型穩(wěn)定性,尤其是在陌生環(huán)境中的泛化能力。
王鶴同樣視VLA為核心技術(shù)路徑,但更強(qiáng)調(diào)其實(shí)用導(dǎo)向。他提出,應(yīng)優(yōu)先突破如“移動(dòng)抓取與放置”等核心技能,并在端到端模型中融入合成數(shù)據(jù)訓(xùn)練,以提高效率和落地性。他認(rèn)為,目前具身智能在學(xué)術(shù)研究與產(chǎn)業(yè)應(yīng)用之間存在差距,需要觸覺和力反饋等數(shù)據(jù)來提升魯棒性和成功率。
盧策吾則提出“數(shù)字基因”理念,結(jié)合高精度仿真數(shù)據(jù)與物理反饋,以模擬人類的下意識(shí)操作行為。他指出,仿真與真實(shí)世界的融合是提升系統(tǒng)表現(xiàn)的關(guān)鍵。同時(shí),他也提到,人形機(jī)器人硬件的標(biāo)準(zhǔn)化和通用性對(duì)具身智能算法發(fā)展和落地有顯著影響,數(shù)據(jù)瓶頸部分原因正是由于機(jī)器人硬件平臺(tái)缺乏統(tǒng)一性。
對(duì)于未來通用機(jī)器人的形態(tài),王興興表示,他不堅(jiān)持一定要做人形機(jī)器人。他認(rèn)為,人形機(jī)器人因人類數(shù)據(jù)可用性而具備訓(xùn)練優(yōu)勢(shì),但長(zhǎng)遠(yuǎn)看應(yīng)根據(jù)任務(wù)需求發(fā)展多樣化形態(tài)。他甚至指出,輪子底盤在實(shí)現(xiàn)移動(dòng)方面也是“非常實(shí)用的”選擇。他預(yù)測(cè),在通用人工智能(AGI)出現(xiàn)后,機(jī)器人的形態(tài)將會(huì)多樣化。
而北京人形機(jī)器人創(chuàng)新中心總經(jīng)理熊友軍則堅(jiān)定看好人形機(jī)器人。他指出,人形機(jī)器人在市場(chǎng)容量、自然交互和人類環(huán)境適配性方面具有長(zhǎng)期競(jìng)爭(zhēng)力。盡管短期內(nèi)面臨成本與技術(shù)門檻,但未來潛力巨大。他的團(tuán)隊(duì)正致力于提升人形機(jī)器人的能力。
智源研究院理事長(zhǎng)黃鐵軍從宏觀視角指出,全面媲美人類的AGI(包括具身)仍需數(shù)十年。在未來5-10年,具身智能更可能專注于幫助人類完成危險(xiǎn)或體力活。他強(qiáng)調(diào),具身機(jī)器人的最終使命是超越人類,探索人類無法到達(dá)的未知領(lǐng)域。
本文鏈接:http://www.www897cc.com/showinfo-45-13633-0.html具身智能未來何在?行業(yè)大佬激辯:機(jī)器人“能干活”方顯真功夫
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com