當(dāng)前位置：首頁 > 元宇宙 > AI

人人都能玩得起 AI 機器人，HuggingFace 開源低成本解決方案 LeRobot

來源：責(zé)編：時間：2024-09-01 11:49:20 123觀看

導(dǎo)讀近日，HuggingFace 開源了低成本 AI 機器人 LeRobot，并指導(dǎo)大家從頭開始構(gòu)建 AI 控制的機器人，包括組裝、配置到訓(xùn)練控制機器人的神經(jīng)網(wǎng)絡(luò)。當(dāng)前的 AI 機器人，已經(jīng)可以上躥下跳后空翻、再接閃電五連鞭，代替人類承擔(dān)

近日，HuggingFace 開源了低成本 AI 機器人 LeRobot，并指導(dǎo)大家從頭開始構(gòu)建 AI 控制的機器人，包括組裝、配置到訓(xùn)練控制機器人的神經(jīng)網(wǎng)絡(luò)。

當(dāng)前的 AI 機器人，已經(jīng)可以上躥下跳后空翻、再接閃電五連鞭，代替人類承擔(dān)各種工作。哪怕是當(dāng)大號手辦，咱也想整一個玩玩。

但無奈目前大多公司還在研發(fā)階段，少數(shù)能量產(chǎn)的又有億點小貴。當(dāng)然了，小編相信 AI 和機器人最終會走進(jìn)千家萬戶。

而現(xiàn)在，我們可以玩到一個低成本的解決方案 ——LeRobot：

—— 不知諸位可還記得「炒菜大師」ALOHA？

而這個 LeRobot，就是我們自己可以擁有的 ALOHA，能夠模仿人類完成一些簡單的任務(wù)。

單個機械臂的成本在 200 美元左右，而后端的模型訓(xùn)練在自己的筆記本上就可以搞定。

官方開源了全部的硬件和軟件，包括訓(xùn)練和控制程序、AI 模型、SolidWorks 文件等。

我們可以從零組裝出機械臂，并發(fā)揮想象教會它一些事情。

LeRobot 項目由前特斯拉工程師 Remi Cadene（現(xiàn)在是 HuggingFace 的 principal research scientist）所領(lǐng)導(dǎo)，并給出了一份詳細(xì)的指南，包括如何從頭開始構(gòu)建 AI 控制的機器人，—— 組裝、配置，以及訓(xùn)練控制機器人的神經(jīng)網(wǎng)絡(luò)。

項目基于開源的 Koch v1.1 機器人套件（也可以是別的硬件或者虛擬平臺），包含兩個六電機的機械臂，可使用一個或多個攝像頭作為視覺傳感器。

項目地址：https://github.com/huggingface/lerobot

LeRobot 還計劃在未來開發(fā)更具性價比的 Moss v1 版本，定價僅為 150 美元。

連 Mobile ALOHA 的作者也表示“Amazing”：

對于 AI 機器人，專業(yè)人士認(rèn)為它將成為這個時代的 PC：

我一直在等待兩個平臺的轉(zhuǎn)變：

-相當(dāng)于早期 PC 的 AR / VR

-相當(dāng)于早期個人電腦的機器人

而大多數(shù)網(wǎng)友則更加直接：這是我過去十年來一直想要的機械手，必須得到它！

說到開源的力量，項目剛剛發(fā)布就有網(wǎng)友玩了起來：

因為他表示自己的視頻沒有加速，所以小編也沒給他加速。

目前的 HuggingFace 上給出了四種模型，以及 98 個數(shù)據(jù)集，開發(fā)者還可以選擇在訓(xùn)練過程中上傳自己的數(shù)據(jù)集。

制作自己的 AI Robot

LeRobot 目前使用的機械臂來源于 Alexander Koch 在幾個月前開源的項目：

下圖是前輩的樣子，總體的硬件差別不大，但為了方便大家復(fù)刻和使用，LeRobot 做了一些改進(jìn)。

Koch v1.1 拿掉了之前硬件模型中一些干擾材料，讓尺寸標(biāo)準(zhǔn)化，并為引導(dǎo)臂添加了一個平臺，允許從動臂從地面拾取物體。

通過更換直流轉(zhuǎn)換器，Koch v1.1 無需使用烙鐵進(jìn)行組裝，也無需手動調(diào)節(jié)電壓轉(zhuǎn)換器。

項目還添加了機械臂的 SolidWorks 模型、接線圖以及裝配視頻。

材料清單

以引導(dǎo)臂（LeaderArm）為例：

下表是需要購買的部件，主要的開銷在 6 個舵機上面，剩下的包括電機驅(qū)動板、固定裝置、電源、杜邦線之類的。

而手臂結(jié)構(gòu)的塑料片，則需要根據(jù)給出的文件通過 3D 打印獲得。

實際上對于相關(guān)愛好者來說，這些零件基本都能湊出來，而且咱們國內(nèi)買這些東西也要便宜得多。

另外，如果需要平替或者升級伺服電機的話，記得修改控制程序。

他這里給出的兩種電機扭矩都不大，但精度和轉(zhuǎn)速倒是都挺高，不知道替換后會有多大影響，感興趣的小伙伴不妨一試。

配置和校準(zhǔn)

首先安裝 Koch v1.1 所需的依賴：

pip install -e ".[koch]"

然后按照接線圖給驅(qū)動板和電機供電，USB 連接到電腦：

注意從動臂這邊有倆大一點的電機需要 12V 供電，以及 USB 不能作為電源。

通過以下命令進(jìn)行電機的配置和校準(zhǔn)：

python lerobot/scripts/control_robot.py teleoperate /

--robot-path lerobot/configs/robot/koch.yaml /

--robot-overrides '~cameras' # do not instantiate the cameras

程序?qū)嵗粋€類來調(diào)用 SDK 操作電機（port 改為自己設(shè)備上檢測到的端口）：

DynamixelMotorsBus(port="/dev/tty.usbmodem575E0031751")

接下來配置每個電機的索引（相當(dāng)于在總線上控制時的地址）：

follower_arm = DynamixelMotorsBus(

port=follower_port,

motors={

# name: (index, model)"shoulder_pan": (1, "xl430-w250"),

"shoulder_lift": (2, "xl430-w250"),

"elbow_flex": (3, "xl330-m288"),

"wrist_flex": (4, "xl330-m288"),

"wrist_roll": (5, "xl330-m288"),

"gripper": (6, "xl330-m288"),

)

DynamixelMotorsBus 會自動檢測當(dāng)前電機索引，如果電機中保存的索引與配置文件中不匹配，會觸發(fā)一個配置過程，需要拔掉電機的電源，按順序重新連接電機。

讀寫測試

運行以下代碼：

leader_pos = leader_arm.read("Present_Position")

follower_pos = follower_arm.read("Present_Position")

print(leader_pos)

print(follower_pos)

配置成功后可以得到所有 12 個電機的當(dāng)前位置：

array([2054, 523, 3071, 1831, 3049, 2441], dtype=int32)

array([2003, 1601, 56, 2152, 3101, 2283], dtype=int32)

校準(zhǔn)

手動調(diào)節(jié)機械臂到幾個固定的位置，相當(dāng)于給電機一個相對的歸零位置，同時也保證引導(dǎo)臂和從動臂的靜止位置大致對齊。

通過校準(zhǔn)程序之后，這幾個位置會被寫入配置文件，作為之后運行的基準(zhǔn)。

—— 溫馨提示：記得不要在 Torque_Enable 的情況下硬掰。

開玩！

準(zhǔn)備就緒，下面可以開始控制機械臂了，比如讓從動臂模仿引導(dǎo)臂，設(shè)置采樣頻率 200Hz，操作 30 秒：

import tqdm

seconds = 30

frequency = 200

for _ in tqdm.tqdm(range(seconds*frequency)):

leader_pos = robot.leader_arms["main"].read("Present_Position")

robot.follower_arms["main"].write("Goal_Position", leader_pos)

—— 是不是很簡單？

那么由此可知，訓(xùn)練機械臂模仿人類的原理就是，在從動臂模仿引導(dǎo)臂的同時，加上一個攝像頭的實時畫面，

在模仿（訓(xùn)練）的過程中，模型收集了手臂位置和對應(yīng)的圖像數(shù)據(jù)，之后（推理）就可以根據(jù)當(dāng)前攝像頭看到的畫面來預(yù)測各個電機需要到達(dá)的角度。

小編翻了一下項目的代碼，發(fā)現(xiàn)這個「模仿游戲」所用的 AI 模型居然就是 ALOHA 用的 Action Chunking with Transformers (ACT)。

論文地址：https://arxiv.org/pdf/2304.13705

除了 ACT，你也可以使用或者訓(xùn)練自己的模型，可以改成 ALOHA 那樣的雙臂模式，或者在虛擬環(huán)境中進(jìn)行訓(xùn)練和驗證。

加入攝像頭

項目使用 opencv2 庫來操作 camera，以下代碼同時配置了機械臂和攝像頭：

robot = KochRobot(

leader_arms={"main": leader_arm},

follower_arms={"main": follower_arm},

calibration_path=".cache/calibration/koch.pkl",

cameras={

"laptop": OpenCVCamera(0, fps=30, width=640, height=480),

"phone": OpenCVCamera(1, fps=30, width=640, height=480),

)

robot.connect()

使用下面的代碼嘗試以 60 fps 錄制視頻 30 秒（busy_wait 負(fù)責(zé)控制幀率）：

import time

from lerobot.scripts.control_robot import busy_wait

record_time_s = 30

fps = 60

states = []

actions = []

for _ in range(record_time_s * fps):

start_time = time.perf_counter()

observation, action = robot.teleop_step(record_data=True)

states.append(observation["observation.state"])

actions.append(action["action"])

dt_s = time.perf_counter() - start_time

busy_wait(1 / fps - dt_s)

攝像頭拍攝的圖像幀會以線程的形式保存在磁盤上，并在錄制結(jié)束時編碼為視頻。

也可以將視頻流顯示在窗口中，以方便驗證。

還可以使用命令行參數(shù)設(shè)置數(shù)據(jù)記錄流程，包括錄制開始前、錄制過程和錄制結(jié)束后停留的時間。

可視化

python lerobot/scripts/visualize_dataset_html.py /

--root data /

--repo-id ${HF_USER}/koch_test

以上命令將啟動一個本地 Web 服務(wù)器，如下所示：

建議

一旦您熟悉了數(shù)據(jù)記錄，就可以創(chuàng)建更大的數(shù)據(jù)集進(jìn)行訓(xùn)練。一個好的開始任務(wù)是在不同位置抓取一個物體并將其放入箱子中。

建議至少錄制 50 集，每個地點 10 集。在整個錄制過程中保持?jǐn)z像機固定并保持一致的抓取行為。

實現(xiàn)可靠的抓取性能后，您可以開始在數(shù)據(jù)收集過程中引入更多變化，例如額外的抓取位置、不同的抓取技術(shù)以及改變相機位置。

避免過快地添加太多變化，因為這可能會影響您的結(jié)果。

本文來自微信公眾號：微信公眾號（ID：null），作者：alan，原標(biāo)題《人人都能玩得起 AI 機器人！HuggingFace 開源低成本解決方案》

本文鏈接：http://www.www897cc.com/showinfo-45-6540-0.html人人都能玩得起 AI 機器人，HuggingFace 開源低成本解決方案 LeRobot

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：書生?天際 3.0 實景三維大模型開源發(fā)布：城市級 100 平方公里全范圍實時渲染，VR 設(shè)備可用

下一篇： 2024 三星開發(fā)者大會將于 10 月 3 日在美國加州舉行，聚焦 AI 創(chuàng)新

標(biāo)簽：

熱門焦點

元宇宙的文旅賽道，還能如何發(fā)力？

來源：X增強現(xiàn)實蘋果推出Vision Pro，為XR行業(yè)注入一劑強心針。而在蘋果開發(fā)者大會上迪士尼CEO鮑勃·艾格在宣布迪士尼與蘋果達(dá)成合作，其Disney+流媒體服務(wù)將于Vision Pro
元媧2.7上線：虛擬人視頻制作速度瘋狂翻倍！

來源：清元宇宙炎炎夏日努力工作的Q仔的電腦都冒煙兒啦～今天要給大家介紹兩個新小伙伴——小元和小媧，他們將給大家解讀元媧2.7版本重磅更新內(nèi)容～大家掌聲歡迎～～～本次更
Shiba Inu布局元宇宙走出Meme局限

以「狗狗幣殺手」成名的Shiba Inu（SHIB）在人們的印象中始終有著濃厚的Meme（模因惡搞）烙印，但它似乎一直在嘗試突破這種局限。建立起一個龐大的粉絲社區(qū)后，Shiba Inu
元宇宙畫廊體驗報告：有點頭疼。

2 月 10 日，Hrishi Rajasekar 在舊金山鑄幣廠的沉浸式 NFT 展覽 Verse 觀看增強現(xiàn)實藝術(shù)品。“我們現(xiàn)在在虛擬世界中嗎？時間好像變長了” 我問身后排隊的人。我
盤點9個主流元宇宙平臺，你都知道哪些？

隨著NFT的持續(xù)升溫，它也加入了現(xiàn)在的元宇宙浪潮。本文介紹元宇宙的基本概念以及九個最流行的元宇宙NFT平臺，如Decentraland、sandbox等。用熟悉的語言學(xué)習(xí) 以太
知名藝術(shù)家打造去中心化“好萊塢”：一部電影一個DAO

根據(jù)市場追蹤網(wǎng)站 DappRadar 的數(shù)據(jù)，隨著 NFT 的“出圈”與加密貨幣的普及，NFT 市場在 2021 年的銷售額達(dá)到約 250 億美元，而 2020 年僅為 9490 萬美元，同比增超 2
我們?yōu)槭裁葱枰猈eb3，距離Web3的實現(xiàn)還有多遠(yuǎn)？

當(dāng)今技術(shù)正在經(jīng)歷著重要的變革，許多公司正在改變他們的經(jīng)營模式以求變得更加的靈活，其中有很大一部分公司采用了不同的方式來發(fā)展自己的業(yè)務(wù)。其中之一就是Web3，
PayPal CEO 的加密語錄：加密貨幣將重新定義金融世界

PayPal 近年來一直是加密行業(yè)的倡導(dǎo)者。這個本身擁有超過 3.5 億名活躍用戶的支付巨頭，已經(jīng)允許美國和英國的用戶交易或持有比特幣（BTC）、以太坊（ETH）、比特現(xiàn)金（BCH
超級賬本Julian Gordon：聯(lián)盟鏈與公鏈的競爭不是非此即彼

在2021年《福布斯》區(qū)塊鏈50強榜單中，29家企業(yè)使用Hyperledger超級賬本技術(shù)，占比近60%。同年，研究機構(gòu)Blockdata發(fā)布了的調(diào)查報告顯示，訪問Top100上市公司中，有 81

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

人人都能玩得起 AI 機器人，HuggingFace 開源低成本解決方案 LeRobot

元宇宙的文旅賽道，還能如何發(fā)力？

元媧2.7上線：虛擬人視頻制作速度瘋狂翻倍！

Shiba Inu布局元宇宙走出Meme局限

元宇宙畫廊體驗報告：有點頭疼。

盤點9個主流元宇宙平臺，你都知道哪些？

知名藝術(shù)家打造去中心化“好萊塢”：一部電影一個DAO

我們?yōu)槭裁葱枰猈eb3，距離Web3的實現(xiàn)還有多遠(yuǎn)？

PayPal CEO 的加密語錄：加密貨幣將重新定義金融世界

超級賬本Julian Gordon：聯(lián)盟鏈與公鏈的競爭不是非此即彼

最新推薦

元宇宙是投資中國的第五次重大機遇

英特爾首款加密芯片將于今年上市｜國際動態(tài)

重溫 1602 年：DAO 是新的企業(yè)范式嗎？

以用戶為中心，Web3和區(qū)塊鏈如何將用戶放在首位

頭像類NFTs的統(tǒng)治能持續(xù)多久？

PayPal CEO 的加密語錄：加密貨幣將重新定義金融世界

猜你喜歡

熱門推薦

相關(guān)資訊