機械社區
標題: 斯坦福家務機器人,看似全能,實際靠遙控 [打印本頁]
作者: Callejon 時間: 2024-1-8 10:23
標題: 斯坦福家務機器人,看似全能,實際靠遙控
近日,斯坦福華人團隊的Mobile ALOHA“全能家務機器人”在網上爆火,它展示了做飯、鋪床、澆花等多種家務技能,可謂是全復合“保姆人才”。
) t3 m3 D9 ~3 c7 f
它能夠煮蝦,可以擦拭桌子上的紅酒,能洗盤子,還可以自動打開電梯。
9 M, a$ G2 e. u- M
還可以打開窗簾為窗臺上的花澆水,將衣服放到洗衣機里、撒上洗衣液洗衣。這讓網友直呼機器人時代已來,它難能可貴在“眼里有活兒”。
; c, `3 `6 z/ E$ H# W
不過,Mobile ALOHA所展示的復雜技能,其實是背后由人遙控操作的。
1月6日清晨,發現網友為Mobile ALOHA所呈現的自主化、智能化能力傾倒后,Mobile ALOHA的兩位研發人員連忙“辟謠”,稱部分動作是機器人自主展示的,部分則由人遙控完成。
" u# u* j# [0 j+ K
為了如實呈現機器人的能力,他們還專門放出了Mobile ALOHA在全自動狀態下的“蠢笨”動作合集,稱 “機器人尚未準備好接管世界”。
1 J; l I* m$ I9 _, [" S# b
當你以為機器人能絲滑優雅地舉起一杯紅酒時,它只能顫顫巍巍地握住杯子,看著酒杯傾倒碎在地上,將紅酒灑滿桌;
) x U3 `3 [; k
紅酒灑滿桌
2 I2 j- _5 V+ M. X, {: Z* K. {
表現頗佳時,機器人能熟悉地端起左手顛鍋、右手拿鏟,完成一道菜肴的制作;但多是幾次,原本揮灑自如的鍋鏟就不是對著鐵鍋底部一頓操作,就是在鍋中揮舞但碰不到菜。
$ i _0 d' u i: _7 c( P% {
失敗的炒菜案例
; X* b$ A: I9 E0 J. M
全自動狀態下,它無法有力地控制住一把平底鍋,將鍋端起后,整個平鍋便不可避免地掉落,為了拯救翻到的鐵鍋,守在旁邊的研究人員還被燙傷了;
; @; d3 o0 Q; X5 f d4 U
倒菜失敗
2 f0 ]4 q$ _4 g" E3 b6 _
甚至一根紅色圓珠筆,Mobile ALOHA也無法拾起。
8 M& s- t# q* ~7 k1 d
拿記號筆
7 b; M% v9 F& J+ F8 t% q. f* C/ N' ?
現實和理想還有差距,但Mobile ALOHA所呈現出的完成精細和復雜的任務的運動操作能力,仍值得關注,這讓未來機器人更具有想象空間。
作者: xmdesign 時間: 2024-1-8 10:49
模仿學習(相當是AI圖像識別里的人工拉框標定),3 E- V' C# l) i0 d
舵機機械臂力不夠&精度不夠,雙視覺給出的位置走不到,手爪缺觸覺感知...
作者: gemiusunyi 時間: 2024-1-8 10:57
這個就是機器人的現狀
2 \* g. w ]2 P: G' ~
作者: bravo090 時間: 2024-1-8 11:30
他也說成功率是95% 這是AI學習的過程吧
作者: xmdesign 時間: 2024-1-8 11:42
之所以火爆刷出圈,應該是因為不用黃教主“大鏟子”的嘗試,使得眾人眼前一亮,加上開源
作者: 學渣渣 時間: 2024-1-8 12:13
. i& Y. E& f9 Q7 Q" E華為在發力昇騰系列,能否干翻黃教主?
1 h$ n8 ]4 g7 Y5 K/ T# D5 o7 V2 O
作者: 喂我袋鹽 時間: 2024-1-8 19:58
% ?9 z) Y* ^3 B, w
nonono,這是丐版/ ]) n4 U8 r- |7 A
作者: 喂我袋鹽 時間: 2024-1-8 19:59
xmdesign 發表于 2024-1-8 10:49. T, p' `9 B' P% Q$ a# l" L. a! ^
模仿學習(相當是AI圖像識別里的人工拉框標定)," ^ R; w" F0 n/ t% [
舵機機械臂力不夠&精度不夠,雙視覺給出的位置走不到, ...
$ x$ m* ]8 V$ M4 M; L% g) X這玩意最終還是要進化到人形,雙臂吧?' H( a( U6 d- O7 ?9 c
作者: xmdesign 時間: 2024-1-9 08:04
: H+ _% q, l8 a+ `7 A3 h- R基本是這樣,去掉雙足的人形。如果想優化斯坦福的DEMO,你只要閉上眼睛先靠觸覺模態完成些類似動作,記錄能成功的動作方式,然后再思考如何與視覺模態融合~運動控制底層增加壓感中斷&條件。。。
, J' ?: N V" O4 C& T' y' m( u8 r- d, A
作者: 紅海星 時間: 2024-2-1 15:38
斯坦福這視頻一出來就能看出來里面水分太大,演示視頻拍攝的視角從來不取機械臂后部,再一個都是10倍以上的速度播放,另外主要是目前這一方向的世界頂級大牛及其團隊從最新發表的論文來看遠沒有達到這種程度。這其實就是具身智能E-AI,但是現狀是不管強化學習還是模仿學習,都學不到很強的操作能力以及較強的泛化能力,也無法脫開實驗訓練環境推廣到一般環境或者新環境中。谷歌2023年初解散了它的機器人項目團隊是有原因的,相比斯坦福那幾個人的小團隊,谷歌更讓人信服,畢竟人家才是具身智能的鼻祖,大名鼎鼎的Transformer算法是人家發表的。
| 歡迎光臨 機械社區 (http://www.whclglass.com.cn/) |
Powered by Discuz! X3.5 |