注意看,小帥一個(gè)轉(zhuǎn)身,衛(wèi)衣帽子里面居然 空 無(wú) 一 頭:
好啦,這不是驚悚恐怖片,而是來(lái)自 UCSD(加州大學(xué)圣地亞哥分校)全華人團(tuán)隊(duì)的最新研究成果。
他們提出一種特別的全身控制策略(ExBody),能對(duì)人形機(jī)器人進(jìn)行全身控制。策略主要訓(xùn)練人形機(jī)器人上半身,下半身則專注于負(fù)責(zé)維持穩(wěn)定。
這樣訓(xùn)練出來(lái)的人形機(jī)器人,能實(shí)現(xiàn)穩(wěn)健的運(yùn)動(dòng)和動(dòng)態(tài)運(yùn)動(dòng)跟蹤。簡(jiǎn)而言之,會(huì)的活多,表現(xiàn)力還強(qiáng)。
比如和人類邊貼貼邊跳舞,增進(jìn)增進(jìn)人形機(jī)器人和人類之間的感情:
穿著熒光小馬甲,就能立刻上崗街頭指揮人車交通:
研究論文資料顯示,這個(gè)研究團(tuán)隊(duì)共 6 人,其中過(guò)半是 UCSD 的在讀博士生。
為什么要對(duì)人形機(jī)器人做這樣的訓(xùn)練呢?論文共同一作 Xuxin Cheng 在推特上賣力宣傳的同時(shí),做出了解釋。
機(jī)器人總是被要求化身各行各業(yè)的打工人!我們就想跟它一起探索另一條方向的路~
當(dāng)人形機(jī)器人“富有表現(xiàn)力”
團(tuán)隊(duì)的這項(xiàng)研究名為《Expressive Whole-Body Control for Humanoid Robots》,研究目標(biāo)是讓人形機(jī)器人在現(xiàn)實(shí)世界中產(chǎn)生豐富、多樣和富有表現(xiàn)力的動(dòng)作。
在經(jīng)過(guò)團(tuán)隊(duì)的調(diào)教后,人形機(jī)器人能做出什么樣的行為呢?
路遇朋友迎面擊掌,這是不在話下的。
我都能腦補(bǔ)出它大聲喊了一句 Hey Man……
親切一點(diǎn),路遇兄弟,來(lái)個(gè)抱抱:
有點(diǎn)搞笑的事,不管是擊掌還是擁抱,機(jī)器人下半身跺腳的行為并不會(huì)停止,只是會(huì)稍微放緩。
眼尖的朋友們可能已經(jīng)發(fā)現(xiàn)了,上面的擊掌實(shí)驗(yàn)在不同環(huán)境、不同地面進(jìn)行。
團(tuán)隊(duì)也明確表示,通過(guò)新研究訓(xùn)練出來(lái)的人形機(jī)器人,可以在各種不同的地形地面上健步如飛。
除了上文展示過(guò)的草地和石板路,沙灘對(duì)它來(lái)說(shuō)同樣是小菜一碟:
平整的辦公室地面也可以輕松應(yīng)對(duì):
團(tuán)隊(duì)給出的更多展示中,還表現(xiàn)了更多遇到外界阻力時(shí)行動(dòng)自如的 demo。
狠狠拽它:
拿大球砸它:
還知道抬手示意,“喂,你可以幫我背上小書包了”。
各種操作,看得大伙兒一愣一愣的。
紐約大學(xué)計(jì)算機(jī)科學(xué)助理教授發(fā)推特應(yīng)援,稱這么高水平控制力和表現(xiàn)力的研究成果,居然是一個(gè) 6 人組成的學(xué)術(shù)團(tuán)隊(duì)的產(chǎn)出,“難以置信”!
更多的網(wǎng)友則選擇用“Cool”來(lái)形容這項(xiàng)工作:
“無(wú)他,照著人類學(xué)”
所以,究竟怎么才能讓機(jī)器人像以上般“張牙舞爪”、富有類人表現(xiàn)力?設(shè)想的思路無(wú)他:照著人類學(xué)。
學(xué)習(xí)資料既包括各種人體動(dòng)捕數(shù)據(jù)集,也包括生成模型、video2pose 模型給出的模擬數(shù)據(jù)。
通過(guò)在強(qiáng)化學(xué)習(xí)框架中進(jìn)行全身控制的大規(guī)模訓(xùn)練,機(jī)器人就可以在現(xiàn)實(shí)世界中進(jìn)行動(dòng)作的泛化了。
然而,這樣的 Sim2Real 思想實(shí)際還是遇到了問(wèn)題。
作者介紹,典型數(shù)據(jù)集中的人體模型有 69 個(gè)自由度,但他們所用的機(jī)器人只有 19 個(gè)。除此之外,理論和實(shí)際的扭矩限制也不相同。
這就很尷尬了,等于學(xué)會(huì)的知識(shí)實(shí)際根本不能拿來(lái)就用。
那怎么辦?
那就做一個(gè)小小的改動(dòng):
只讓上半身進(jìn)行模仿,負(fù)責(zé)各種表現(xiàn)力,下半身則只負(fù)責(zé)在任意速度內(nèi)把兩條腿控制穩(wěn)定就行。
作者姑且就管這個(gè)方法就叫做“表現(xiàn)型全身控制”(Expressive Whole-Body Control (Exbody))。
由此,該機(jī)器人的整體框架就長(zhǎng)這樣:
首先,在拿到各種數(shù)據(jù)集后,系統(tǒng)會(huì)有一個(gè)運(yùn)動(dòng)重定向,用于獲取一系列與符合機(jī)器人運(yùn)動(dòng)學(xué)結(jié)構(gòu)的運(yùn)動(dòng)片段。
然后在從這些片段中提取表達(dá)目標(biāo)和根運(yùn)動(dòng)目標(biāo),進(jìn)行“Exbody”策略的強(qiáng)化學(xué)習(xí)訓(xùn)練,最終將指令部署到真實(shí)機(jī)器人身上。
其中,表達(dá)目標(biāo)就是機(jī)器人上半身要完成的,根運(yùn)動(dòng)目標(biāo)則歸于下半身(當(dāng)然,這部分也可以用遙控命令直接給出)。
最終,和各種基線方法相比,該機(jī)器人取得了如下成績(jī):有幾項(xiàng)比較突出的指標(biāo),整體表現(xiàn)還不錯(cuò)。
(MELV:Mean Episode Linear Velocity Tracking Reward,線性速度跟蹤獎(jiǎng)勵(lì) MEK:Mean episode key body tracking reward,關(guān)鍵身體追蹤獎(jiǎng)勵(lì))
而從下圖來(lái)看,Exbody 的策略也能讓機(jī)器人在表現(xiàn)時(shí)(例如擊掌)膝蓋彎曲更多,抬腳時(shí)腳離地面更高。言外之意,動(dòng)作更賣力更富有表現(xiàn)力一些~當(dāng)然,也更穩(wěn)。
全華人團(tuán)隊(duì)出品
本研究一共 6 位作者,全部為華人,全部來(lái)自加州大學(xué)圣地亞哥分校(UCSD)。
共同一作有兩位:
Xuxin Cheng,UCSD 博一在讀,碩士畢業(yè)于 CMU 機(jī)器人專業(yè),本科則畢業(yè)于北理工自動(dòng)化專業(yè)。
Yandong Ji,同 UCSD 博一在讀,碩士畢業(yè)于 UC 伯克利機(jī)械工程,本科畢業(yè)于南開(kāi)大學(xué)電子計(jì)算機(jī)工程專業(yè)。
通訊作者為他們的導(dǎo)師 Xiaolong Wang,UCSD 電氣工程系助理教授。
他博士畢業(yè)于 CMU,目前的研究方向集中于 CV 和機(jī)器人技術(shù)等等,谷歌學(xué)術(shù)顯示論文引用次數(shù) 23000+。
哦對(duì)了最后,團(tuán)隊(duì)成員還包括本次研究所用的機(jī)器人:來(lái)自宇樹(shù)科技的 Unitree H1。
One More Thing
要說(shuō)最近的機(jī)器人進(jìn)展,還真不少。
先是 OpenAI 和微軟押注的 Figure 剛剛宣布,新一輪融資籌集了約 6.75 億美元,融資前估值約 20 億美元。
緊接著發(fā)布了個(gè)視頻,介紹了旗下人形機(jī)器人 Figure 01 的最新進(jìn)展,稱“一切都是自主的”:
再有就是那個(gè)面部表情極其豐富,有時(shí)驚艷有時(shí)又驚悚的 Ameca,最新宣布已具有視覺(jué)能力。
她能觀察所處房間的整個(gè)情況,然后用各種各樣的聲音語(yǔ)氣(包括但不限于馬斯克、海綿寶寶)跟你繪聲繪色地描述。
就怪有意思的 hhhhhh
參考鏈接:
[1]https://expressive-humanoid.github.io/resources/Expressive_Whole-Body_Control_for_Humanoid_Robots.pdf
[2]https://expressive-humanoid.github.io/
[3]https://twitter.com/xiaolonw/status/1762528106001379369
本文來(lái)自微信公眾號(hào):量子位 (ID:QbitAI),作者:衡宇 豐色
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。