設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

與人類貼身熱舞:人形機(jī)器人進(jìn)階到街頭耍寶,6 華人組團(tuán)出品

量子位 2024/2/28 12:45:36 責(zé)編:清源

注意看,小帥一個(gè)轉(zhuǎn)身,衛(wèi)衣帽子里面居然 空 無(wú) 一 頭

好啦,這不是驚悚恐怖片,而是來(lái)自 UCSD(加州大學(xué)圣地亞哥分校)全華人團(tuán)隊(duì)的最新研究成果。

他們提出一種特別的全身控制策略(ExBody),能對(duì)人形機(jī)器人進(jìn)行全身控制。策略主要訓(xùn)練人形機(jī)器人上半身,下半身則專注于負(fù)責(zé)維持穩(wěn)定。

這樣訓(xùn)練出來(lái)的人形機(jī)器人,能實(shí)現(xiàn)穩(wěn)健的運(yùn)動(dòng)和動(dòng)態(tài)運(yùn)動(dòng)跟蹤。簡(jiǎn)而言之,會(huì)的活多,表現(xiàn)力還強(qiáng)。

比如和人類邊貼貼邊跳舞,增進(jìn)增進(jìn)人形機(jī)器人和人類之間的感情:

穿著熒光小馬甲,就能立刻上崗街頭指揮人車交通:

研究論文資料顯示,這個(gè)研究團(tuán)隊(duì)共 6 人,其中過(guò)半是 UCSD 的在讀博士生。

為什么要對(duì)人形機(jī)器人做這樣的訓(xùn)練呢?論文共同一作 Xuxin Cheng 在推特上賣力宣傳的同時(shí),做出了解釋。

機(jī)器人總是被要求化身各行各業(yè)的打工人!我們就想跟它一起探索另一條方向的路~

當(dāng)人形機(jī)器人“富有表現(xiàn)力”

團(tuán)隊(duì)的這項(xiàng)研究名為《Expressive Whole-Body Control for Humanoid Robots》,研究目標(biāo)是讓人形機(jī)器人在現(xiàn)實(shí)世界中產(chǎn)生豐富、多樣和富有表現(xiàn)力的動(dòng)作。

在經(jīng)過(guò)團(tuán)隊(duì)的調(diào)教后,人形機(jī)器人能做出什么樣的行為呢?

路遇朋友迎面擊掌,這是不在話下的。

我都能腦補(bǔ)出它大聲喊了一句 Hey Man……

親切一點(diǎn),路遇兄弟,來(lái)個(gè)抱抱

有點(diǎn)搞笑的事,不管是擊掌還是擁抱,機(jī)器人下半身跺腳的行為并不會(huì)停止,只是會(huì)稍微放緩。

眼尖的朋友們可能已經(jīng)發(fā)現(xiàn)了,上面的擊掌實(shí)驗(yàn)在不同環(huán)境、不同地面進(jìn)行。

團(tuán)隊(duì)也明確表示,通過(guò)新研究訓(xùn)練出來(lái)的人形機(jī)器人,可以在各種不同的地形地面上健步如飛。

除了上文展示過(guò)的草地和石板路,沙灘對(duì)它來(lái)說(shuō)同樣是小菜一碟:

平整的辦公室地面也可以輕松應(yīng)對(duì):

團(tuán)隊(duì)給出的更多展示中,還表現(xiàn)了更多遇到外界阻力時(shí)行動(dòng)自如的 demo。

狠狠拽它:

拿大球砸它:

還知道抬手示意,“喂,你可以幫我背上小書包了”。

各種操作,看得大伙兒一愣一愣的。

紐約大學(xué)計(jì)算機(jī)科學(xué)助理教授發(fā)推特應(yīng)援,稱這么高水平控制力和表現(xiàn)力的研究成果,居然是一個(gè) 6 人組成的學(xué)術(shù)團(tuán)隊(duì)的產(chǎn)出,“難以置信”!

更多的網(wǎng)友則選擇用“Cool”來(lái)形容這項(xiàng)工作:

“無(wú)他,照著人類學(xué)”

所以,究竟怎么才能讓機(jī)器人像以上般“張牙舞爪”、富有類人表現(xiàn)力?設(shè)想的思路無(wú)他:照著人類學(xué)。

學(xué)習(xí)資料既包括各種人體動(dòng)捕數(shù)據(jù)集,也包括生成模型、video2pose 模型給出的模擬數(shù)據(jù)。

通過(guò)在強(qiáng)化學(xué)習(xí)框架中進(jìn)行全身控制的大規(guī)模訓(xùn)練,機(jī)器人就可以在現(xiàn)實(shí)世界中進(jìn)行動(dòng)作的泛化了。

然而,這樣的 Sim2Real 思想實(shí)際還是遇到了問(wèn)題。

作者介紹,典型數(shù)據(jù)集中的人體模型有 69 個(gè)自由度,但他們所用的機(jī)器人只有 19 個(gè)。除此之外,理論和實(shí)際的扭矩限制也不相同。

這就很尷尬了,等于學(xué)會(huì)的知識(shí)實(shí)際根本不能拿來(lái)就用。

那怎么辦?

那就做一個(gè)小小的改動(dòng)

只讓上半身進(jìn)行模仿,負(fù)責(zé)各種表現(xiàn)力,下半身則只負(fù)責(zé)在任意速度內(nèi)把兩條腿控制穩(wěn)定就行。

作者姑且就管這個(gè)方法就叫做“表現(xiàn)型全身控制”(Expressive Whole-Body Control (Exbody))。

由此,該機(jī)器人的整體框架就長(zhǎng)這樣:

首先,在拿到各種數(shù)據(jù)集后,系統(tǒng)會(huì)有一個(gè)運(yùn)動(dòng)重定向,用于獲取一系列與符合機(jī)器人運(yùn)動(dòng)學(xué)結(jié)構(gòu)的運(yùn)動(dòng)片段。

然后在從這些片段中提取表達(dá)目標(biāo)和根運(yùn)動(dòng)目標(biāo),進(jìn)行“Exbody”策略的強(qiáng)化學(xué)習(xí)訓(xùn)練,最終將指令部署到真實(shí)機(jī)器人身上。

其中,表達(dá)目標(biāo)就是機(jī)器人上半身要完成的,根運(yùn)動(dòng)目標(biāo)則歸于下半身(當(dāng)然,這部分也可以用遙控命令直接給出)。

▲ 所用數(shù)據(jù)集

最終,和各種基線方法相比,該機(jī)器人取得了如下成績(jī):有幾項(xiàng)比較突出的指標(biāo),整體表現(xiàn)還不錯(cuò)。

(MELV:Mean Episode Linear Velocity Tracking Reward,線性速度跟蹤獎(jiǎng)勵(lì) MEK:Mean episode key body tracking reward,關(guān)鍵身體追蹤獎(jiǎng)勵(lì))

而從下圖來(lái)看,Exbody 的策略也能讓機(jī)器人在表現(xiàn)時(shí)(例如擊掌)膝蓋彎曲更多,抬腳時(shí)腳離地面更高。言外之意,動(dòng)作更賣力更富有表現(xiàn)力一些~當(dāng)然,也更穩(wěn)。

全華人團(tuán)隊(duì)出品

本研究一共 6 位作者,全部為華人,全部來(lái)自加州大學(xué)圣地亞哥分校(UCSD)。

共同一作有兩位:

Xuxin Cheng,UCSD 博一在讀,碩士畢業(yè)于 CMU 機(jī)器人專業(yè),本科則畢業(yè)于北理工自動(dòng)化專業(yè)。

Yandong Ji,同 UCSD 博一在讀,碩士畢業(yè)于 UC 伯克利機(jī)械工程,本科畢業(yè)于南開(kāi)大學(xué)電子計(jì)算機(jī)工程專業(yè)。

通訊作者為他們的導(dǎo)師 Xiaolong Wang,UCSD 電氣工程系助理教授。

他博士畢業(yè)于 CMU,目前的研究方向集中于 CV 和機(jī)器人技術(shù)等等,谷歌學(xué)術(shù)顯示論文引用次數(shù) 23000+。

哦對(duì)了最后,團(tuán)隊(duì)成員還包括本次研究所用的機(jī)器人:來(lái)自宇樹(shù)科技的 Unitree H1。

One More Thing

要說(shuō)最近的機(jī)器人進(jìn)展,還真不少。

先是 OpenAI 和微軟押注的 Figure 剛剛宣布,新一輪融資籌集了約 6.75 億美元,融資前估值約 20 億美元。

緊接著發(fā)布了個(gè)視頻,介紹了旗下人形機(jī)器人 Figure 01 的最新進(jìn)展,稱“一切都是自主的”:

再有就是那個(gè)面部表情極其豐富,有時(shí)驚艷有時(shí)又驚悚的 Ameca,最新宣布已具有視覺(jué)能力。

她能觀察所處房間的整個(gè)情況,然后用各種各樣的聲音語(yǔ)氣(包括但不限于馬斯克、海綿寶寶)跟你繪聲繪色地描述。

就怪有意思的 hhhhhh

參考鏈接:

  • [1]https://expressive-humanoid.github.io/resources/Expressive_Whole-Body_Control_for_Humanoid_Robots.pdf

  • [2]https://expressive-humanoid.github.io/

  • [3]https://twitter.com/xiaolonw/status/1762528106001379369

本文來(lái)自微信公眾號(hào):量子位 (ID:QbitAI),作者:衡宇 豐色

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人形機(jī)器人,人工智能

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知