IT之家 3 月 3 日消息,哥倫比亞大學(xué)機(jī)械工程系主任霍德?利普森(Hod Lipson)領(lǐng)導(dǎo)的一支研究團(tuán)隊(duì)基于視覺(jué)學(xué)習(xí)與機(jī)器人技術(shù)的交集開(kāi)發(fā)了一種新策略,使機(jī)器人能夠通過(guò)觀察自身運(yùn)動(dòng),建立對(duì)自身結(jié)構(gòu)和運(yùn)動(dòng)方式的理解。
這項(xiàng)技術(shù)的核心在于利用普通 2D 攝像頭拍攝的視頻來(lái)讓機(jī)器人通過(guò)自我觀察建立運(yùn)動(dòng)學(xué)自我意識(shí),從而使其完善動(dòng)作并預(yù)測(cè)自己的空間運(yùn)動(dòng),甚至無(wú)需人類(lèi)干預(yù)就能從損壞中恢復(fù),為自主機(jī)器人技術(shù)發(fā)展開(kāi)辟全新路徑。
研究團(tuán)隊(duì)利用深度神經(jīng)網(wǎng)絡(luò)和普通攝像頭,成功地讓機(jī)器人自主創(chuàng)建三維運(yùn)動(dòng)學(xué)模型。這種方法使機(jī)器人能夠像人類(lèi)照鏡子一樣,通過(guò)視覺(jué)感知自身,理解并適應(yīng)自身的運(yùn)動(dòng)方式。
通過(guò)開(kāi)發(fā)“自我意識(shí)”,這些機(jī)器人可以徹底實(shí)現(xiàn)自動(dòng)化,使其在家庭、工廠和災(zāi)區(qū)等現(xiàn)實(shí)環(huán)境中更獨(dú)立、更適應(yīng)、更高效。
相關(guān)研究成果已于 2 月 25 日發(fā)表在《自然?機(jī)器智能》上(IT之家附 DOI:10.1038 / s42256-025-01006-w)。
這種自我建模能力在實(shí)際應(yīng)用中具有重要意義。例如,假設(shè)一臺(tái)機(jī)器人在執(zhí)行任務(wù)時(shí)受損,傳統(tǒng)方法可能需要人工干預(yù)進(jìn)行修復(fù)。而具備自我建模能力的機(jī)器人,可以通過(guò)觀察自身受損情況,調(diào)整運(yùn)動(dòng)方式,繼續(xù)完成任務(wù),提高了系統(tǒng)的魯棒性和可靠性。
利普森教授表示,“我們?nèi)祟?lèi)無(wú)法一直像照顧嬰兒那樣,為機(jī)器人修理?yè)p壞部件、調(diào)整性能參數(shù)。如果機(jī)器人要真正發(fā)揮作用就必須學(xué)會(huì)自我照護(hù),這正是自我建模技術(shù)如此重要的原因?!?/p>
這項(xiàng)研究以哥倫比亞大學(xué)二十年的研究為基礎(chǔ)。在此期間,研究人員一直在開(kāi)發(fā)機(jī)器人利用攝像頭和其他傳感器創(chuàng)建自我模型的方法。
2006 年,他們的機(jī)器人只能生成簡(jiǎn)單的模型。十年后,他們利用多個(gè)攝像頭制作出了更完善的高保真型號(hào),而現(xiàn)在終于首次成功利用單個(gè)標(biāo)準(zhǔn)攝像頭的短視頻片段建立了機(jī)器人的完整運(yùn)動(dòng)模型。
利普森教授解釋說(shuō):“我們?nèi)祟?lèi)天生就對(duì)自己的身體有直觀的認(rèn)識(shí),能在實(shí)際行動(dòng)前預(yù)想未來(lái)狀態(tài)并評(píng)估行為后果,我們的終極目標(biāo)是讓機(jī)器人具備類(lèi)似的自我想象能力。一旦能預(yù)見(jiàn)未來(lái),其潛力將無(wú)可限量?!?/p>
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。