從清理溢出物到提供食物,機器人正在被教導(dǎo)執(zhí)行日益復(fù)雜的家務(wù)勞動。許多這樣的家庭機器人學(xué)員都是通過模仿來學(xué)習(xí)的。它們被編程為復(fù)制人類引導(dǎo)它們完成的動作。
事實證明,機器人具有出色的模仿能力。但除非工程師也對它們進行編程以適應(yīng)每一種可能的碰撞和推動,否則機器人不一定知道如何處理這些情況,除非從頂部開始執(zhí)行任務(wù)。
現(xiàn)在,麻省理工學(xué)院的工程師們的目標(biāo)是讓機器人在面臨偏離訓(xùn)練路徑的情況時掌握一些常識。他們開發(fā)了一種方法,將機器人運動數(shù)據(jù)與大型語言模型(LLM)的“常識知識”聯(lián)系起來。
他們的方法使機器人能夠在邏輯上將許多給定的家務(wù)任務(wù)解析為子任務(wù),并根據(jù)子任務(wù)中的中斷進行物理調(diào)整,以便機器人可以繼續(xù)前進,而無需返回并從頭開始執(zhí)行任務(wù),并且工程師無需顯式編程修復(fù)整個過程中所有可能的故障。
“模仿學(xué)習(xí)是實現(xiàn)家用機器人的主流方法。但是,如果機器人盲目模仿人類的運動軌跡,微小的錯誤就會積累起來,最終使其余的執(zhí)行脫軌。”麻省理工學(xué)院電氣工程系研究生王彥偉說和計算機科學(xué)(EECS)。“通過我們的方法,機器人可以自我糾正執(zhí)行錯誤并提高整體任務(wù)的成功率。”
Wang 和他的同事將在 5 月份的國際學(xué)習(xí)表征會議 (ICLR 2024)上展示一項研究,詳細介紹了他們的新方法。該研究的共同作者包括 EECS 研究生 Tsun-Hsuan Wang 和 Jiayuan Mao、麻省理工學(xué)院航空航天系 (AeroAstro) 博士后 Michael Hagenow 以及麻省理工學(xué)院航空航天系 HN Slater 教授 Julie Shah。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!