Blog

研究顯示:大型語言模型改善家用機器人「失誤處理」

Blog Image
研究顯示:大型語言模型改善家用機器人「失誤處理」

March 26, 2024

重點摘要: 

  1. 家用機器人市場難以成功的原因包括定價、實用性和外形等因素,但最大的挑戰在於機器人遇到不可避免的錯誤時的應對方式。
  2. 麻省理工學院的研究指出,大型語言模型(LLMs)可以在機器人遇到問題時提供「常識」幫助,解決其在重新規劃任務時的挑戰。
  3. 新的研究將演示分解為較小的子集,使機器人可以自動恢復任務,而不需要從頭開始執行,這有助於改善家用機器人的功能和效率。



新聞內文:

家用機器人難以取得成功的原因有很多,繼iRobot的Roomba之後,市場表現不佳。定價、實用性、外形因素和地圖繪製等都促成了一次又一次的失敗。即使某些或所有這些問題都得到了解決,仍然存在一個問題,那就是「系統出現不可避免的錯誤時會發生什麼情況」。

這在工業層面也是一個摩擦點,但大公司有資源可以在問題出現時加以解決。然而,我們不能指望消費者每次遇到問題時都學會編程或聘請有能力的人來幫助。幸運的是,這正是大型語言模型(LLMs)在機器人領域的一個很好的應用案例,正如麻省理工學院的新研究所展示的那樣。

一項將在五月份國際學習表徵會議(ICLR)上發表的研究聲稱在糾正錯誤的過程中帶來了一點「常識」。

該學校解釋道:「事實證明,機器人非常善於模仿」。「但除非工程師們還將它們編程以適應每一次可能的碰撞和推擠,否則機器人不一定知道如何應對這些情況,除非重新開始執行它們的任務」。

傳統上,當機器人遇到問題時,它會在需要人類干預之前耗盡其預先編程的選項。這在家庭等非結構化環境中尤其具有挑戰性,在這種環境中,任何對現狀的改變都可能對機器人的功能產生不利影響。

該研究背後的研究人員指出,儘管在家用機器人領域中,模仿學習(通過觀察學習執行任務)很受歡迎,但它通常無法考慮到可能干擾正常操作的無數小環境變化,因此需要系統重新從頭開始執行任務。新的研究在一定程度上解決了這個問題,方法是將演示分解為較小的子集,而不是將其視為連續動作的一部分。

這就是大型語言模型進入圖景的地方,它消除了程式員手動標記和分配眾多子動作的要求。

研究生王村環表示:「LLMs有一種方法可以告訴你如何完成任務的每一個步驟,用自然語言。一個人的連續演示是這些步驟在物理空間中的具體體現」。「我們希望將這兩者連接起來,這樣機器人就會自動知道自己在任務中的哪個階段,並能夠自行重新規劃和恢復」。

研究中展示的特定演示涉及訓練一個機器人舀取彈珠並將其倒入空碗中。這對人類來說是一個簡單且可重複的任務,但對於機器人來說,這是各種小任務的組合。LLMs能夠列出和標記這些子任務。在演示中,研究人員以小的方式破壞了這項活動,例如使機器人偏離軌道並撞倒彈珠。系統會通過自我糾正這些小任務來應對,而不是從頭開始。

王補充道:「使用我們的方法,當機器人出錯時,我們不需要要求人類進行編程或提供額外的示範來從失敗中恢復」。

這是一種引人入勝的方法,可以幫助人們避免完全失去理智。

新聞原址: https://techcrunch.com/2024/03/25/large-language-models-can-help-home-robots-recover-from-errors-without-human-help/