蓋世汽車訊 受動物和昆蟲啟發而開發的足式機器人能夠幫助人類完成各種現實世界中的任務,例如遞送包裹或監測特定環境。近年來,計算機科學家已經開發出演算法,使這些機器人能夠以不同的速度行走、跳躍、模仿某些動物的動作,並以極高的敏捷性移動。
圖片來源:University of Michigan
據外媒報導,美國密歇根大學(University of Michigan)計算自主與機器人實驗室(CURLY Lab)和中國南方科技大學(Southern University of Science and Technology)的研究人員最近開發出一種基於強化學習的框架,使足式機器人能夠成功使用滑板。研究人員在arXiv預印本伺服器上的一篇論文中概述了這一框架,該框架也可用於類比現實世界中其他需要與物體物理接觸的複雜動作。
該論文的通訊作者Sangli Teng表示:“現有的四足機器人運動方法並未考慮與目標物體之間的大量接觸交互,例如滑滑板。我們的研究旨在為包括滑滑板這類值得研究的接觸引導任務設計一個流程。密歇根大學在開發混合動力系統方面有著悠久的歷史,這啟發了我們通過人工智慧中的數據驅動方法來識別這種混合效應。”
Teng及其同事近期工作的主要目標是讓足式機器人能夠執行接觸引導的運動,包括滑滑板。為此,他們開發了一種名為離散時間混合自動機學習(DHAL)的新框架。
“混合動力學”是指一個系統可以同時執行連續和離散的狀態轉換。這意味著它可以平滑地移動,並隨著時間的推移突然改變其狀態。
Teng解釋說:“例如,當一個彈跳的球與地面相互作用時,球在空中是一個連續動態,而在與地面碰撞時則會發生離散的狀態轉換。對於具有多個連續動態和轉換函數的系統,要同時識別離散模式和連續動態是極其困難的。這是因為與可能的離散轉換數量相比,可能的轉換數量呈指數級增長。”
Teng所描述的突然轉換使得傳統的基於回歸的計算方法難以學習系統的動態。研究人員開發的DHAL框架能夠識別這些突然的轉換,隨後使用基於回歸的技術學習系統動態的每個連續段,從而減少不連續效應,因為這種效應會影響機器人在滑滑板等任務中的表現。
Teng表示:“與現有方法相比,DHAL不需要手動識別離散轉換,也不需要事先瞭解轉換狀態的數量。DHAL中的所有內容都是啟發式的,我們展示了這種方法可以自主識別動態的模式轉換。”
DHAL框架的另一個優勢是它具有高度的直觀性,從而確保其識別的模式轉換與通常與滑滑板相關的轉換一致。在初步測試中,研究人員發現,它使四足機器人能夠平穩地踏上滑板,並利用滑板快速前進,同時還能拉動一個小推車。
Teng表示:“在推動、滑行和上板階段,DHAL會自動輸出不同的標籤。我們的方法可以應用於混合動力系統的狀態估計,以確定是否發生了這種轉換。有了這種轉換資訊,系統可以更好地估計狀態,從而輔助決策。”
Teng及其同事開發的這一強化學習框架可能推動足式機器人在現實世界中的部署。例如,它可以使機器人利用滑板更快地移動,在城市環境、辦公室或製造設施內遞送包裹。
Teng補充道:“我們現在計劃將這一框架應用於其他場景,例如靈巧操作(即用多個手指或手臂操作物體)。DHAL有望更準確地預測接觸情況,從而使規劃和控制演算法能夠做出更好的決策。”