在與OpenAI分道揚鑣后,Figure AI公佈了一項新的技術突破成果,人形機器人Figure 02能夠以每小時2.68英里(約1.2米/秒)的速度像人類一樣以自然步態行走——通過自主研發的強化學習系統,Figure AI不僅將機器人行走速度較前代產品提升近七倍,更在類比到現實(Sim-to-Real)技術遷移領域樹立了行業新標杆。
圖片來源:Figure AI官網
Figure AI是如何做到的?
2024年2月,Figure AI宣佈終止與OpenAI的合作,全面轉向自主研發。短短三個月後,其搭載全新操作系統Helix的Figure 02機器人便進駐物流工廠,承擔快遞分揀任務。而真正的技術爆發發生在行走控制領域:新一代Figure 02的行走速度達到2.68英里/小時,逼近人類正常步行速度(3-4英里/小時),較前代Figure 01的0.67英里/小時實現跨越式提升。
這一突破的核心在於徹底摒棄傳統機器人控制方法。傳統方案依賴工程師預設步態規則,需耗費數月調試特定場景動作;而Figure AI採用端到端神經網路,通過強化學習讓機器人在虛擬環境中自主“領悟”行走技巧。其訓練系統在高保真物理模擬器中,同時運行數千個具備獨特物理參數的機器人副本,通過試錯學習應對不同地形、負載變化及外部干擾。原本需要數年積累的數據量,如今僅需數小時即可完成訓練,效率提升超千倍。
更革命性的是“零樣本遷移”技術的實現——訓練完成的神經網路無需額外調整,可直接部署至實體機器人。Figure團隊通過兩項關鍵技術攻克Sim-to-Real鴻溝:域隨機化(隨機化類比環境中的物理參數以覆蓋現實偏差)與千赫茲級扭矩反饋控制(即時補償執行器誤差)。在近期演示中,10台Figure 02實體機器人同步運行同一神經網路策略,均展現出穩定的自適應行走能力,驗證了技術的可擴充性。
圖片來源:Figure AI 官網
要讓機器人行走“擬人化”,僅提升速度遠遠不夠。Figure團隊在強化學習框架中植入特殊獎勵機制,引導AI模仿人類步態特徵:腳後跟著地、腳尖離地時的發力角度,以及手臂擺動與腿部運動的協調節奏。通過對比人類運動捕捉數據生成的參考軌跡,系統自動優化步態參數,使機器人動作既符合生物力學效率,又具備視覺自然性。
這種“基於人類偏好”的訓練策略,成功規避了純演算法驅動可能導致的機械式步態。例如在跨越障礙時,Figure 02會自主調整重心偏移幅度,其髖關節彎曲角度與人類應對同類地形時的動作相似度達92%。此外,系統還整合速度跟蹤獎勵(確保移動效率)、功耗優化(延長續航)及抗擾動獎勵(應對推擠碰撞),形成多維度的運動優化體系。
技術文件《使用強化學習實現自然人形步態》揭示了更深層突破:同一神經網路策略可同時適應45種地形變化與20%的負載波動。這意味著當機器人背負10公斤貨物行走在5度斜坡時,仍能保持步頻穩定性,關節扭矩調整響應時間僅3毫秒——這相當於人類小腦神經反射速度的1.5倍。
圖片來源:Figure AI 官網
與OpenAI終止合作后,Figure AI的轉型戰略愈發清晰。其自主研發的機器人操作系統Helix,集成了運動控制、任務規劃與設備交互模組,形成完整技術棧。這種閉環開發模式的優勢在物流場景中得到驗證:部署於分揀中心的Figure 02,通過API介面接入工廠管理系統,自主完成包裹識別、路徑規劃與異常處理,任務中斷率低於0.3%。
硬體層面的創新同樣關鍵。Figure 02採用仿生關節設計,其串聯彈性執行器(Series Elastic Actuator)在保障力量輸出的同時,具備毫秒級形變補償能力。結合強化學習策略的實時優化,機器人即便在瓷磚、地毯等不同摩擦係數地面行走,也能維持98%的步態一致性。這種硬體-演算法的協同進化,使得單個機器人每日可處理800件快遞分揀,操作精度達到±2毫米,遠超傳統機械臂方案。
還存在什麼問題?
儘管取得突破性進展,Figure AI仍需直面三大挑戰:
感知升級:現有視覺系統在弱光、強反光等複雜環境中的物體識別率僅78%,需融合多模態感測器提升場景理解力;
任務擴展:行走能力雖趨近人類,但爬梯、深蹲等復合動作完成度不足60%,需開發分層強化學習架構;
能耗瓶頸:持續行走2小時後功率下降15%,亟待高能量密度電池與輕量化設計突破。
對此,Figure團隊正構建開放開發平臺,計劃通過SDK工具包釋放200TOPS算力資源,吸引開發者共創動作庫。這種生態化策略或將加速技術反覆運算——正如其訓練系統中數千機器人並行試錯的邏輯,開放生態的海量場景數據,有望將演算法成熟週期再壓縮50%。
圖片來源:Figure AI 官網
總結
從依賴規則程式設計到自主進化學習,從實驗室特製場景到開放環境部署,Figure AI的實踐證明:強化學習不僅是提升運動性能的工具,更是重塑人機協作關係的技術哲學。隨著Sim-to-Real遷移效率的提升與開發門檻的降低,或許用不了十年,這些“數位生命體”就將以更自然的姿態融入人類生活。