從世界杯奪冠到中關村論壇舞臺:加速進化人形機器人兩年反覆運算
更新于:2025-04-03 23:13:18

T1在2025中關村論壇年會開幕式排練上。受訪者供圖

哨聲響起,記分牌停在9:0,加速進化人形機器人T1捧起RoboCup德國公開賽成人組決賽冠軍獎盃,程昊圓了這場始於清華火神隊的冠軍夢。

RoboCup有著“機器人世界盃”之稱,清華火神隊由趙明國創立,參賽多年,成員來自他的機器人實驗室。清華自動化系出身的程昊曾是第三任隊長,學生時期帶領團隊斬獲人形組TeenSize季軍的經歷,既是他機器人夢想的起點,也成為縈繞心頭的遺憾。

畢業后的職業軌跡看似偏離初心:程昊創辦了“朝夕日曆”,經歷位元組跳動收購后出任飛書產品副總裁。但2023年ChatGPT3.0的技術突破讓他敏銳捕捉到關鍵拐點,大模型的湧現能力與機器人運動控制的結合,正在重構具身智慧的底層邏輯。程昊意識到,大模型給人形機器人創造的機會與此前歷史上的任何時刻都不一樣。“通用AI已經出現,而且會發展成多模態,對物理世界有感知和影響,需要新的硬體載體。”

這一嗅覺讓程昊於2023年8月創辦了加速進化,並召集許多火神隊前隊員擔任研發人員,並邀請自己的老師趙明國擔任首席科學家加入。大約一年後,加速進化第一個人形機器人產品T1“出世”,印證了他的前瞻判斷。

T1一“出生”幾乎立刻“回”到程昊熟悉的足球賽場上。這位生於北京、長於北京的創業青年,決心要從踢球場景做起,逐步實現人形機器人的智慧泛化。

“機器人的強化學習和小朋友學走路類似,從會爬到站起來走路,從走得踉踉蹌蹌到走得穩當,再到上斜坡、台階,甚至蹦跳。只是在虛擬世界中,數台機器人訓練幾小時相當於人類的10年。”程昊告訴貝殼財經記者。

“皮實”耐摔、“靈活”起身

T1兩次“出征”機器人世界杯奪冠

3月,在RoboCup德國公開賽成人組決賽中,加速進化T1以藍色方身份迎戰東道主德國Sweaty。賽場上,一台位於前方的T1似乎“預判”了對手的封鎖路線,繞開比自己高出一個頭的紅色方,先一步碰到了球,並射門得分。這場對決比分最終鎖定在9:0,清華火神隊零封奪冠。

程昊刷新了自己的參賽紀錄。2024年7月,約時隔14年後,他再次以清華火神隊的名義重新回到RoboCup賽場。與學生時代相比,程昊不再只是機器人開發者,從實驗室到競技場,他完成了認知範式的關鍵躍遷。

2024年,T1還無法堅持“踢”完整場比賽。許多機器人因為關節發熱而“瘸腿”、摔倒。在與其他機器人發生撞擊時,甚至出現主控與關節間通信斷開的情況,整台機器人因此斷電、宕機。“壞了得馬上換一台”,程昊為一場2V2比賽準備了10台機器人,最終還是敗給了冠軍美國隊。

首戰未問鼎,程昊並不氣餒。“身高不夠技術湊,統治球場不是夢!”賽后,這句話作為T1座右銘,寫進加速進化微信公眾號總結文章里。

加速進化CEO程昊接受貝殼財經記者專訪。新京報貝殼財經記者 祁明遠 攝

“機器人的塑膠胸殼、頭殼遇到磕碰後會開裂。”這讓程昊很頭疼。優化材料,繼續實驗,不下幾十次的試錯,甚至用到了10-20公斤的球,從兩米高空摔下,終於程昊在一片廢墟中找到“皮實”耐摔的材料。程昊將它們配比融入電機、減速器齒輪、軸承、支架等部件中,T1擁有了新“皮膚”。

球場競技難免摩擦碰撞不斷,為了讓主控在摔跤後的高震動狀態下依然能穩定工作、不掉電,程昊優化了嵌入式硬體的設計,專門開發了震動和跌落測試裝備。這套裝備能夠以每秒兩次峰值力的頻率進行撞擊,持續20個小時。“每批次關節中,我們會抽取幾個進行測試,如果它們能在20個小時撞擊后不損壞,才算達到要求。”

機器人遭撞擊後如何迅速起身?為此,程昊不斷反覆運算起身演算法。原先T1要花費10秒才能起身,現在能做到一秒起身,成功率也從50%逼近100%。

在一次實驗中,6台T1彼此進行3V3比賽,連續“踢”20場球下來,關節大多沒有出現損壞,也不需要“替補”救場。實驗過後信心滿滿,T1再次“回歸”RoboCup賽場,變得“皮實”耐摔,“靈活”起身,一舉拿下冠軍杯。

反觀大多參賽者(機器人)還是經不起碰撞,為此,賽事還一度臨時調整規則,從允許一定撞擊改為禁止撞擊。

首登中關村論壇舞臺

原地起身、做俯卧撐技驚四座

T1於2024年8月正式揭開面紗。程昊表示在北京市政府的支援下,這款承載尖端技術的智慧設備迅速晉陞為一枚“城市科技名片”——頻繁作為“門面”出席國際盛會大顯身手,還將入駐水立方等標誌性場館,通過高規格機器人賽事實現技術反覆運算升級。

去年10月,T1開始量產出貨,並在今年3月初完成了第一百台交付,標誌著T1正式步入產業化快車道。

今年3月的中關村論壇,成為其技術實力的展示舞臺。T1首次“參加”中關村論壇,加速進化一次調度十幾台機器連袂登場,一部分登上開幕式舞臺,表演俯卧撐、原地起身,另一部分站在主論壇門口迎賓,在分論壇上扮演主持人,或在展廳里踢足球,通過集群協同作業完美呈現人工智慧的群體智慧。

從技術層面來看,T1在機器人“雙腿”上採用了強化學習的運動控制演算法。數萬台機器人同時在模擬數據環境里訓練,“走過”台階、斜坡、光滑地面、粗糙路面等各類環境。程昊告訴貝殼財經記者,“機器人的強化學習和小朋友學走路類似,從會爬到站起來走路,從走得踉踉蹌蹌到走得穩當,再到上斜坡、台階,甚至蹦跳。只是在虛擬世界中,數台機器人訓練幾小時相當於人類的10年。”

程昊介紹指出,機器人學習也有獎懲機制,“只不過模型比較複雜”。訓練表現好的結果模型才有機會部署到真機上,通過一系列演算法減小從模擬到真實環境的差距。“我們現在的運動控制演算法不只是控制腿,而是希望控制全身關節一起動,例如做出大力射門的動作。這需要引入模仿學習演算法,讓機器人在模擬環境里模仿火柴人,再通過強化學習鞏固。”

T1在2025中關村論壇年會開幕式排練上。受訪者供圖

“從足球場景做起安全也相對經濟”

具身智慧大模型仍有不足但屬行業“未來”

程昊愛踢球,他的機器人也踢球。

“機器人踢足球是一個高效實驗的場景。”程昊認為,機器人踢足球需要視覺能力,除了識別自己的場地位置,還要識別球、球門等物品。同時也需要決策能力,判斷自己是前鋒、中場,還是後衛,“做的事情會不同”。並且,還要隨著對方機器人的移動,不斷調整決策、打新配合。機器人踢足球還強調運動控制,對行走、轉彎、射門、起身等運動能力要求高。“就像足球運動員一樣,素質比較綜合。”

在程昊眼中,足球與生活場景對一些感知、決策底層演算法的要求相通,例如物體識別、跟蹤、定位,決策上的避障能力等。他認為,“從足球場景做起不用太擔心安全問題,也相對經濟。”

“通過機器人踢足球,以點帶面推動我們不停研究新的運動控制、感知、決策演算法。”雖然程昊認為目前的具身智慧大模型還存在不足,但它屬於行業未來的方向。

程昊在北京長大,清華本碩畢業,創業、入職大廠,都沒離開過北京。“我覺得在北京創業更容易做成、做大,人力、場地成本可能貴些,團隊需要做出更好的收入、融資。”2024年,加速進化拿到由中關村科學城與其他機構共同出資的Pre-A輪融資。北京基座模型企業數量、人才密度、場景支援,也讓他對未來有所信心。

他比較相信馬斯克說的人形機器人會達到百億台,同時多種機型存在,“工廠、公司有,家庭也有”,但這可能需要10年、20年。程昊記得小時候社區第一台電腦價值一萬元,“當時社區一套房也是一萬元”。

但曾與樓房等價的電腦如今已不再高不可攀,寫字樓里響起此起彼伏的鍵盤聲,連樓下便利店都能用電腦結帳,人形機器人未來或許也能像《克拉拉與太陽》所寫,待在街邊櫥窗裡,等待喬西將自己領回家。

新京報貝殼財經記者 韋英姿 張晗 編輯 陳莉 校對 薛京寧