文|王鴻(信安數據高級副總裁)
本文由作者參加九派新聞直播九派圓桌《manus爆火,套殼還是創新》討論時的發言整理而成,發佈前經作者審閱
【1】manus更多是個行銷事件
manus向普通的非專業人士很好的解釋了什麼是 AI 智慧體,雖然人工智慧比較火爆,但走入平常家庭有點遠的。普通人一定關心的就是,你跟我的實際生活有什麼關係。
它談到說我可以看簡歷、篩簡歷,在很多企業裡面,員工需要寫簡歷, HR 需要看簡歷,經理層需要招人。大家一下子就能夠理解到,原來一個智慧體能做簡歷工作;以後我在面試的時候,過的第一關可能不是人,是 AI,讓 AI 挑選,而不是人類挑選。如果 AI 這關都過不去,就沒機會見到真人了。
另外,這個名字也挺好的,解釋了智慧體是什麼,就是腦袋和手的關係。它是手的延伸,這個類比不一定準確,學術上經不起推敲,但不妨礙普通大眾理解:你就是替我幹活的,你就是替代我的雙手的。
我們用的很多軟體,不管是豆包,還是通義千問、智譜等AI 工具,都有一個介面叫智慧體,你點開那個智慧體,他跟你互動還是問答機器人,並不是完成一個任務,manus 告訴大家,智慧體不是一個問答機器人,是幫你完成一件工作。
另外,它還賣了一個概念,叫全球第一個通用智慧體,事實上,它離通用還差太遠,實現 AGI還很遠很遠,但它把概念宣傳出來,佔了一個很好的身位,這樣就引起了很多人的好奇,通用的人工智慧來了,那我是不是被替代掉了?
它的爆火與 deep seek 是完全不一樣的。DS是我拿任何產品過來,你來用,你覺得好,就推薦給別人。大家一起來用,它成了全球互聯網產品用戶增長最快的一個APP。manus 是反其道的,它知道如果硬搞,可能經不起太多的人來質疑、使用、破解,於是採用了一個邀請碼的方法,設了一道饑餓營銷的門檻,調取了很多人的好奇心。
一句話,我覺得更多是個行銷事件。
從媒體報導來看,已經有投資方和manus接洽,我們也看到了阿裡和它達成了合作。這是一件好事情,關於AI領域的投資,從投資人的角度來看,投資偏好不存在說技術崇拜或者是應用落地,只看投資回報。投技術,它就意味著投資大,風險大,受益大,投應用,他可能就會看,應用的門檻有多高?TO B 還是 TO C 的?二者的投資邏輯不太一樣。
manus說他是一個應用落地的故事,非技術,一旦要談 AI 的技術,就一定要談三件事情:算力、演算法、數據,如果這三個都跟你沒關係,大概率技術跟你無關, manus 很少提到它在算力方面的優勢,演算法和數據的突破幾乎都沒有。更多是怎麼去多場景的技術實現:做了大量的交互體驗和公式化動作,這裏的投資邏輯自然就是應用了。
manus自己的宣傳是偏 to C 的,看起來的應該是個 C 端消費者的AI 助理 、AI 助手的角色。
不同的基金,不同的投資人,選擇不太一樣,朱嘯虎比較堅定,投應用,他覺得在中國能夠把應用做好是比較有把握的。但我們也知道,目前 AI 領域,中國最有價值的投資公司,肯定是深度求索。投資人不會因為說意識到熱點,去改變太多投資邏輯。他會看領域里的方向,投資回報和能看得懂的商業模式。
很多人關心,機器會不會替代人,圖靈獎獲得者楊立昆教授,認為基於現在的 transformer 架構,不可能走向真正的通用人工智慧,普通人也不要那麼焦慮、緊張。雖然 ai 發展很快,但替代人,目前從技術底層上來說,做不到,沒這個可能性,不要去信很多的那種博流量的言語,純粹是販賣焦慮。
但從工作的角度來說,我們很多人會感到恐懼,會不會被人工智慧所替代,這裡我的答案非常肯定:yes,而且已經發生、正在發生,有些工種會因為 AI 的出現消失掉,比如客服和接線員, 你接電話的那個對方是一個人還是一個人工智慧,大部分人已經分不清楚了。
當然,AI 的出現也會創造出大量新的崗位。美國有個非常著名的公司,叫 salesforce,全球排第一的 crm saas 軟體公司,市值大概是3000多億美金,公司的CEO 2024年底宣佈2025年不再招聘軟體工程師,為什麼呢?因為平臺 agent force 已經提高了30%的工作效率,大部分工作, AI 就能完成。
但需要大量的招聘銷售人員幫他賣agent force ,普通的大眾要相信,如果不用 AI,就好像蒸汽機出現,大馬路上已經有了賓士車,你還當一個馬車夫,幹嘛不學一下開車?AI 帶來的就是智力勞動效率的提升。
我們知道汽車工廠有汽車流水線,牛奶工廠有牛奶流水線。這些流水線核心是機器,人類屬於配套,未來智力流水線如果出現了,工作的人可能就是 AI 的配套。但這並不意味著,人就沒有工作了。還是有人要做汽車設計、規劃、宣傳。
【2】將來大概就是多智慧體協同
AI 驅動的決策與之前系統驅動的決策有個不一樣,就是端到端的能力。
什麼叫端到端的能力?我舉個例子,2016年, AlphaGo 打敗了李世石之後,人類下棋再也下不過人工智慧了。圍棋有361個落點,每個落點的可能性是個天文數位,AI 來做決策,並沒有說規劃、理解,只把圖案和規則告訴它,它就能告訴我們下一步,這就是端到端的能力。
未來通用智慧體提供端到端的解決方案才是主流。我認為現在理解意圖,再規劃,再做執行的方案,這是一個經典的人類線性解決問題的方法,反應速度非常慢,而我們大腦解決問題是併發計算的,好多神經元連一塊兒構成了認知體系。現在的智慧體應用,靠網路並行計算,完了還得用線性方法再解釋一遍,再接著處理,這就好比把本來運行得挺高效、像大海一樣的網路體系,弄成了一條小水溝,效率顯然不高,不經濟,不划算。
最好的方法是多個大模型協同,一個綜合的大腦決定哪些參數起作用,幾個大模型協同給決策,將來大概就是多智慧體協同。一個智慧體把一切都搞定、很難,人類都有不同的專業分工,我們根據自己的能力都會有不同的擅長領域,未來的智慧體也會如此,這裡面就牽扯到多智慧體協同,比如標準在哪裡、如何定義標準,如何規範。
這是 manus 給我們提出的很重要的問題,一個系統智能的問題,不是單一智能的問題,針對人、機、環境三個環節,如果協同標準只是某一個,比方說純粹的 AI 標準,不考慮人、不考慮環境,大概率不行,將來 AI 應用發展,這個越早確立,會越早地把資源優勢發揮出來。
manus被說套殼,我覺得不是問題,核心問題是用了別人的基礎大模型之後,做了什麼?舉個例子,有些人說我做行業大模型,需要另外提供一些數據集,根據我的場景需要,在別人的基礎上再進行訓練,從而調整為比較適合行業場景的大模型。它是一種微調技術,我不知道manus有沒有做?。目前公開數據沒有,也沒有宣傳,如果沒有做這件事情,純粹用基模再加上提示詞工程,再加上 python 的開發代碼環境,就完成了工程化,坦率來講,門檻太低。它關於意圖識別任務、規劃、執行的監督、價值觀對齊,如果都只是用提示式工程來做,那大概率稍微複雜一點的任務就會協同不了。
當然,公眾也不要小看 manus幹的工作,工程化這件事情很難,有個測試基準GAIA(通用人工智慧助手的測試標準),manus 的考試成績不錯,比 OpenAI的operator、 deepresearch要強,說明工程量做得很不錯,至少提示詞、工程技術,其他的小工具做的很好,這裡折射出了另外一個創業的機會或者掙錢的機會。你挑一兩個非常熟悉的領域,用現在的 AI 大模型,再加上提示工程和寫代碼的技術,你很可能做出一個非常好用的 AI 助手出來。
有人會問,測試基準的目的是什麼?建立一個評測標準來評測 AI 的系統工具,測試智慧體的,參與者有 meta。標準比較權威、嚴肅,但僅僅是一個標準而已。大家可以看一下 deepseek v3模型和 r1模型亮出自己考過的標準,你會發現他們的測試集可能有幾十上百個,其中有個很重要的標準GPQA——博士研究生水準的基準測試,deep seek R1 模型考了70多分,人類相關領域的博士平均分數65分。如果不是相關領域的,可能只能拿到30多分,反過來看manus,它能拿出來 PK 的測試集特別少。
這就好比說我們去考試,有一個人說,全世界所有的考卷都來一遍。有人會說我就會一科。作為一個通用agent ,就給人感覺有點單薄。
從全球的角度來說,開源生態比較繁榮的往往都偏技術,不偏應用。比方說linux 開源社區,很厲害的,還有 java 開源社區、app ,這些都偏技術、太偏底層,但一旦到了應用層,往往很少開源。舉個例子,我們說開源的 ERP、開源的辦公協同軟體,開源的 CRM 軟體,這些在整個業界生態的聲音很小。
linux一定是個很重要的主流操作系統之一,大量的人做貢獻, AI 領域大概會遵循同樣的邏輯,如果偏技術,開源會是一個不錯的選擇,如果智慧體框架開源,我持保守的態度,智慧體偏應用,這種產品閉源能夠走得更遠一點。
開源往往意味著程式師做貢獻。程式員對於業務很多場景不那麼瞭解,甚至不那麼在乎,更願意炫技,說演算法多好,問題解決的可復用性、通用性多好、效率多高,這些東西在應用環節里,可能不是最重要的,好的客戶體驗才最重要。
【3】transformer 架構的能力已經壓榨到頂點
AI 最先的哪個地方落地,得看投資回報,哪個地方投資回報最大,落地就最快。現在看,回報排第一的是金融,deepseek 的母公司就是幻方量化,做金融投資的私募股權基金。事實上很多基金公司,很早就大量使用機器學習、人工智慧,在大語言模型還沒有出來之前,當初的捲積神經網路或者說機器學習應用就非常多。
股票就是漲和跌。卷積神經網路根據大量的數據採集來做預測,預測明天是漲還是跌,第二個領域是生物製藥、醫療。很多 AI 專家,實驗室背後都跟製藥、生物有關係, AI 教母李飛飛在斯坦福的實驗室,就跟很多醫療機構有合作。她是三院院士,有個院士頭銜就跟醫療有關,2024年諾貝爾獎獲得者用deepfolder 發現了蛋白質摺疊,本質就是生物醫藥的問題。
一個 agent要能夠很好地完成任務,是挺耗算力的,需要燒很多 token 。我們知道某一個企業部署了一套deepseek,就希望通過它去賣錢,一個月虧了四個多億。他發現這個賬怎麼算不明白了,這裏意味著好東西是有代價的。
不知道大家有沒有注意到,以前OpenAI每次發佈產品,全球轟動,但最近上線了一個產品GPT4.5,熱度實在不高。不如 manus。GPT4以後,transformer 架構的能力可以說已經壓榨到了頂點了,4.5出來之後沒有產生轟動效應、GPT5的難產,說明瞭一件事情,如果底層架構沒有新的變化,將來後續的版本都不會發生量變,可能是一個微調的概念,不會產生數量級變化。
另外我想多說一兩句,在AI時代,家長對於小孩的培養,首先,填鴨式的應試教育大概率是不行的,如果小孩被教育得沒有童年、沒有樂趣,厭學,您可以停手了,再教育下去這個孩子到高中階段,會突然間一腳踏空,第二,讓年輕人有想像力、有創造力,比他懂什麼更重要,哪怕他調皮一點、搗蛋一下,不要去責怪他。乖孩子在 AI 時代,可能就是個沒用的人,當然調皮下不是去危害社會。最後,讓他有一個自己的愛好,有一個自己喜歡的事情,願意長期幹的事情。未來,人類的工作狀態會是什麼樣子,我們真的無從知曉,但是我們知道,如果一個人幹著他愛的事情,不管是工作還是生活,能夠開心快樂,這也許是一種非常好的生活狀態。