介面新聞記者 | 伍洋宇
介面新聞編輯 | 文姝琪
從不久前Manus刷屏互聯網開始,就不斷有聲音議論智譜AI的Agent會如何選擇下一個反覆運算方向。
在此之前,智譜AI是國內第一家押注並發力AI Agent的“AI六小虎”,其AutoGLM也憑藉“人類歷史上第一個AI發出的紅包”獲得了一波熱度。
再次舉辦發佈會,智譜的確把重心放在了AI Agent上。3月31日,智譜AI在2025中關村論壇上正式發佈“AutoGLM沉思”,同時具備深度研究能力(Deep Research)和實際操作(Operator),可自主打開並瀏覽網頁,完成從數據檢索、分析到生成報告。
簡而言之,AutoGLM沉思約等於AutoGLM與Deep Research的結合。
Deep Research起初是由谷歌在去年底上線,但這項“Gemini with Deep Research”功能受限於Gemini當時的模型能力,並沒有發揮出最好功效,反倒由OpenAI隨後推出的Deep Research奪走了用戶的關注與支援。
儘管OpenAI只向收費200美元/月的ChatGPT Pro用戶開放,但在o1、o3等模型支援下,Deep Research仍然迅速成為了這個付費模式下的核心產品。
智譜AutoGLM沉思是國內第一個跟進深度研究能力的Agent產品,並且做到了免費、不限量。在演示視頻中,它展示了在法律、教育、金融等領域的自主操作、研究及報告生成能力。
遇到模型的知識盲區時,該Agent除了搜索網頁,也會自主打開瀏覽器等頁面,基於GUI(Graphical User Interface,圖形用戶介面)閱讀能力在小紅書等內容App讀取資訊。
在模型底座上,智譜表示,AutoGLM沉思接入了智譜推理模型GLM-Z1-Air和基座模型GLM-4-Air0414。其中,GLM-Z1-Air性能對標DeepSeek-R1,速度最高可提升8倍,價格為後者的1/30。
具體技術演進路徑方面,智譜表示AutoGLM沉思經過了“GLM-4基座模型-GLM-Z1推理模型-GLM-Z1-Rumination沉思模型-AutoGLM模型”。其中核心鏈路的模型和技術,智譜稱將於4月14日正式開源,並於近期陸續上線。
需要指出的是,智譜當前十分強調AutoGLM沉思的初階屬性。不僅是智譜AI CEO張鵬在現場表示這是一個預覽版本,核心支援Research場景。智譜AI AutoGLM技術負責人劉瀟在介紹產品時,也指出其現階段產品還有諸多不足,並在演示視頻中表示它是在“Entry Level(入門級別)”處理很多繁雜的任務。
在功能實現上,它與OpenAI的Deep Research也確實存在差距。例如,在實測中,當AutoGLM沉思處於生成任務狀態時,它無法進行多視窗對話,以及在任務發佈階段,它不會像OpenAI一樣對用戶進行反向詢問,以豐富研究框架並界定結論邊界。
這意味著AutoGLM沉思在產品功能層面還有更多優化空間。
不過,張鵬此次強調了智譜對於AI Agent的重視與信心。“智譜很早便佈局AI Agent,甚至早過OpenAI和Anthropic。”張鵬說,智譜率先提出了Phone use(AutoGLM),也幾乎與Anthropic在同一時間發佈了Computer use。
在演進方向上,張鵬從技術角度指出,不僅是模型訓練存在Scaling Law(規模法則),Agent也存在類似法則。“通過擴展訓練時的 inference compute(推理時計算),我們觀察到Agent展現出了更強的性能。”
他解釋稱,這背後是其自進化在線課程強化學習演算法框架WebRL,通過設計由易到難的任務序列,逐步引導模型從簡單場景向複雜場景過渡學習,從而提升訓練效率和最終性能。
該方法類比人類學習過程,通過動態調整任務難度,説明模型積累基礎能力后再挑戰高難度任務,可以避免直接處理複雜問題時的訓練不穩定。
“2025年將會是Agent應用的元年,智譜也將深度參與這一場浪潮。”張鵬說。
目前來看,綜合已有模型性能水準、研究實力、產品化能力等多方面因素,智譜是當前國內在AI Agent領域跑在前列的創業公司之一。但Manus效應在前,在外接非自研模型的基礎上,出色的產品設計及工程化能力也可能創造出驚豔的產品效果,這或許是智譜AutoGLM接下來面臨的最大挑戰。