智譜發佈新AI Agent：會做深度研究，但還是入門級

更新于：2025-03-31 17:36:41

介面新聞記者 | 伍洋宇
介面新聞編輯 | 文姝琪

從不久前Manus刷屏互聯網開始，就不斷有聲音議論智譜AI的Agent會如何選擇下一個反覆運算方向。

在此之前，智譜AI是國內第一家押注並發力AI Agent的“AI六小虎”，其AutoGLM也憑藉“人類歷史上第一個AI發出的紅包”獲得了一波熱度。

再次舉辦發佈會，智譜的確把重心放在了AI Agent上。3月31日，智譜AI在2025中關村論壇上正式發佈“AutoGLM沉思”，同時具備深度研究能力（Deep Research）和實際操作（Operator），可自主打開並瀏覽網頁，完成從數據檢索、分析到生成報告。

簡而言之，AutoGLM沉思約等於AutoGLM與Deep Research的結合。

Deep Research起初是由谷歌在去年底上線，但這項“Gemini with Deep Research”功能受限於Gemini當時的模型能力，並沒有發揮出最好功效，反倒由OpenAI隨後推出的Deep Research奪走了用戶的關注與支援。

儘管OpenAI只向收費200美元/月的ChatGPT Pro用戶開放，但在o1、o3等模型支援下，Deep Research仍然迅速成為了這個付費模式下的核心產品。

智譜AutoGLM沉思是國內第一個跟進深度研究能力的Agent產品，並且做到了免費、不限量。在演示視頻中，它展示了在法律、教育、金融等領域的自主操作、研究及報告生成能力。

遇到模型的知識盲區時，該Agent除了搜索網頁，也會自主打開瀏覽器等頁面，基於GUI（Graphical User Interface，圖形用戶介面）閱讀能力在小紅書等內容App讀取資訊。

在模型底座上，智譜表示，AutoGLM沉思接入了智譜推理模型GLM-Z1-Air和基座模型GLM-4-Air0414。其中，GLM-Z1-Air性能對標DeepSeek-R1，速度最高可提升8倍，價格為後者的1/30。

具體技術演進路徑方面，智譜表示AutoGLM沉思經過了“GLM-4基座模型-GLM-Z1推理模型-GLM-Z1-Rumination沉思模型-AutoGLM模型”。其中核心鏈路的模型和技術，智譜稱將於4月14日正式開源，並於近期陸續上線。

需要指出的是，智譜當前十分強調AutoGLM沉思的初階屬性。不僅是智譜AI CEO張鵬在現場表示這是一個預覽版本，核心支援Research場景。智譜AI AutoGLM技術負責人劉瀟在介紹產品時，也指出其現階段產品還有諸多不足，並在演示視頻中表示它是在“Entry Level（入門級別）”處理很多繁雜的任務。

在功能實現上，它與OpenAI的Deep Research也確實存在差距。例如，在實測中，當AutoGLM沉思處於生成任務狀態時，它無法進行多視窗對話，以及在任務發佈階段，它不會像OpenAI一樣對用戶進行反向詢問，以豐富研究框架並界定結論邊界。

這意味著AutoGLM沉思在產品功能層面還有更多優化空間。

不過，張鵬此次強調了智譜對於AI Agent的重視與信心。“智譜很早便佈局AI Agent，甚至早過OpenAI和Anthropic。”張鵬說，智譜率先提出了Phone use（AutoGLM），也幾乎與Anthropic在同一時間發佈了Computer use。

在演進方向上，張鵬從技術角度指出，不僅是模型訓練存在Scaling Law（規模法則），Agent也存在類似法則。“通過擴展訓練時的 inference compute（推理時計算），我們觀察到Agent展現出了更強的性能。”

他解釋稱，這背後是其自進化在線課程強化學習演算法框架WebRL，通過設計由易到難的任務序列，逐步引導模型從簡單場景向複雜場景過渡學習，從而提升訓練效率和最終性能。

該方法類比人類學習過程，通過動態調整任務難度，説明模型積累基礎能力后再挑戰高難度任務，可以避免直接處理複雜問題時的訓練不穩定。

“2025年將會是Agent應用的元年，智譜也將深度參與這一場浪潮。”張鵬說。

目前來看，綜合已有模型性能水準、研究實力、產品化能力等多方面因素，智譜是當前國內在AI Agent領域跑在前列的創業公司之一。但Manus效應在前，在外接非自研模型的基礎上，出色的產品設計及工程化能力也可能創造出驚豔的產品效果，這或許是智譜AutoGLM接下來面臨的最大挑戰。