據 Google 週二在博客文章中表示,Gemini 2.5 是一個新的 AI 推理模型,旨在與 DeepSeek R1 展開競爭,目前在 LMArena 整體評分中排名最高。
Google 將新一代 Gemini 2.5 模型系列描述為"思考型模型",這類模型會在給出最終結果前遞歸分析答案。根據 LMArena 的基準測試,Gemini 2.5 在推理、科學、數學和代理程式設計方面處於領先地位。不過,它並非在所有測試中都勝出。例如,在 LiveCodeBench v5 測試中,OpenAI 的 o3-mini 仍然領先於它。
Gemini 2.5 目前正向付費高級使用者推出。有 Reddit 用戶報告稱,他們需要刪除並重新安裝 Gemini 應用才能看到 2.5 版本。在桌面端,用戶可以在 Google AI Studio 中找到 Gemini 2.5。
Google 的 AI 模型相比競爭對手的一大優勢在於其高 token 處理率——即理解或生成複雜數據集的能力。Google 一直宣傳 Gemini 是能夠處理大上下文視窗並具有高 token 輸出的 AI。在社交媒體平臺 X (前身為 Twitter) 上,人們也在實驗 Gemini 2.5 的能力。Google DeepMind 的員工研究員 Fei Xia 成功地將一個簡單的三層蛋糕草圖轉換成了 3D 列印檔。
Google 展示了一段視頻,演示了 Gemini 2.5 如何在幾秒鐘內製作一個簡單的無盡跑酷視頻遊戲。另一位 X 用戶則製作了一個簡單的飛行模擬視頻遊戲。
Google 尚未立即回應置評請求。
Gemini 2.5 的推出是 AI 競技場中投入的最新武器。今年早些時候,來自中國的 DeepSeek R1 的發佈讓美國 AI 公司警覺起來。DeepSeek 發佈了一個免費開源的推理模型,其效率超過了 OpenAI 現有的產品。
Google 也在 AI 領域押下重注。生成式技術已滲透到公司產品群組的方方面面,從搜索到文檔都不例外。Google 計劃僅在 2025 年就投資 750 億美元用於 AI 開發。考慮到根據 Grand View Research 的預測,到 2030 年 AI 市場規模將增長到 1.8 萬億美元,Google 在這個領域佔據主導地位具有強大的經濟動機。
除了 Gemini 2.5,Google 今年早些時候還推出了旨在提供更快推理能力的 Gemini 2.0 Flash Thinking。上個月,Google 發佈了 Gemini Code Assist,這是一個具有大量輸入 token 支持的免費 AI 程式設計工具。