3月26日淩晨,谷歌正式推出新一代人工智慧推理模型Gemini 2.5,該模型基於多模態大語言框架升級,顯著增強了推理能力、多語言支援及長文本處理能力。
據官方介紹,Gemini 2.5通過優化演算法架構,將回應速度提升40%,能耗降低25%。在關鍵指標測試中,其複雜邏輯任務完成度較前代提升65%,尤其在醫療診斷輔助、法律文書生成等垂直領域展現出更高精度。
谷歌去年12月份曾發佈過具備思考能力的Gemini,但Gemini 2.5系列模型則是谷歌挑戰OpenAI“o”系列模型迄今最重磅嘗試。其旗艦版本Gemini 2.5 Pro Experimental在多項基準測試中超越OpenAI、Anthropic等競爭對手。
Gemini 2.5 Pro支援文字、圖像、音訊、視頻及代碼的多模態輸入,上下文視窗達100萬token(約75萬單詞),可解析完整《指環王》系列文本,未來將升級至200萬token。
谷歌表示,“推理”能力不僅僅指分類和預測,而是指系統分析資訊、得出邏輯結論、融入上下文和細微差別,以及做出明智決策的能力。
Gemini 2.5發佈會後一小時,市場反應迅速顯現。集成Gemini 2.5的谷歌辦公套件測試版訪問量激增,教育類初創公司LumenAI宣佈將基於新模型開發自適應教學工具。不過,隱私宣導組織已對數據處理許可權提出質詢,要求谷歌公開更多透明度報告。
Gemini 2.5 Pro即日起通過Google AI Studio和Gemini應用向訂閱“Gemini Advanced”(月費20美元)的用戶開放,未來將登陸Vertex AI平臺。谷歌暫未公佈API定價,但表示將在幾周內披露企業級應用方案。
研究機構Gartner預測,到2026年,多模態生成模型的商業價值將佔AI市場的45%。隨著谷歌與微軟等巨頭持續加碼,生成式AI正從通用工具向產業基礎設施演變,但其社會倫理、監管框架的完善也有待各方共同探索。