騰訊新推深度思考大模型比DeepSeek-R1便宜3/4
更新于:2025-03-26 04:30:40

羊城晚報全媒體記者 王丹陽

在此前35天“更新”30次后,3月21午夜,騰訊混元大模型團隊正式推出了能秒回、處理超長文本自研深度思考模型混元T1正式版,目前已上線於騰訊雲官網,並即將在騰訊元寶上線。相比以往,這次深夜“上新”也是騰訊摒棄了傳統及主流的純Transformer架構,首次將混合Mamba架構無損應用於超大型推理模型。

深夜“上架”能秒回更便宜

值得關注的是,作為騰訊自研的強推理模型,T1吐字速度達到60~80token/s,在實際生成效果表現中遠快於DeepSeek-R1。

目前,使用者在使用DeepSeek-R1等推理模型時,由於模型需要進行深度思考,並在提供回答前列出詳細的思維鏈,雖然能夠體現較高的智能化水準,但存在回應速度慢、不夠高效的短板。

混元T1正式版則吐字快、能秒回,還擅長超長文處理。在體現推理模型基礎能力的常見基準測試上,如大語言模型評估增強數據集MMLU-PRO中,混元T1取得87.2分,超越了DeepSeek-R1,僅次於o1。在CEval、AIME、Zebra Logic等中英文知識及競賽級數學、邏輯推理的公開基準測試中,混元T1的成績也達到業界領先推理模型的水準。

同在3月21午夜,混元T1已在騰訊雲官網上線。價格方面,輸入價格為1元/每百萬tokens,輸出價格為4元/每百萬tokens,輸出價格為DeepSeek標準時段的1/4,與DeepSeek優惠時段一致。

年研發投707億元全速推AI

騰訊發佈的最新財報顯示,2024年第四季度,騰訊資本開支同比增長386%至365.8億元,2024年全年資本開支達到767.6億元,同比增長221%,創歷史新高,佔總營收的11.6%;研發投入方面,2024年全年的AI研發投入達到706.9億元,2018年至今累計投入3403億元。

騰訊董事會主席兼首席執行官馬化騰在業績會上表示,在過去一兩個月里,AI得到了很大發展,尤其是在DeepSeek橫空出世後,騰訊在雲業務、“元寶”(AI應用)上都積極擁抱DeepSeek。

馬化騰在業績會上還表示:“數月前,我們重組了AI團隊以聚焦於快速的產品創新及深度的模型研發,增加了與AI相關的資本開支,並加大了我們對原生AI產品的研發和行銷力度。我們相信這些增加的投資,會通過提升廣告業務的效率及遊戲的生命週期而帶來持續的回報,並隨著個人AI應用的加速普及和更多企業採用我們的AI服務,創造更長遠的價值。”

騰訊元寶的日活躍用戶數在2月至3月增長超20倍。自2月以來,騰訊元寶接入DeepSeek滿血版和全新混元模型,雙核驅動元寶高速進化、日更級反覆運算,35天版本更新30次。除此之外,目前,騰訊已有元寶、微信、騰訊文件、QQ瀏覽器、QQ音樂、微信讀書等數十款產品及業務接入DeepSeek。

編輯:鄭健龍

來源:金羊網

【來源:金羊網】