騰訊新推深度思考大模型比DeepSeek-R1便宜3/4

更新于：2025-03-26 04:30:40

羊城晚報全媒體記者王丹陽

在此前35天“更新”30次后，3月21午夜，騰訊混元大模型團隊正式推出了能秒回、處理超長文本自研深度思考模型混元T1正式版，目前已上線於騰訊雲官網，並即將在騰訊元寶上線。相比以往，這次深夜“上新”也是騰訊摒棄了傳統及主流的純Transformer架構，首次將混合Mamba架構無損應用於超大型推理模型。

深夜“上架”能秒回更便宜

值得關注的是，作為騰訊自研的強推理模型，T1吐字速度達到60~80token/s，在實際生成效果表現中遠快於DeepSeek-R1。

目前，使用者在使用DeepSeek-R1等推理模型時，由於模型需要進行深度思考，並在提供回答前列出詳細的思維鏈，雖然能夠體現較高的智能化水準，但存在回應速度慢、不夠高效的短板。

混元T1正式版則吐字快、能秒回，還擅長超長文處理。在體現推理模型基礎能力的常見基準測試上，如大語言模型評估增強數據集MMLU-PRO中，混元T1取得87.2分，超越了DeepSeek-R1，僅次於o1。在CEval、AIME、Zebra Logic等中英文知識及競賽級數學、邏輯推理的公開基準測試中，混元T1的成績也達到業界領先推理模型的水準。

同在3月21午夜，混元T1已在騰訊雲官網上線。價格方面，輸入價格為1元/每百萬tokens，輸出價格為4元/每百萬tokens，輸出價格為DeepSeek標準時段的1/4，與DeepSeek優惠時段一致。

年研發投707億元全速推AI

騰訊發佈的最新財報顯示，2024年第四季度，騰訊資本開支同比增長386%至365.8億元，2024年全年資本開支達到767.6億元，同比增長221%，創歷史新高，佔總營收的11.6%；研發投入方面，2024年全年的AI研發投入達到706.9億元，2018年至今累計投入3403億元。

騰訊董事會主席兼首席執行官馬化騰在業績會上表示，在過去一兩個月里，AI得到了很大發展，尤其是在DeepSeek橫空出世後，騰訊在雲業務、“元寶”（AI應用）上都積極擁抱DeepSeek。

馬化騰在業績會上還表示：“數月前，我們重組了AI團隊以聚焦於快速的產品創新及深度的模型研發，增加了與AI相關的資本開支，並加大了我們對原生AI產品的研發和行銷力度。我們相信這些增加的投資，會通過提升廣告業務的效率及遊戲的生命週期而帶來持續的回報，並隨著個人AI應用的加速普及和更多企業採用我們的AI服務，創造更長遠的價值。”

騰訊元寶的日活躍用戶數在2月至3月增長超20倍。自2月以來，騰訊元寶接入DeepSeek滿血版和全新混元模型，雙核驅動元寶高速進化、日更級反覆運算，35天版本更新30次。除此之外，目前，騰訊已有元寶、微信、騰訊文件、QQ瀏覽器、QQ音樂、微信讀書等數十款產品及業務接入DeepSeek。

編輯：鄭健龍

來源：金羊網

【來源：金羊網】