360集團智腦團隊近期發佈14B、7B推理模型Light-R1。其中14B模型在數學(AIME 24/AIME 25)和科學推理(GPQA Diamond)測試中,得分大幅超過DeepSeek發佈的14B版本,同時穩超目前行業中同級別推理模型,能力甚至比肩DeepSeek R1 32B版本。行業人士認為,360發佈14B和7B模型,可推動大模型在本地設備部署,有助於推動大模型的全面普及和使用。
根據業界權威基準測試的結果,Light-R1 14B數學能力測試達到了滿血版DeepSeek 671B的92%,推理和科學知識達到了DeepSeek滿血版的86%。這意味著14B模型以DeepSeek R1滿血版僅2%的參數量,在一些領域實現了其90%關鍵性能。同時,Light-R1 7B模型的數學能力可以達到DeepSeek 70B蒸餾版本的84%,科學知識和推理達到70B的75%。
當前一些政企機構在使用DeepSeek滿血版時,面臨著數據安全問題,既想讓大模型更懂企業,又不造成核心數據面臨泄露風險,本地部署大模型已成為眾多政企用戶的實際需求。但一個現實是,能運行DeepSeek R1 6710億參數滿血版的一體機,動輒需要數十萬上百萬元成本,這在很大程度上制約了大模型的當地語系化部署進程。
在360智腦的14B、7B模型開源之後,無論政企單位還是個人,僅通過平民級顯卡就可以在普通電腦上實現部署。例如,英偉達3060顯卡支援7B模型流暢運行,這款顯卡的售價目前僅有一千多元,而售價六千多元的3090顯卡可以運行14B模型。這意味著一年前還需要數千萬元成本的大模型,目前只需要幾千元成本就能落地部署。業界判斷,隨著7B、14B這樣的小參數大模型陸續開源,大模型的私有部署還將進一步普及,中小企業和個人使用者只用極小成本,就可以輕鬆擁有一個個頭小、能力大的一流推理模型。
當前,政企組織對大模型的需求多種多樣,需要回應快速,跟政企知識庫連接,還得保證數據安全,成本可控。企業在接入360智腦的14B、7B模型後,將實現大模型能力在每個部門甚至每個小組的應用,各類需求都將匹配到專屬場景的大模型。
對個人使用者而言,只需要一台普通家用電腦,搭配上玩遊戲的顯卡,就能把14B、7B模型裝到家裡,用戶可以將大模型用於學習和工作場景,滿足個人化需求。
360集團創始人周鴻禕表示:“希望14B、7B模型能進入千家萬戶,深入百行千業,讓每個人都能擁有一個強大的AI,實現人人AI,加速中國AI的普惠進程。”
據瞭解,360智腦還將推出多種參數的大模型,為用戶本地部署大模型提供更多選擇。
上游新聞 馬亮