在人工智慧領域,DeepSeek的興起無疑為當地語系化部署和推理市場注入了一股強勁動力,顯著降低了算力成本,使得眾多企業能夠享受到AI大模型帶來的效率飛躍。然而,對於中小企業而言,儘管算力成本有所降低,但高性能伺服器的價格仍然構成了一道難以逾越的門檻。
伺服器作為大模型運行的核心設備,其高昂的價格常常讓中小企業望而卻步。以GPU伺服器為例,一台頂級的GPU伺服器價格動輒數十萬甚至上百萬,這對於資源有限的中小企業來說,無疑是一筆巨大的開銷。因此,在選擇算力平臺時,中小企業面臨著諸多挑戰。
據IDC數據顯示,到2027年,智慧算力規模將比2022年增長1.7倍,其中用於推理的工作負載佔比高達72.6%。這意味著,未來AI算力需求將面臨巨大的供應缺口,所有算力都需要具備智慧能力。然而,現實情況是,隨著DeepSeek等大模型的火爆,一體機市場雖然迎來了蓬勃發展,但售價依然不菲。目前市場上已有超過60家企業推出了結合DeepSeek的一體機產品,但價格普遍在幾十萬到上百萬之間,甚至更高。
浪潮信息副總經理趙帥指出,即便是支援DeepSeek-R1蒸餾版本的一體機,售價也達到了數十萬,而支援滿血版DeepSeek的一體機更是價格高昂。這對於大部分中小企業、教育機構以及科研用戶來說,無疑是一筆巨大的投入。因此,如何選擇合適的算力平臺,成為了中小企業應用大模型時的一大痛點。
趙帥進一步分享了中小企業和科研院校在使用大模型時的困境。他表示,儘管使用者非常渴望利用DeepSeek等大模型創造價值,但如果選擇上雲的方式,將涉及私有數據的安全問題。對於一些涉及商業機密或保密數據的企業和科研機構來說,通過雲的方式使用大模型顯然是不可行的。高昂的初始投資費用也讓許多企業對大模型賦能業務持觀望態度。
除了成本問題外,中小企業在應用大模型的業務場景中,還面臨著資源浪費的問題。由於人員規模和業務規模較小,中小企業對於高併發能力的需求並不高。因此,如果部署一個滿血版的伺服器或一體機,將造成資源的極大浪費。趙帥指出,對於規模在100~200人的企業來說,小併發量下人均20token/s的流暢體驗已經足夠。
中小企業在使用伺服器運行大模型的同時,還希望將企業的其他業務如OA、郵件等也納入伺服器的管理範圍。這些現實需求對硬體廠商提出了更高的考驗。為了滿足中小企業的這些需求,浪潮資訊近日推出了元腦CPU推理伺服器。該伺服器採用4顆英特爾至強6448H處理器和多通道記憶體系統設計,支援32組DDR5記憶體,最大容量可達16TB,記憶體頻寬高達1.2TB/s。結合AMX加速技術,該伺服器能夠高效運行DeepSeek-R1(32B)和QwQ-32B等推理模型,提供流暢穩定的用戶體驗。
測試數據顯示,基於單台元腦CPU推理伺服器,在使用DeepSeek-R1 32B進行問答場景下,解碼性能超過20tokens/s,20個併發使用者下總token數達到255.2tokens/s;在使用QwQ-32B進行模型推理時,支援20個併發用戶數,總token數達到224.3Tokens/s。這一性能表現足以滿足中小企業的業務需求。
趙帥介紹,目前CPU推理伺服器的詢單客戶眾多,已經有不少金融、教育、初創企業以及高校科研團隊對CPU推理伺服器表達了強烈的採購意願。這表明,CPU推理伺服器在中小企業中具有廣闊的市場前景。
然而,要想利用CPU實現本地推理過程,並非僅憑硬體性能就能實現。軟體的優化與適配同樣至關重要。浪潮信息通過張量並行計算AWQ量化的方式以及TP並行的方式,對軟硬體進行了協同優化,提升了整機的記憶體頻寬和模型解碼速度。這使得元腦CPU推理伺服器能夠為企業提供更高效、更靈活、更穩定的AI通用算力支撐。
趙帥還指出,CPU在運行DeepSeek-R1這種MoE架構的模型時具有獨特優勢。通過路由器選擇專家模型的方式,CPU在數據選擇上比GPU的推理解決方案更友好。這一優勢使得CPU推理伺服器在特定場景下具有更高的性價比。
除了性能優勢外,用戶對於CPU推理伺服器的易用性也提出了更高要求。為了滿足這一需求,軟硬體服務商紛紛推出了平臺化的軟體產品與硬體的結合方案。浪潮資訊推出了EPAI平臺,通過預裝AI操作系統和AIStation管理平臺,使得使用者可以自由選擇模型並通過簡單介面進行操作。這一方案大大提升了CPU推理伺服器的易用性。
當然,對於大型企業以及追求高併發、高性能模型的企業來說,GPU伺服器仍然是更好的選擇。但對於中小企業而言,純CPU的伺服器已經足夠滿足其業務需求,並且具有更高的性價比。趙帥表示,如果用戶規模較小,利用CPU推理伺服器也可以運行DeepSeek-R1 671B的模型,雖然性能略低但仍然能夠滿足順暢的推理需求。
隨著人工智慧技術的不斷發展,中小企業對於AI大模型的需求將越來越強烈。而CPU推理伺服器的推出,無疑為中小企業提供了一種更加經濟、高效的選擇。未來,隨著技術的不斷進步和市場的不斷擴大,CPU推理伺服器有望在中小企業中迎來更加廣泛的應用。