更高效的Gen5 SSD如何賦能AI PC?鎧俠EXCERIA PLUS G4 VD10固態硬碟評測
更新于:2025-03-27 01:23:18

在 DeepSeek R1 等大語言模型引發的 AI 應用熱潮下,許多使用者不滿足於通過軟體、網頁接入的“雲側” AI,而是嘗試將模型與參數部署至“端側”,實現離線化,或者滿足微調、訓練、隱私、保密等更多複雜的應用需求。

可以說在 AI 時代,巨量數據的存儲與讀寫愈發成為 PC 用戶與企業級客戶的緊迫需求。在剛剛過去的快閃記憶體市場峰會 CFMS 2025 上,就有諸多存儲廠商從多角度探討了端側 AI 加速落地對存儲行業格局的影響。

而在面向個人的消費級領域,固態硬碟的容量、性能依舊是最需要我們關注的要素。在 AI PC 時代,如何選擇一塊能夠滿足包括本地部署 AI 在內多種需求的固態硬碟?近期我們就對鎧俠推出的 EXCERIA PLUS G4 VD10 固態硬碟展開體驗,看它如何為我們展示 PCIe 5.0 時代的“新解法”。

外觀設計 & 硬體資訊

外觀設計上,鎧俠 EXCERIA PLUS G4 VD10 固態硬碟 ( 以下簡稱鎧俠 VD10 ) 延續了鎧俠消費級固態硬碟系列產品的簡約風格,外包裝採用藍黑撞色,主要展示產品外觀,同時凸顯品牌、容量、速率、通道、尺寸規格、協議支援等具體資訊。

從包裝中取出硬碟本體,我們也可以看到鎧俠 VD10 繼續使用標誌性藍色 PCB,搭配風格簡潔的表面標籤。值得一提的是,鎧俠 VD10 作為 PCIe 5.0 固態硬碟,其標籤也採用了特殊材質設計,以增強顆粒、主控核心元件的散熱效果。

鎧俠 VD10 為單面顆粒設計,背面沒有佈置其它元件,僅有一張印有更多產品資訊、認證標識的標籤,本次我們體驗的是 2TB 版本。

撕下正面帶有散熱效果的標籤,我們可以看到鎧俠 VD10 表面的主要元件,包括 1 顆主控晶元與 2 顆快閃記憶體顆粒。鎧俠 VD10 配備了群聯推出的 PCIe 5.0 DRAM-less 主控 E31,採用 TSMC 7nm 製程工藝,4CH 16CE 設計,支援單顆粒速率達 3600MT/s,並支援 NVMe 2.0 協定。

作為自產顆粒的存儲原廠,鎧俠在 VD10 上採用了自家第 8 代 BiCS FLASH TLC 快閃記憶體顆粒,由雙顆粒組成 2TB 容量。新銳主控與原廠顆粒加持下,鎧俠 VD10 2TB 版標稱最高達到 10000MB/s 順序讀取速度與 8200MB/s 順序寫入速度,4K 隨機讀寫速度分別達到 1300K IOPS 與 1400K IOPS,同時耐久度達到 1200TBW。

接下來,我們就將這塊鎧俠 VD10 固態硬碟安裝至 PC 測試平臺,分別從本地部署 AI 大語言模型與常規性能兩個角度進行體驗。

本地部署 AI 模型體驗

體驗的開頭我們就準備給鎧俠 VD10 “上點強度”,在一套雙路至強處理器的伺服器平臺上,結合 512GB 記憶體與最新的 RTX 5090 D 消費級旗艦顯卡,以混合架構嘗試本地部署並運行 Q4 量化版的 DeepSeek R1-671b。

可以看到,即使在 Q4_K_M 量化下,6710 億參數的滿血 DeepSeek-R1 模型也需要在本地佔據 404GB 的硬碟空間。

而在啟動模型進行提問的過程中,固態硬碟需要持續進行讀取工作,過程中我們能夠看到記憶體與顯存的佔用率快速提升。經過我們數次 AI 測試,鎧俠 VD10 在 CrystalDiskInfo 中顯示的總讀取已經來到 3TB 以上。

在模型運行中,我們觀察到固態硬碟結束讀取工作,同時 RTX 5090 D 顯卡的顯存佔用已滿,平台配備的 512GB 記憶體也使用了 373GB。

即使經過量化處理,671B 參數量對我們的測試平臺而言依舊過於龐大,在對話生成速度方面受限於處理器與記憶體性能,其中主要是 8 通道 DDR4 記憶體的速率瓶頸,RTX 5090 D 在平臺中起到的作用也只能是杯水車薪。不過依舊能夠驗證鎧俠 VD10 在存儲、載入此類超大規模本地 AI 模型時的能力表現。

接下來,我們將切換至更貼近消費級 PC 的測試平臺,體驗鎧俠 VD10 在更輕量本地 AI 模型部署和使用中的表現。此外,也將在這一平臺上進行常規性能測試。

測試使用的平臺,部分配置如下:

測試採用阿裡開源的推理模型通義千問 QwQ-32B,同樣使用 Q4_K_M 量化,328 億參數下在本地僅需佔用 20GB 存儲空間。

在體驗中,可以看到小參數模型在消費級 PC 平臺的載入過程更加快速順暢,模型運行中分別佔據 14.8GB 顯存與 13GB 記憶體,同時在 token 數量,token 生成速度,內容細節方面相比此前的 671B 大模型表現都更好。

這也從一個側面表明,雖然參數量的絕對數值越大,可能意味著 AI 模型的能力越強,但考慮到每個人的硬體平臺性能各有參差,選擇適合自己的模型進行本地部署更具可行性。經過 Q4_K_M 量化的 671B 大模型每次載入都會產生超過 400GB 的讀取量,較其它常規應用而言對存儲的壓力更大,也可能會導致使用者的固態硬碟壽命快速損耗。

常規性能實測

同樣在消費級 PC 測試平臺上,我們通過各種軟體對這塊鎧俠 VD10 2TB 固態硬碟進行性能實測。

首先通過 CrystalDiskInfo 查看固態硬碟本身的屬性與更多資訊,可以看到鎧俠 VD10 固態硬碟的實際容量為 2000.3GB,運行在標準的 PCIe 5.0x4 通道,支援 NVMe2.0 標準和 TRIM 等功能。

鎧俠 VD10 2TB 版標稱最高達到 10000MB/s 順序讀取速度與 8200MB/s 順序寫入速度,4K 隨機讀寫速度分別達到 1300K IOPS 與 1400K IOPS。接下來我們在空盤狀態下使用 CrystalDiskMark 進行讀、寫、混合的三項性能測試。

測試結果顯示,這塊鎧俠 VD10 固態硬碟的順序寫入速度達到 10263.36MB/s,順序讀取速度達到 8726.86MB/s,在 70% 讀 30% 寫的混合場景下表現不錯。同時低佇列深度隨機 4K 讀取的表現也十分突出,達到 83.93MB/s

切換至 IOPS 顯示,鎧俠 VD10 在多佇列多線程的隨機 4K 讀寫中分別測得超過 1400K IOPS 與 1800K IOPS 的結果,混合測試同樣接近 1400K IOPS,表現出色。可以說,鎧俠 VD10 在 CrystalDiskMark 的各項測試結果中都達到超越標稱的水準。

此外我們也單獨進行了 4 佇列 4 線程的隨機 4K 測試,鎧俠 VD10 測得 1114.17MB/s 隨機讀取與 2225.45MB/s 隨機寫入,混合讀寫達 1354.94MB/s,性能表現甚至超過我們此前測試的 PCIe 5.0 滿血旗艦。

在同樣環境下我們也進行了 ASSSDBenchmark 測試,FUTURES 固態硬碟測得順序讀取性能為 7597.86MB/s,順序寫入性能為 7644.94MB/s,整體評分為 12289 分。

近期我們新增了 3DMark 軟體內的存儲基準測試專案,通過遊戲載入、錄製、安裝、保存、移動多個專案,類比硬碟在實際遊戲負載中的表現,並形成量化可參考的結果。鎧俠 VD10 在這一測試中獲得 3837 分。

最後為了驗證鎧俠 VD10 的類比 SLC 緩存策略,我們在完全格式化固態硬碟並靜置一段時間后,使用白眼軟體進行全盤穩定性測試,測試過程中同時使用 HWiNFO 軟體檢測硬碟活動與溫度表現。

白眼軟體呈現出的紅色寫入曲線可見比較典型的三段台階形態,第一段在類比 SLC 緩存空間內,整體速率維持在 7500MB/s 以上,持續至寫入容量超過 370GB 離開 SLC 緩存。

第二段均速降低至約 1500MB/s,推測是 TLC 顆粒的直寫階段,並持續至約 1120GB。最後鎧俠 VD10 進入邊寫入邊釋放 SLC 緩存的狀態,此時主控同時處於多種工作負載,因此均速再次降低,與 500MB/s-1000MB/s 之間波動,直至滿盤。

全盤讀取方面表現平穩,速率維持在約 6000MB/s。此外,測試全程軟體顯示鎧俠 VD10 的溫度最高僅為 53 ℃,即使在主機板自帶散熱裝甲的覆蓋下,這一溫度表現對高性能的 PCIe 5.0 固態硬碟而言也可以說是極致“冷酷”了。

總結

在這塊鎧俠 EXCERIA PLUS G4 VD10 2TB 固態硬碟,我們首次嘗試了在本地 AI 應用的場景下體驗存儲產品性能。想必隨著 AI 時代的發展與更多形態各異的終端產品誕生,從行業級到消費級的使用者,對於存儲的性能、容量、穩定性需求將會再次激增。

鎧俠 VD10 固態硬碟在 PCIe 5.0 時代的開端為我們帶來了不錯的參考。採用 DRAM-less 設計的固態硬碟,由於在性價比、能效與散熱等方面表現更優而深受 DIY 玩家喜愛,鎧俠 VD10 將這一特點與優越的順序與隨機讀寫性能結合起來,在 AI PC 時代將會更加適應筆記本、小主機甚至個人 AI 超算等各式桌面小體型設備的需求。