如果您希望可以時常見面,歡迎標星收藏哦 ~
GPU 再勝一局!2025 年 3 月,Loop Capital 爆出一則重磅消息:Apple 已向 NVIDIA 訂購總額約 10 億美元的 GB300 NVL72 GPU 集群伺服器系統,由 Super Micro Computer(SMCI)與 Dell 聯合交付。在 AI 領域“掉隊”的蘋果,終於正式進入“大型伺服器集群 Gen AI 遊戲”。無論是科技巨頭(如蘋果、谷歌、Meta)還是初創公司,都在依賴 NVIDIA 的 GPU 來加速其 AI 戰略。AI 領域的壟斷巨頭正享受著屬於他們的高光時刻。
蘋果終轉向商用 GPU?
蘋果長期以來以自研晶元為核心競爭力,其 Apple Silicon 系列通過深度軟硬體協同,在行動裝置和邊緣計算領域取得了巨大成功。此前,蘋果軟體工程高級副總裁 Craig Federighi 曾公開確認,Apple Intelligence 服務完全運行在自研的 Apple Silicon 伺服器上,並稱之為“行業雲端處理新標準”。
然而,這次轉向 NVIDIA 的商用 GPU,在 AI 策略上的轉變,也反映了蘋果承認了 GPU 生態和 Gen AI 范式的優勢,並願意為此砸下重金。可能是在生成式 AI(Gen AI)領域,自研晶元的開發週期和優化成本難以滿足當前市場對高性能計算的迫切需求。據分析師 Ananda Baruah 的報告透露,蘋果正計劃訂購約 250 台英偉達的 NVL72 伺服器,每台伺服器的成本預計在 370 萬至 400 萬美元之間,總價近 10 億美元。
Siri “失利”是導火索,業界對蘋果 AI 一直以來都翹首以盼。然而,Siri 近年來在與競爭對手(如 Google Assistant 和 Alexa)的對比中逐漸失去競爭力,原本預計今年春季 iOS 18.4 會更新 Siri,但是,蘋果已將 Siri Apple Intelligence 功能推遲到明年,蘋果在今年 3 月初罕見地承認了這一點,並委婉地表示:“我們還在努力打造更加個人化的 Siri,讓它更瞭解你的個人情況,並能夠在你的應用內和跨應用為你採取行動。實現這些功能需要比我們預想的更長的時間,我們預計將在明年推出它們。”
生成式 AI 爆火了兩三年,OpenAI、Anthropic、Google 等玩家在 Gen AI 賽道上狂奔,GPT-4、Claude、Gemini 已經實現推理、多輪對話、文件操作、程式設計協助等核心能力。AI PC 也已經逐漸落地了。大模型重新定義了使用者對“智慧助理”的期望,使用者的心理預期已從“命令執行”躍遷至“智能協同”。而作為全球最大的手機廠商——蘋果顯然是有點“掉隊了”。這也促使蘋果重新評估其 AI 硬體策略,從傳統的 AI/ML(機器學習)轉向更前沿的 Gen AI 技術。
Apple 此次投下這 10 億美元大單,它想幹什麼?有幾個推測:一是打造 Apple LLM,嵌入 Siri 新版本,實現設備級混合部署(本地 + 雲);二、構建 Apple AI Cloud,支援 iOS/macOS 等設備遠端 AI 增強;三、未來將 AI 深度集成到 iWork 套件、Health、Shortcuts 等應用中。
儘管此次採購 NVIDIA GPU,蘋果不太可能完全放棄自研晶元。一種可能的路徑是:利用 NVIDIA GPU 進行模型訓練和開發,而 Apple Silicon 則專注於推理(inference)和邊緣設備。這種混合策略能夠平衡性能與成本,同時保留蘋果在生態系統中的控制力。
GPU 的勝利
儘管蘋果在自研 ASIC 領域擁有深厚積累,但最終選擇投向 NVIDIA 陣營,透露出兩大關鍵信號:首先,時間優先順序成為壓倒性因素——蘋果顯然不願等待自研 Gen AI 專用 ASIC 的漫長開發週期;其次,GPU 在短期內的性能優勢和生態成熟度,蓋過了定製化帶來的效率紅利。特別是 NVIDIA 的 GPU 搭配 CUDA 生態,已成為訓練大語言模型(LLM)的事實標準。這種“時間與性能”的取捨,清晰地驅動了蘋果的決策。
生成式 AI(如 LLM)的崛起,對算力架構提出了全新要求:超高的並行輸送量、海量的記憶體頻寬以及靈活的計算結構。這些需求讓通用 GPU 的優勢進一步凸顯,而非通用架構(如傳統 ASIC)在短期內難以匹敵 NVIDIA 在性能與生態上的領先地位。
過去兩年,NVIDIA GPU 的價格已飆升至每顆 9 萬美元,其財務表現也印證了這一統治力:在截至 1 月 26 日的第四季度,NVIDIA 實現營收 393 億美元,同比增長 78%。英偉達的毛利率高達 70% 以上,遠超競爭對手 AMD 的 50%。這種高毛利不僅反映了市場對其產品的旺盛需求,也凸顯了其在 AI 硬體領域的定價權。
理論上,高昂的晶片成本可能推高 AI 服務(如 ChatGPT 或 Microsoft Copilot)的價格,最終轉嫁給消費者。然而,目前矽谷科技巨頭似乎更願意自行消化這些成本,以搶佔 AI 競賽的先機。NVIDIA 約 41% 的收入來自微軟、谷歌、亞馬遜和 Meta 四大客戶,這些公司均表示,GPU 供應不足已成為構建 AI 數據中心的瓶頸。
今年 1 月,英偉達的前景遭遇了一次震蕩——中國初創公司 DeepSeek 發佈了一個具有競爭力的 AI 模型,聲稱其背後預算極為有限。英偉達的市值在一天之內幾乎蒸發了 6000 億美元。不過,英偉達在接下來的幾周內大部分恢復了這些損失。行業的普遍假設是,DeepSeek 模型所暗示的這種更廉價的 AI,將只會增加全球對 AI 服務和其背後硬體的需求。科技巨頭們並沒有改變自己對 AI 基礎設施的建設,反而愈演愈烈:Meta 計劃今年斥資 650 億美元建設 AI 基礎設施,包括一個規模堪比“曼哈頓大部分地區”的數據中心;微軟、谷歌等全球九大科技公司預計 2025 年在 AI 上的總支出將達 3710 億美元,同比增長 44%。
有 AI 專家則認為,DeepSeek 的成就實際上只會鞏固英偉達的地位,因為這仍然發生在英偉達的軟硬體生態系統中。與此同時,普遍認為 DeepSeek 是藉助現有模型(如 OpenAI 的 GPT)進行開發的,而這些模型的構建依賴於巨大的計算資源。
在硬體層面,NVIDIA 最新推出的 GB300 NVL72 平臺堪稱巔峰之作。這款機架級設計集成了 72 個 Blackwell Ultra GPU 和 36 個基於 Arm Neoverse 的 Grace CPU,形同一個為推理和訓練優化的巨型 GPU。與前代 Hopper 架構相比,GB300 NVL72 在回應速度(TPS,每使用者每秒事務數)上提升 10 倍,能效吞吐率(每兆瓦 TPS)提升 5 倍,整體 AI 產出能力躍升 50 倍。這種性能飛躍讓自研 ASIC 或傳統 x86 CPU 在面對大規模並行計算時,幾乎無法與之抗衡。
來源:NVIDIA
NVIDIA 創始人黃仁勳曾表示:“ Blackwell 的需求令人震驚。AI 推理引入了新的縮放定律——更多訓練算力讓模型更智慧,更多推理算力讓答案更精準。”這一洞察不僅揭示了 AI 算力的雙輪驅動邏輯,也預示了 NVIDIA 的增長勢頭。展望 2026 財年第一季度,公司預計營收將達 430 億美元,顯示其在 AI 硬體市場的統治力仍在延續。
從蘋果的妥協,到科技巨頭的狂熱投入,再到 DeepSeek 的意外挑戰,GPU 的勝利不僅是技術路線的勝出,更是對時間與性能極致追求的見證。在 AI 驅動的未來,GPU 的通用算力生態正成為不可撼動的基石。
ASIC 的“失敗”
與 GPU 的耀眼成就相比,ASIC(專用積體電路)在生成式 AI(Gen AI)浪潮中的暫時“失利”,為自研晶元路線敲響了警鐘——在技術競爭中,“錯過時間視窗”比性能稍遜更為致命。
在半導體領域,自研 ASIC(如 Apple Silicon)與商用 GPU 之間的技術路線之爭由來已久,核心在於“定製化”與“通用性”的博弈。從技術特性來看,自研 ASIC 在特定任務(如 AI 推理階段)上具備更高的效率,但其設計和驗證週期漫長,難以跟上人工智慧領域日新月異的發展節奏。相比之下,通用 GPU 憑藉靈活性和強大的生態支援,在快速反覆運算的 AI 市場中佔據了上風。
ASIC 的開發週期是其最大軟肋。以蘋果為例,作為全球晶片設計的佼佼者,其從架構設計到流片驗證仍需數年時間。然而,Gen AI 的競爭是一場速度至上的賽跑,大語言模型(LLM)等技術的反覆運算週期以月計,市場需求瞬息萬變。蘋果顯然無法承受自研 AI 專用 ASIC 逐步成熟的等待期。相比之下,NVIDIA 的 GPU 作為成熟的商用解決方案,可立即投入使用,直接滿足蘋果對算力的迫切需求。這種時間上的差距,成為 ASIC 在短期內失利的關鍵。
ASIC 的另一大短板在於靈活性不足。作為專為特定任務優化的“專用晶片”,ASIC 在固定場景下(如推理或網路加速)表現出色,但在 Gen AI 的工作負載面前卻顯得捉襟見肘。LLM 的訓練涉及多樣化的演算法和不斷擴展的模型規模,需要硬體具備高度的通用性和適應性。而 ASIC 的設計初衷恰恰與之相悖,其定製化特性難以快速回應 AI 領域的動態需求。反觀 NVIDIA GPU,憑藉通用架構和 CUDA 生態的加持,不僅能覆蓋訓練與推理的全流程,還能靈活適應新演算法的演進。這種靈活性讓 ASIC 在競爭中相形見絀。
博通和 Marvell 作為 ASIC 設計服務的兩大廠商,也面臨不利局面。
去年底,The Information 報導稱,蘋果正與博通合作開發代號為“ Baltra ”的 AI 伺服器晶片。這款晶片聚焦網路技術,預計 2026 年量產,僅限蘋果內部使用,並採用台積電 N3P 工藝(與 OpenAI 和 NVIDIA 的 AI 晶片工藝一致)。儘管博通在傳統數據中心市場憑藉網路加速器等定製 ASIC 表現強勁,但其產品在 AI 訓練領域的競爭力仍無法與 GPU 抗衡。
Marvell 則通過 ThunderX 系列 Arm CPU 和定製晶元佈局 AI 市場,但其方案更偏向推理而非訓練,難以滿足蘋果在大規模 LLM 訓練上的需求。
蘋果此前透露,它也在探索使用亞馬遜的 Trainium2 晶片進行 AI 模型預訓練。如今選擇英偉達 GPU,還是佐證了通用 GPU 尤其是英偉達 GPU 短期地位難以撼動。
當然,這並不意味著 ASIC 徹底退出舞臺。蘋果未來可能採取“ GPU 訓練 +ASIC 推理”的混合策略,利用 NVIDIA 完成模型開發,再用 Apple Silicon 優化邊緣部署。然而,在當前階段,ASIC 的“失敗”更多是時間視窗的失利,而非技術的終結。
總結
蘋果 10 億美元豪購 NVIDIA GB300 NVL72 的決定,既是其 AI 戰略的急轉彎,也是 GPU 在生成式 AI 時代統治力的又一注腳。在這場技術與時間的賽跑中,通用算力以其現成性和適應性,擊敗了定製化方案的長期潛力,即使如蘋果這般自研能力傲視群雄的巨頭,也不得不向現實低頭。Siri 的失利、Gen AI 的狂飆,以及使用者對“智能協同”的新期待,共同將蘋果推向了英偉達的懷抱。然而,這並非 ASIC 的終曲,而是時間視窗與生態博弈的階段性結果。未來,當蘋果的自研晶片與 GPU 的混合策略成熟,AI 算力的王座之爭或許會迎來新的轉折。但至少在當下,英偉達的 GPU 不僅是技術的勝利,更是時間鐵律的化身——在 AI 的狂潮中,誰能更快站上風口,誰就握住了定義未來的鑰匙。