本文作者:李笑寅
來源:硬AI
據媒體報導,晶片巨頭英偉達正接近達成一項收購GPU租賃商Lepton AI的交易,交易金額預計達數億美元。
在算力需求被質疑之際,英偉達這一收購舉動是進軍雲計算領域的重要一環,標誌著其與亞馬遜和谷歌等主要雲供應商的直接競爭。
Lepton AI成立於2023年,總部位於美國加利福尼亞州帕洛阿托,是一家提供GPU算力租賃服務的初創公司。
此前,Lepton曾為遊戲初創公司Latitude.io和科研初創公司SciSpace提供AI雲服務,其聯合創始辦人Yangqing Jia和Junjie Bai曾是Meta的AI研究人員。
與普通雲服務提供者不同,Lepton不自行管理數據中心或伺服器,而是從雲供應商租用后再轉租給自己的客戶——公司實際上不擁有任何GPU。
分析稱,Lepton這種業務模式將更專注於滿足AI訓練和推理的特定需求,提供優化的GPU集群和相關技術服務。對公司而言,這種輕資產模式也使Lepton避開重資產投資的財務壓力。
在訓練方面,Lepton提供了類似Slurm的作業提交方法。實際測試表明,使用者只需幾分鐘就能將現有sbatch腳本調整為在Lepton平臺上工作,轉換過程相當直觀。
Lepton平臺的另一大亮點在於其可視化能力。
分析稱,Lepton提供主控台儀錶盤,用戶可以在其中查看節點生命週期,瞭解每個節點的作業狀態。這一節點生命週期可視化功能表現出色,僅次於CoreWeave。這對於監控和管理GPU資源至關重要,能夠幫助用戶及時發現和解決問題。
當前,算力租賃市場正經歷深刻變革。
美國知名半導體研究機構SemiAnalysis分析指出,計算成本正隨時間推移而下降,算力租賃市場已轉變為明顯的買方市場——現在有超過100家GPU雲服務提供者在爭奪基本相同的客戶群體,導致價格競爭加劇。
黃仁勳也在上周的GTC演講中發表了類似的觀點:
“當Blackwell開始大規模出貨時,即使是Hopper也將無人問津。”
導致這種現象的關鍵在於,算力市場的成本由每類GPU的成本加權平均值決定。這意味著,具有更低計算成本的系統可用性一旦增加,將推動整體計算成本下降,進而也會拉低舊卡的租賃價格。
舉例來說,英偉達GB200在推理方面的單位成本(每百萬個token的美元成本)比H100低75%,在訓練方面的成本(每小時每個有效PFLOP的美元成本)低56%。
這意味著,如果H100想要保持競爭力,就不得不大幅降價。SemiAnalysis通過計算得出,為了讓客戶在使用兩種晶元時感覺“無差別”,H100的每小時租賃價格需要比GB200低65%。
更直觀地說,如果GB200的租賃價格為每塊GPU 2.20美元/小時,那麼H100的租賃價格則需要降至每塊GPU 0.98美元/小時。
SemiAnalysis曾在去年預測,隨著H100生產的加速,GPU價格將持續下行,並且考慮到買家將把重心轉移到Blackwell戰略上,這種下降趨勢一直持續到2024年終。
現實證明,其預測是準確的。
這種競爭格局使得像Lepton這樣的專業GPU租賃商面臨巨大壓力,也促使英偉達考慮通過收購來整合市場,進一步鞏固其在AI計算基礎設施領域的主導地位。
英偉達CEO Jensen Huang被SemiAnalysis稱為“首席營收破壞者”,這一稱號反映了英偉達近年來在計算市場的激進擴張策略。
SemiAnalysis指出,通過收購Lepton,英偉達不僅獲得了額外的收入來源,還可能擠壓其他雲服務提供者的生存空間。
進一步說,這種垂直整合策略讓英偉達能夠從晶元設計到算力租賃的全產業鏈中獲利,同時還能更好地控制其GPU晶片的使用方式和價格策略,進一步增強其在AI計算領域的主導地位。
目前,英偉達的雲和軟體業務目前仍處於起步階段,其模式是英偉達直接向企業出租由其晶元驅動的伺服器,並提供軟體説明公司開發AI模型和應用程式,以及管理訓練AI的GPU集群。
英偉達此前曾表示,這項業務未來可能產生1500億美元的收入——這一數字超過了英偉達或亞馬遜AWS目前的年營收額。
免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請核實。據此操作,風險自擔。