就在這個月了，Llama 4終於要來了

華爾街見聞

更新于：2025-04-06 00:33:21

去年春天，Meta發佈的Llama3大語言模型曾贏得開發者和獨立評測者的一致好評。然而時隔近一年，備受期待的繼任者Llama4卻遲遲未能發佈。

據知情人士透露，在至少兩次推遲后，Meta計劃在本月晚些時候發佈這一備受期待的AI模型——但這並非板上釘釘，仍有可能再度延期。

發佈延遲背後：技術性能未達預期

據兩位了解情況的人士稱，發佈推遲的關鍵原因之一，是該模型在開發過程中的技術基準測試表現未能完全達到Meta的內部預期，尤其在推理和數學任務方面存在短板。

此外，Meta內部也對其模型在類比人類語音對話方面無法與OpenAI的頂尖水準相媲美。

技術轉向與商業化新探索：擁抱MoE與LlamaX計劃

為了提升Llama4的競爭力，Meta計劃在技術路線上做出重要調整。

媒體援引兩位知情人士消息稱，至少有一個版本的Llama4預計將採用“混合專家”（MixtureofExperts,MoE）架構，而非Llama系列此前一直堅持的“密集”（Dense）模型。

MoE方法通過將模型劃分為多個專注於特定任務的“專家”子網路，在處理使用者請求時僅激活相關部分，從而有望在提升性能的同時提高運行效率。DeepSeek及其他多家領先的模型開發者均已採用此技術路線。

值得注意的是，Meta內部圍繞是否從Dense轉向MoE的決策，曾經歷了一場長達一年多的激烈技術辯論。最終選擇擁抱MoE，無疑也受到了DeepSeek等競爭對手成功實踐的部分影響。

在商業化層面，Meta正在積極籌劃新策略，以期更有效地將Llama推向企業市場。

媒體援引三位知情人士消息稱，公司內部正在深入討論Meta提供自營API的模式。不過，目前還不清楚該API將依託Meta自有數據中心還是租用雲服務商伺服器運行。

通過提供自營API，Meta或能效仿OpenAI的模式，向客戶提供諸如模型早期訪問許可權、定製化技術支援等增值服務。

這些討論是Meta內部代號為"Llama X"專案的一部分，該專案源自首席戰略官David Wehner的團隊。通過Llama X，Meta還希望招聘工程師、營銷人員和銷售人員來擴大Llama的企業應用範圍。

組織重組與產品困境

為了加快發展步伐，Meta今年2月對其生成式AI團隊的技術領導層進行了調整。該團隊任命了當時的Messenger負責人Loredana Crisan領導AI產品的產品管理，並更換了工程負責人Ryan Cairns和Ning Li。隨後，Meta又任命前混合現實技術副總裁Amir Frenkel為該團隊的工程負責人。

AI部門負責人Ahmad Al-Dahle在內部表示，這些變化將使團隊"更快、更有效地行動"並説明"作為一個團隊工作"。值得注意的是，Meta的生成式AI團隊在過去一年半從約500人急劇擴張到超過1700人，即使CEO紮克伯格近年來一直在壓縮公司成本和人員。

然而，產品方面的進展並不順利。Meta已致力於將其智慧眼鏡應用Meta View轉變為Meta AI的獨立應用，希望通過這樣的應用更好地展示Meta AI的能力。但近幾周，該應用在處理分析性、複雜任務方面表現不佳，特別是在審閱大量文檔和撰寫微妙文本方面存在困難。

Meta還考慮改變以往的做法，先通過Meta AI發佈Llama 4，然後再作為開源軟體發佈，這與過去同時發佈的策略形成對比。這樣的變化可能會提升Meta AI的使用數據，但也可能疏遠那些讚賞公司開源方式的研究人員和開發者。不過，尚不清楚Meta是否會推進這一計劃。

高額投入、不確定回報

對Meta來說，AI領域的投入巨大。公司正在為開發和運行其模型建設數據中心，今年資本支出計劃高達650億美元。更驚人的是，Meta還在討論一個可能耗資2000億美元的數據中心專案。

迄今為止，Meta在AI方面的成果喜憂參半。消費者AI方面，Meta AI助手截至今年1月擁有超過7億月活使用者，但其中部分使用被認為是非主動的，公司也尚未推出早在去年春季就有討論的付費版本。同時，Meta去年還裁撤了一組模仿名人和網紅的聊天機器人。在雲計算服務商向客戶銷售Llama方面，該模型未能獲得顯著吸引力。

儘管面臨這些挑戰，據一位接近公司的人士透露，Meta依然相信Llama 4將成為行業領先模型。

儘管挑戰重重，一位接近Meta的人士透露，公司內部依然堅信Llama4將會是一款行業領先的模型。

免責聲明:本文內容與數據僅供參考，不構成投資建議，使用前請核實。據此操作，風險自擔。