去年春天,Meta發佈的Llama3大語言模型曾贏得開發者和獨立評測者的一致好評。然而時隔近一年,備受期待的繼任者Llama4卻遲遲未能發佈。
據知情人士透露,在至少兩次推遲后,Meta計劃在本月晚些時候發佈這一備受期待的AI模型——但這並非板上釘釘,仍有可能再度延期。
據兩位了解情況的人士稱,發佈推遲的關鍵原因之一,是該模型在開發過程中的技術基準測試表現未能完全達到Meta的內部預期,尤其在推理和數學任務方面存在短板。
此外,Meta內部也對其模型在類比人類語音對話方面無法與OpenAI的頂尖水準相媲美。
為了提升Llama4的競爭力,Meta計劃在技術路線上做出重要調整。
媒體援引兩位知情人士消息稱,至少有一個版本的Llama4預計將採用“混合專家”(MixtureofExperts,MoE)架構,而非Llama系列此前一直堅持的“密集”(Dense)模型。
MoE方法通過將模型劃分為多個專注於特定任務的“專家”子網路,在處理使用者請求時僅激活相關部分,從而有望在提升性能的同時提高運行效率。DeepSeek及其他多家領先的模型開發者均已採用此技術路線。
值得注意的是,Meta內部圍繞是否從Dense轉向MoE的決策,曾經歷了一場長達一年多的激烈技術辯論。最終選擇擁抱MoE,無疑也受到了DeepSeek等競爭對手成功實踐的部分影響。
在商業化層面,Meta正在積極籌劃新策略,以期更有效地將Llama推向企業市場。
媒體援引三位知情人士消息稱,公司內部正在深入討論Meta提供自營API的模式。不過,目前還不清楚該API將依託Meta自有數據中心還是租用雲服務商伺服器運行。
通過提供自營API,Meta或能效仿OpenAI的模式,向客戶提供諸如模型早期訪問許可權、定製化技術支援等增值服務。
這些討論是Meta內部代號為"Llama X"專案的一部分,該專案源自首席戰略官David Wehner的團隊。通過Llama X,Meta還希望招聘工程師、營銷人員和銷售人員來擴大Llama的企業應用範圍。
為了加快發展步伐,Meta今年2月對其生成式AI團隊的技術領導層進行了調整。該團隊任命了當時的Messenger負責人Loredana Crisan領導AI產品的產品管理,並更換了工程負責人Ryan Cairns和Ning Li。隨後,Meta又任命前混合現實技術副總裁Amir Frenkel為該團隊的工程負責人。
AI部門負責人Ahmad Al-Dahle在內部表示,這些變化將使團隊"更快、更有效地行動"並説明"作為一個團隊工作"。值得注意的是,Meta的生成式AI團隊在過去一年半從約500人急劇擴張到超過1700人,即使CEO紮克伯格近年來一直在壓縮公司成本和人員。
然而,產品方面的進展並不順利。Meta已致力於將其智慧眼鏡應用Meta View轉變為Meta AI的獨立應用,希望通過這樣的應用更好地展示Meta AI的能力。但近幾周,該應用在處理分析性、複雜任務方面表現不佳,特別是在審閱大量文檔和撰寫微妙文本方面存在困難。
Meta還考慮改變以往的做法,先通過Meta AI發佈Llama 4,然後再作為開源軟體發佈,這與過去同時發佈的策略形成對比。這樣的變化可能會提升Meta AI的使用數據,但也可能疏遠那些讚賞公司開源方式的研究人員和開發者。不過,尚不清楚Meta是否會推進這一計劃。
對Meta來說,AI領域的投入巨大。公司正在為開發和運行其模型建設數據中心,今年資本支出計劃高達650億美元。更驚人的是,Meta還在討論一個可能耗資2000億美元的數據中心專案。
迄今為止,Meta在AI方面的成果喜憂參半。消費者AI方面,Meta AI助手截至今年1月擁有超過7億月活使用者,但其中部分使用被認為是非主動的,公司也尚未推出早在去年春季就有討論的付費版本。同時,Meta去年還裁撤了一組模仿名人和網紅的聊天機器人。在雲計算服務商向客戶銷售Llama方面,該模型未能獲得顯著吸引力。
儘管面臨這些挑戰,據一位接近公司的人士透露,Meta依然相信Llama 4將成為行業領先模型。
儘管挑戰重重,一位接近Meta的人士透露,公司內部依然堅信Llama4將會是一款行業領先的模型。
免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請核實。據此操作,風險自擔。