紮克伯格:Meta最新Llama模型將開源AI推向領導地位
更新于:2025-04-08 16:54:01

Meta Platforms Inc.(原Facebook)周六發佈了其Llama系列大語言人工智慧模型的最新成員,聲稱這些模型是有史以來向公眾發佈的最強大AI模型之一。

這些新模型屬於Llama 4系列,現已可通過Meta AI助手在網頁、Messenger、WhatsApp和Instagram上使用,也可以直接從Meta或Hugging Face下載。

新發佈的模型包括Llama 4 Scout,這是一個小型模型,能夠完全裝入單個Nvidia H100圖形處理單元中;以及Llama 4 Maverick,這是一個更大的模型,可與OpenAI的GPT-4o和Google LLC的Gemini 2.0 Flash相媲美。這兩個模型都擁有170億個活躍參數。

公司目前仍在開發Llama 4系列中的最大模型。據Meta首席執行官馬克·紮克伯格介紹,這個模型名為Llama 4 Behemoth,一旦發佈,它將成為"世界上性能最高的基礎模型"。

Meta表示,Llama 4模型是迄今為止該公司開發的最先進模型,在多模態能力方面也是"同類最佳"。多模態AI模型能夠處理不同類型的數據格式,包括文本、圖像、音訊和視頻,因此能夠理解更複雜的場景並生成更好的回應。

Meta首席產品官Chris Cox在3月份接受CNBC採訪時表示,Llama 4模型旨在為所謂的AI代理提供動力。這些AI代理是更複雜的AI模型和系統,具有增強的推理能力,能夠瀏覽網頁並採取行動。它們可以被指示代表人類完成各種任務,並且能夠在最少監督的情況下完成這些任務。

Meta表示,Llama 4 Scout是一個小型但極其高效的模型,設計為僅在一塊高端顯卡上運行。它能夠處理多達1000萬個"token"(AI行業對單詞或數據塊的稱呼)。公司指出,這比之前的"小型"大語言模型有了巨大飛躍。

在涵蓋"廣泛"應用的多項關鍵基準測試中,Llama 4 Scout的表現超過了其他小型大語言模型,如Google的Gemma 3和Gemini 2.0以及Mistral的Mistral 3.1。

至於Llama 4 Maverick,這是一個更強大的反覆運算版本,設計用於處理編寫代碼、創意寫作、解決數學問題以及理解圖像和視頻等任務。據Meta稱,儘管它更高效且具有成本效益,但其性能超過了競爭對手的模型,如OpenAI的GPT-4o和Google的Gemini 2.0。Meta沒有將其與最近發佈的Gemini 2.5模型進行比較,但表示Maverick的性能也與DeepSeek Ltd.的V3推理模型相當,儘管使用的活躍參數不到後者的一半。

在一篇詳細描述新模型及其創建方式的博客文章中,Meta解釋說,它使用了一種名為"專家混合"(Mixture-of-Experts,MoE)的新型系統,使模型能夠更高效地工作。MoE系統不是為每個任務使用整個模型,而是只啟動完成當前任務所需的部分,因此可以運行得更快並使用更少的能源。

Meta還簡要介紹了即將推出的Llama 4 Behemoth模型,該模型將擁有2880億個活躍參數,發佈時總參數量將接近2萬億。該模型仍在訓練中,因此尚未發佈,但它已經在使用一種稱為"蒸餾"的技術"教導"較小的Llama 4模型,這種技術使知識能夠從較大模型轉移到較小模型。據Meta稱,早期測試顯示,Llama 4 Behemoth在多項STEM基準測試中的表現顯著優於GPT-4.5和Claude Sonnet 3.7等競爭模型。

除了性能外,Meta還注重使Llama 4模型更安全、更平衡。它增強了內置保護措施,旨在防止模型提供有害或有偏見的回應,使其能夠對有爭議和政治敏感的問題提供更加平衡的答案。因此,Meta表示,Llama 4模型不太可能拒絕回答棘手問題,或在政治光譜的某一側過度傾斜。

"我們的目標是構建世界領先的AI,將其開源,並使其普遍可及,讓全世界的每個人都能受益,"紮克伯格在Instagram上發佈的視頻中說。"我一直認為開源AI將成為領先模型,隨著Llama 4的推出,這一趨勢正在開始發生。Meta AI今天將獲得重大升級。"

我們可以期待在4月29日Meta舉辦首屆年度LlamaCon AI大會時看到更多AI方面的內容,屆時該公司可能會發佈Llama 4 Behemoth模型。預計Meta還將在活動中宣佈一款獨立的Meta AI應用程式。