紮克伯格：Meta最新Llama模型將開源AI推向領導地位

更新于：2025-04-08 16:54:01

Meta Platforms Inc.（原Facebook）周六發佈了其Llama系列大語言人工智慧模型的最新成員，聲稱這些模型是有史以來向公眾發佈的最強大AI模型之一。

這些新模型屬於Llama 4系列，現已可通過Meta AI助手在網頁、Messenger、WhatsApp和Instagram上使用，也可以直接從Meta或Hugging Face下載。

新發佈的模型包括Llama 4 Scout，這是一個小型模型，能夠完全裝入單個Nvidia H100圖形處理單元中；以及Llama 4 Maverick，這是一個更大的模型，可與OpenAI的GPT-4o和Google LLC的Gemini 2.0 Flash相媲美。這兩個模型都擁有170億個活躍參數。

公司目前仍在開發Llama 4系列中的最大模型。據Meta首席執行官馬克·紮克伯格介紹，這個模型名為Llama 4 Behemoth，一旦發佈，它將成為"世界上性能最高的基礎模型"。

Meta表示，Llama 4模型是迄今為止該公司開發的最先進模型，在多模態能力方面也是"同類最佳"。多模態AI模型能夠處理不同類型的數據格式，包括文本、圖像、音訊和視頻，因此能夠理解更複雜的場景並生成更好的回應。

Meta首席產品官Chris Cox在3月份接受CNBC採訪時表示，Llama 4模型旨在為所謂的AI代理提供動力。這些AI代理是更複雜的AI模型和系統，具有增強的推理能力，能夠瀏覽網頁並採取行動。它們可以被指示代表人類完成各種任務，並且能夠在最少監督的情況下完成這些任務。

Meta表示，Llama 4 Scout是一個小型但極其高效的模型，設計為僅在一塊高端顯卡上運行。它能夠處理多達1000萬個"token"（AI行業對單詞或數據塊的稱呼）。公司指出，這比之前的"小型"大語言模型有了巨大飛躍。

在涵蓋"廣泛"應用的多項關鍵基準測試中，Llama 4 Scout的表現超過了其他小型大語言模型，如Google的Gemma 3和Gemini 2.0以及Mistral的Mistral 3.1。

至於Llama 4 Maverick，這是一個更強大的反覆運算版本，設計用於處理編寫代碼、創意寫作、解決數學問題以及理解圖像和視頻等任務。據Meta稱，儘管它更高效且具有成本效益，但其性能超過了競爭對手的模型，如OpenAI的GPT-4o和Google的Gemini 2.0。Meta沒有將其與最近發佈的Gemini 2.5模型進行比較，但表示Maverick的性能也與DeepSeek Ltd.的V3推理模型相當，儘管使用的活躍參數不到後者的一半。

在一篇詳細描述新模型及其創建方式的博客文章中，Meta解釋說，它使用了一種名為"專家混合"（Mixture-of-Experts，MoE）的新型系統，使模型能夠更高效地工作。MoE系統不是為每個任務使用整個模型，而是只啟動完成當前任務所需的部分，因此可以運行得更快並使用更少的能源。

Meta還簡要介紹了即將推出的Llama 4 Behemoth模型，該模型將擁有2880億個活躍參數，發佈時總參數量將接近2萬億。該模型仍在訓練中，因此尚未發佈，但它已經在使用一種稱為"蒸餾"的技術"教導"較小的Llama 4模型，這種技術使知識能夠從較大模型轉移到較小模型。據Meta稱，早期測試顯示，Llama 4 Behemoth在多項STEM基準測試中的表現顯著優於GPT-4.5和Claude Sonnet 3.7等競爭模型。

除了性能外，Meta還注重使Llama 4模型更安全、更平衡。它增強了內置保護措施，旨在防止模型提供有害或有偏見的回應，使其能夠對有爭議和政治敏感的問題提供更加平衡的答案。因此，Meta表示，Llama 4模型不太可能拒絕回答棘手問題，或在政治光譜的某一側過度傾斜。

"我們的目標是構建世界領先的AI，將其開源，並使其普遍可及，讓全世界的每個人都能受益，"紮克伯格在Instagram上發佈的視頻中說。"我一直認為開源AI將成為領先模型，隨著Llama 4的推出，這一趨勢正在開始發生。Meta AI今天將獲得重大升級。"

我們可以期待在4月29日Meta舉辦首屆年度LlamaCon AI大會時看到更多AI方面的內容，屆時該公司可能會發佈Llama 4 Behemoth模型。預計Meta還將在活動中宣佈一款獨立的Meta AI應用程式。