Meta宣佈推出全新一代大型自然語言處理模型Llama 4,並將推出兩款主要版本:Llama 4 Scout和Llama 4 Maverick,並預告即將推出更大規模的Llama 4 Behemoth及提高推論性能的Llama 4 Reasoning。
Llama 4 Scout配備了170億個參數 (109B總參數, 17B活躍參數),對應16種專業領域推論,主要針對文件內容摘要、用戶行為分析及個人化互動等場景進行優化。相比之下,Llama 4 Maverick同樣擁有170億個參數 (400B總參數, 17B活躍參數),且對應128種專業領域推論,進一步強化了多語言理解、推論及長文內容分析的能力,適用於數位助理服務及聊天機器人等應用。兩者都提供高效的推論速度,支援單GPU部署,並能在不同網路架構下靈活運行。
Llama 4 Maverick在編碼、推論及圖像基準測試的表現上,甚至能與OpenAI的GPT-4o和Google的Gemini 2.0競爭,並且在推論及編碼處理方面,表現接近DeepSeek v3.1。
Llama 4新模型採用了混合專家架構(Mixture of Experts, MoE)盡早期融合技術,使Llama 4具備處理多模態的能力,不僅能理解文本,還能處理圖像,為用戶帶來更全面的AI服務。MoE架構通過智慧選擇啟動少量參數來進行推論,從而實現更快的反應速度和更低的運算成本。例如Llama 4 Scout在處理請求時,可能只會啟動17億參數中的一部分,而不會啟動整個170億參數的模型,這樣可以大大提升計算效率。MoE模型能夠有效地分配不同專家來處理不同類型的問題,無論是程式設計、創意寫作還是其他複雜任務,這使得Llama 4在應對各種挑戰時表現出色。
Llama 4目前已經在Cloudflare Workers AI平臺推出,使用者也可通過LLama官網、Hugging Face託管網站使用。開發者可以立即使用Llama 4 Scout進行各種應用開發。這樣的平臺支援使開發者無需擔心基礎設施、硬體或記憶體問題,直接通過API調用即可實現Llama 4的強大功能。
Meta同時宣佈,未來將推出參數規模更為龐大的Llama 4 Behemoth,這款模型將擁有高達2880億個參數,將與其他大型AI模型競爭,推動更多高性能應用的實現。Meta還將在5月推出Llama 4 Reasoning,這將進一步提升推論性能,具體細節預計會在首屆LlamaCon開發者活動中公佈。
數據源:Cloudflare