LMArena 更新了Meta最新發佈的開源大模型Llama-4-Maverick的排名,從此前的第2名,直線掉到了第32名!
這也實錘了此前開發者對Meta為刷榜排名向LMArena提供了“特供版”的Llama 4大模型的質疑。
4月6日,Meta發佈了最新的大模型Llama 4,包含Scout、Maverick和Behemoth三個版本。其中,Llama-4-Maverick在LMArena公佈的Chatbot Arena LLM 排行榜中的排名第二,僅次於Gemini 2.5 Pro。
然而,隨著開發者實際使用Llama 4大模型開源版的效果陸續曝出,Llama 4口碑急轉直下。有開發者發現Meta提供給LMArena的Llama 4版本與提交給社區的開源版本不同,因而Meta被質疑為刷榜作弊。
4月8日,Chatbot Arena官方發文確認了使用者的上述質疑,公開表示Meta提供給他們的是“特供版”,並考慮更新排行榜。