Llama 4重測排名跌至32名
更新于:2025-04-14 03:27:29

LMArena 更新了Meta最新發佈的開源大模型Llama-4-Maverick的排名,從此前的第2名,直線掉到了第32名!

這也實錘了此前開發者對Meta為刷榜排名向LMArena提供了“特供版”的Llama 4大模型的質疑。

4月6日,Meta發佈了最新的大模型Llama 4,包含Scout、Maverick和Behemoth三個版本。其中,Llama-4-Maverick在LMArena公佈的Chatbot Arena LLM 排行榜中的排名第二,僅次於Gemini 2.5 Pro。

然而,隨著開發者實際使用Llama 4大模型開源版的效果陸續曝出,Llama 4口碑急轉直下。有開發者發現Meta提供給LMArena的Llama 4版本與提交給社區的開源版本不同,因而Meta被質疑為刷榜作弊。

4月8日,Chatbot Arena官方發文確認了使用者的上述質疑,公開表示Meta提供給他們的是“特供版”,並考慮更新排行榜。

不選貴的只選對的
不選貴的只選對的
2025-03-26 01:37:04