Llama 4重測排名跌至32名_港資訊

Llama 4重測排名跌至32名

中關村在線排名 qs 大学销量金融中心 yen 全球城市榜单轿车

更新于：2025-04-14 03:27:29

LMArena 更新了Meta最新發佈的開源大模型Llama-4-Maverick的排名，從此前的第2名，直線掉到了第32名！

這也實錘了此前開發者對Meta為刷榜排名向LMArena提供了“特供版”的Llama 4大模型的質疑。

4月6日，Meta發佈了最新的大模型Llama 4，包含Scout、Maverick和Behemoth三個版本。其中，Llama-4-Maverick在LMArena公佈的Chatbot Arena LLM 排行榜中的排名第二，僅次於Gemini 2.5 Pro。

然而，隨著開發者實際使用Llama 4大模型開源版的效果陸續曝出，Llama 4口碑急轉直下。有開發者發現Meta提供給LMArena的Llama 4版本與提交給社區的開源版本不同，因而Meta被質疑為刷榜作弊。

4月8日，Chatbot Arena官方發文確認了使用者的上述質疑，公開表示Meta提供給他們的是“特供版”，並考慮更新排行榜。

40萬公里無大修，到底是豐田靠譜，還是本田耐用呢？

40萬公里無大修，到底是豐田靠譜，還是本田耐用呢？

2025-03-25 23:26:28

博越COOL設計時尚、配置豐富的高品質SUV新選擇

博越COOL設計時尚、配置豐富的高品質SUV新選擇

2025-03-25 23:29:56

B級車別亂買！品質最好的十大車型揭曉：雅閣丟冠，A4L、天籟上榜

B級車別亂買！品質最好的十大車型揭曉：雅閣丟冠，A4L、天籟上榜

2025-03-25 23:33:19

都2025年了，竟然還有人不知道燃油智慧SUV選博越 L！？

都2025年了，竟然還有人不知道燃油智慧SUV選博越 L！？

2025-03-25 23:33:31

哈弗 H6：空間大到超乎想像，全家出行無壓力

哈弗 H6：空間大到超乎想像，全家出行無壓力

2025-03-25 23:33:44

上汽大通G50混動：15萬級全能MPV，大空間省成本，強勁動力跑長途

上汽大通G50混動：15萬級全能MPV，大空間省成本，強勁動力跑長途

2025-03-25 23:34:37

小米無線鍵鼠套裝2：輕薄便攜，全尺寸辦公新體驗

小米無線鍵鼠套裝2：輕薄便攜，全尺寸辦公新體驗

2025-03-25 23:39:11

年輕人的第一台豪華轎車，沃爾沃S60vs凱迪拉克CT5，誰才是真正的“質價比之王”？

年輕人的第一台豪華轎車，沃爾沃S60vs凱迪拉克CT5，誰才是真正的“質價比之王”？

2025-03-25 23:44:05

家用SUV市場競爭激烈？長安CS75 PLUS憑什麼脫穎而出，值得買嗎？

家用SUV市場競爭激烈？長安CS75 PLUS憑什麼脫穎而出，值得買嗎？

2025-03-25 23:49:34

奇瑞汽車越級實力的多維解構，全新瑞虎8 PLUS獲得用戶喜愛

奇瑞汽車越級實力的多維解構，全新瑞虎8 PLUS獲得用戶喜愛

2025-03-26 00:10:49

比亞迪漢EV體驗報告：純電、混動、增程，誰更香？

比亞迪漢EV體驗報告：純電、混動、增程，誰更香？

2025-03-26 00:11:02

新能源車與燃油車並駕齊驅，未來十年如何選擇？車主必讀！

新能源車與燃油車並駕齊驅，未來十年如何選擇？車主必讀！

2025-03-26 00:11:48

六年車型銷量大洗牌：自主新能源崛起，合資燃油車何去何從？

六年車型銷量大洗牌：自主新能源崛起，合資燃油車何去何從？

2025-03-26 00:14:47

五座不夠用，七座太雞肋？來看看哪款大六座SUV更適合你

五座不夠用，七座太雞肋？來看看哪款大六座SUV更適合你

2025-03-26 00:17:35

索尼穩居無反相機市場份額第一高管稱有三大原因

索尼穩居無反相機市場份額第一高管稱有三大原因

2025-03-26 00:40:00

日產逍客、奇駿和探陸三款車推出動力總成終身質保，大難點解決了

日產逍客、奇駿和探陸三款車推出動力總成終身質保，大難點解決了

2025-03-26 00:41:41

港股汽車股集體走低，長城汽車跌超5%

港股汽車股集體走低，長城汽車跌超5%

2025-03-26 00:46:54

神龍汽車發佈自主新能源品牌HEDMOS示界

神龍汽車發佈自主新能源品牌HEDMOS示界

2025-03-26 00:57:19

1-2月合資汽車品牌終端銷量出爐沒有一家實現正增長

1-2月合資汽車品牌終端銷量出爐沒有一家實現正增長

2025-03-26 00:57:56

PUBG熱度再攀高峰全球134萬玩家同時在線

PUBG熱度再攀高峰全球134萬玩家同時在線

2025-03-26 01:02:09

五菱繽果遭車主投訴：二次噴漆、多處鏽蝕、續航嚴重縮水？

五菱繽果遭車主投訴：二次噴漆、多處鏽蝕、續航嚴重縮水？

2025-03-26 01:20:45

凱迪拉克XT5降價13.40萬，豪華SUV對比奧迪Q5L，哪個更值得入手？

凱迪拉克XT5降價13.40萬，豪華SUV對比奧迪Q5L，哪個更值得入手？

2025-03-26 01:24:34

豐田召回 545 輛進口雷克薩斯 GX 汽車

豐田召回 545 輛進口雷克薩斯 GX 汽車

2025-03-26 01:26:23

不選貴的只選對的

不選貴的只選對的

2025-03-26 01:37:04