計算成本低於DeepSeek？螞蟻集團回應自研大模型用國產AI晶片訓練_港資訊

計算成本低於DeepSeek？螞蟻集團回應自研大模型用國產AI晶片訓練

介面新聞

更新于：2025-03-26 05:16:50

3月24日，針對媒體對螞蟻百靈大模型訓練成本的報導，螞蟻集團方面回應介面新聞稱，螞蟻針對不同晶元持續調優，以降低AI應用成本，目前取得了一定的進展，也會逐步通過開源分享。

此前有報導稱，螞蟻集團正使用中國製造的半導體來開發AI模型訓練技術，這將使成本降低20%。知情人士稱，螞蟻集團使用了包括來自阿裡巴巴和華為的晶元，採用混合專家(MoE)機器學習方式來訓練模型。他們表示，螞蟻集團獲得了與採用英偉達H800等晶元訓練相似的結果。

其中一位知情人士稱，螞蟻集團仍在使用英偉達的產品進行人工智慧開發，但目前其最新模型主要依賴於包括AMD產品和中國晶元在內的替代產品。

另據鈦媒體報導，近日，螞蟻集團CTO、平臺技術事業群總裁何征宇帶領Ling Team團隊，利用AI Infra技術，開發了兩個百靈系列開源MoE模型Ling-Lite 和 Ling-Plus，前者參數規模168億，Plus基座模型參數規模高達2900億，相比之下，AI行業估計GPT-4.5參數量1.8萬億，DeepSeek-R1參數規模達6710億。

該技術成果論文《每一個FLOP都至關重要：無需高級GPU即可擴展3000億參數混合專家LING大模型》已在預印版Arxiv平台上發表。

除了自研性能領先的大模型以外，該技術論文最大的突破在於提出了一系列創新方法，以提升資源受限環境下AI開發的效率與可及性。實驗表明，其3000億參數的MoE大模型可在使用國產GPU的低性能設備上完成高效訓練，性能與完全使用英偉達晶片、同規模的稠密模型及MoE模型相當。

作為國內較早佈局AI大模型的廠商，螞蟻自研的百靈大模型2023年已通過備案，重點佈局在生活服務、金融服務、醫療健康等場景的應用。

局地降溫超過18℃，中央氣象台發佈寒潮藍色預警、大風藍色預警

局地降溫超過18℃，中央氣象台發佈寒潮藍色預警、大風藍色預警

2025-03-28 08:01:13

“這不就是世界本來的樣子嗎？” 中美網友奔現背後，小紅書走向國際

“這不就是世界本來的樣子嗎？” 中美網友奔現背後，小紅書走向國際

2025-03-28 08:18:32

默沙東田安娜：將進一步推廣男女共防的疫苗接種策略

默沙東田安娜：將進一步推廣男女共防的疫苗接種策略

2025-03-28 10:37:30

國家葯監局批准瑪舒拉沙韋片上市

國家葯監局批准瑪舒拉沙韋片上市

2025-03-28 11:07:28

女子做“私密修復”後昏迷？長沙市醫療美容協會發佈調查情況通報

女子做“私密修復”後昏迷？長沙市醫療美容協會發佈調查情況通報

2025-03-28 15:01:35

“雷軍廣告報價37萬起”衝上熱搜，小米：雷總沒計劃接商單

“雷軍廣告報價37萬起”衝上熱搜，小米：雷總沒計劃接商單

2025-03-28 16:02:11

香奈兒發佈全新手袋，TOD’S再現義大利夏日風光｜是日美好事物

香奈兒發佈全新手袋，TOD’S再現義大利夏日風光｜是日美好事物

2025-03-28 17:06:40

緬甸強震后泰國曼谷進入緊急狀態，一座在建高樓倒塌1人死亡43人失蹤

緬甸強震后泰國曼谷進入緊急狀態，一座在建高樓倒塌1人死亡43人失蹤

2025-03-28 18:45:15

OpenAI首席執行官山姆·奧特曼：GPU超負荷，將暫時對ChatGPT文生圖功能增加速率限制

OpenAI首席執行官山姆·奧特曼：GPU超負荷，將暫時對ChatGPT文生圖功能增加速率限制

2025-03-28 22:35:03

緬甸發生7.9地震，雲南瑞麗有房屋受損、人員受傷

緬甸發生7.9地震，雲南瑞麗有房屋受損、人員受傷

2025-03-28 23:12:21

吉爾吉斯斯坦與哈薩克邊境地區發生5.5地震

吉爾吉斯斯坦與哈薩克邊境地區發生5.5地震

2025-03-28 23:29:35

自然資源部海嘯預警中心發佈緬甸海域地震海嘯資訊

自然資源部海嘯預警中心發佈緬甸海域地震海嘯資訊

2025-03-29 04:44:55

緬甸發生6.4地震，震源深度30千米

緬甸發生6.4地震，震源深度30千米

2025-03-29 05:38:43

李自學卸任中興通訊董事長，曾被稱為“火山口”的掌舵者

李自學卸任中興通訊董事長，曾被稱為“火山口”的掌舵者

2025-03-29 07:28:29

中國“人造太陽”挺進燃燒實驗，意味著什麼？

中國“人造太陽”挺進燃燒實驗，意味著什麼？

2025-03-29 08:56:51

價超700億元，西門子閃電完成史上第二大收購

價超700億元，西門子閃電完成史上第二大收購

2025-03-30 11:10:50

湯加群島發生7.3地震，震源深度10千米

湯加群島發生7.3地震，震源深度10千米

2025-03-31 03:34:18

今明天西北華北加速回暖，最高溫20℃以上區域增多

今明天西北華北加速回暖，最高溫20℃以上區域增多

2025-03-31 06:41:13

日本再發特大地震風險評估：或致近30萬人死亡

日本再發特大地震風險評估：或致近30萬人死亡

2025-03-31 12:55:47

DeepSeek月訪問量超ChatGPT，市場份額全球第三

DeepSeek月訪問量超ChatGPT，市場份額全球第三

2025-03-31 13:48:46

湯加7.0地震后8次餘震，尚無傷亡損失報告

湯加7.0地震后8次餘震，尚無傷亡損失報告

2025-03-31 17:11:12

中國獨角獸企業達409家，居全球第二

中國獨角獸企業達409家，居全球第二

2025-03-31 17:35:17

智譜發佈新AI Agent：會做深度研究，但還是入門級

智譜發佈新AI Agent：會做深度研究，但還是入門級

2025-03-31 17:36:41

21萬人或死於海嘯，日本更新特大地震風險評估

21萬人或死於海嘯，日本更新特大地震風險評估

2025-04-01 01:44:20