理想汽車全力衝刺:VLA模型能否引領智能駕駛新風尚?
更新于:2025-03-27 01:22:34

理想汽車正緊鑼密鼓地籌備其i系列純電動車型的密集上市計劃,其中i8將於今年7月亮相。為了支撐這一系列的發佈,理想汽車正著手兩大戰略部署:一是大規模擴建5C超充站網路,二是全力提升智慧駕駛技術的先進性。

據知情人士透露,理想汽車近期已啟動了一項封閉式開發專案,旨在今年下半年內實現VLA(視覺-語言-動作)智能駕駛大模型的落地應用。VLA技術已成為今年智能駕駛領域的核心競爭焦點,理想、吉利和元戎啟行等企業正競相成為首個實現VLA技術落地的公司。

然而,VLA技術的落地並非易事,既需要模型研發的深入,又面臨硬體性能的挑戰。目前市場上的主流晶元難以支撐VLA技術的運行,而英偉達即將量產的Thor系列晶元有望成為解決這一難題的關鍵。理想汽車原本計劃基於英偉達Thor-U晶片開發未來產品的智慧駕駛算力平臺,但在經歷了自研晶元專案“舒馬赫”的流片失敗后,理想汽車重新調整了策略,決定繼續使用英偉達的Thor-U MAX晶片進行開發,VLA模型亦有望基於此晶元實現。

智慧駕駛技術的競爭日益激烈,不斷推動行業第一梯隊座次的更迭。理想汽車在2024年憑藉端到端+VLM大模型技術嶄露頭角,去年10月底,理想汽車向超過30萬AD MAX版本車輛的車主推送了該技術,隨後又全量推送了車位到車位功能,成為行業先行者。儘管端到端+VLM方案受到了高度評價,但它仍屬於階段性成果,無法作為最終解決方案。

端到端智能駕駛大模型通過AI模型替代傳統智能駕駛方案中的感知、規劃和控制模組,讓智慧駕駛系統學習人類司機的駕駛方式,從而具備更高的能力上限和更快的進步速度。然而,現階段的大模型存在決策不可解釋和難以處理某些場景等問題。為了彌補這一不足,理想汽車在端到端模型的基礎上增加了VLM模型,以提升對複雜場景的理解能力。但VLM模型推理速度慢,且需要佔用大量算力資源。

因此,理想汽車啟動了端到端VLA模型的研究,旨在將端到端和VLM兩個模型融合為一個,使多模態大模型成為端到端智能駕駛大模型的一種能力。這一技術路徑被視為智慧駕駛的未來方向,甚至可能是接近最終解決方案的技術路徑。

隨著特斯拉FSD V12在國內開始小範圍測試,智能駕駛領域的競爭愈發激烈。包括理想在內的多家車企將VLA視為智能駕駛的未來方向,吉利、元戎啟行等企業也計劃在今年推出VLA技術。然而,VLA技術的落地仍面臨諸多挑戰,包括模型數據的深度融合和硬體性能的提升等。

華為和小鵬等企業在智慧駕駛領域也取得了顯著進展。他們採用了分段式端到端智能駕駛方案,通過增加大模型的可解釋性和推理能力來解決端到端大模型的問題。隨著頭部玩家智能駕駛技術的快速反覆運算,競賽節奏不斷加快,落後者的機會窗口逐漸縮窄。