科大訊飛:多模態大模型驅動汽車智慧化新變革
更新于:2025-04-06 03:34:12

智慧化已成為汽車行業的核心發展趨勢,貫穿智慧座艙、自動駕駛等多個領域。隨著大模型技術的發展,汽車智慧化競爭愈發激烈,車企面臨著從價格戰轉向價值戰的挑戰。

2025年3月20日,在第三屆AI定義汽車論壇上,科大訊飛智慧汽車事業部副總經理、科大訊飛蘇州研究院執行院長支洪平表示,科大訊飛在大模型領域成果顯著,其訊飛星火大模型是國內唯一基於全國產平台訓練的通用大模型。在汽車智慧化應用方面,多模態大模型使汽車人機交互更自然、擬人且情感化,科大訊飛通過技術優化,將交互速度降至1.5秒以下,還支援多種語言免切換交流,並能精準識別車內車外場景物品 。

同時,科大訊飛利用自身算力底座和星火大模型構建智慧體搭建平臺,實現豐富智慧體上車。例如,與支付寶合作的咖啡助手,支持车内刷脸无感支付订咖啡。在汽車音效領域,科大訊飛也有諸多創新,如嗨唱功能(無麥K歌)、星火調音師、超臨感環繞聲等,智慧聲場使車內空間可玩性大大增加。

支洪平 | 科大訊飛智慧汽車事業部副總經理、科大訊飛蘇州研究院執行院長

以下為演講內容整理:

汽車智慧化發展趨勢剖析

在當前汽車產業的發展格局中,智慧化已成為不可阻擋的核心趨勢,深度重塑著汽車行業的發展軌跡。中國汽車工程學會發佈的2024年和2025年汽車十大趨勢顯示,智慧化貫穿於汽車產業的多個關鍵領域,不僅在智慧座艙的交互體驗中佔據重要地位,還對自動駕駛技術以及車內音效等方面產生著深遠影響。進入2025年,智慧化更是成為汽車行業前行的關鍵引領力量,其重要性與日俱增。 

2024年春節期間Deepseek R1的出現引發了廣泛關注,在這一背景下,吉利等二十多家車企迅速將相關大模型應用於車端,這一現象體現了人工智慧領域的“平權化”趨勢。企業能夠藉助外部的基礎能力,以較低成本獲取強大的技術支援,為自身發展提供有力支撐。然而,在接入基礎能力之後,如何圍繞使用者需求打造閉環式的價值體驗,成為企業面臨的重要課題。這需要企業深入理解使用者需求,將技術與實際應用場景緊密結合,從產品設計、功能開發到售後服務等各個環節,構建起完整的價值交付體系,提升用戶的整體體驗。

圖源:科大訊飛

在自動駕駛領域,行業正處於從早期採用者向早期大眾過渡的關鍵階段,這一過程猶如跨越一道鴻溝,充滿挑戰。2025年2月10日,比亞迪發佈的天神之眼系統,開啟了全民自動駕駛的新篇章,使得低價位車型的自動駕駛成為行業新的競爭焦點。在價格戰不斷升級的市場環境下,如何打造性價比更高、性能更優的自動駕駛系統,成為車企必須攻克的難題。這不僅要求車企在技術研發上加大投入,提高自動駕駛系統的安全性和可靠性,還需要優化成本結構,提升產品的市場競爭力,實現從單純的價格競爭向價值競爭的轉變。

從人工智慧的發展歷程來看,自1956年達特茅斯會議起,歷經四次發展浪潮,在算力、演算法和數據的共同推動下,如今已迎來智慧湧現和通用人工智慧的曙光。科大訊飛於2023年5月推出訊飛星火大模型,並在近兩年時間里進行了七次重大反覆運算升級。該模型對標國際先進水準,是國內唯一基於全國產平台訓練的通用大模型,這一成果彰顯了科大訊飛在人工智慧領域的技術實力和創新能力。

展望2025年,大模型與汽車的融合將聚焦於人機交互和場景創新兩個關鍵領域。在人機交互方面,多模態大模型將使人機交互更加自然、擬人化且富有情感。傳統的人機交互速度較快,但引入大模型后,由於語音輸入、模型處理、後端聯網服務以及語音反饋等環節的增加,交互速度顯著下降。科大訊飛致力於提升交互效率,目前已將交互時間縮短至1.5秒以下,接近傳統人機交互的平均水準。此外,多模態大模型還支援普通話與方言、普通話與外語的自然切換,能夠感知使用者的情感和情緒,實現更加自然流暢的交互。從交互範圍來看,從單人交互逐漸擴展到多分區交互,車內的司機和乘客都能得到精準的交互回應。同時,多模態交互還涵蓋對車內車外場景物品的識別,包括車標、車型、動物、景觀、地標以及車內人員的數量、年齡、表情和情緒等,為使用者提供更加個人化、智慧化的服務。

基於多模態大模型的汽車智慧化創新實踐

針對不同大模型在不同應用場景下的特點,科大訊飛提出“快思考”與“慢思考”相結合的交互策略。以DeepSeek為代表的大模型在深度推理方面表現出色,例如在邏輯運算、數學計算和代碼處理等方面具有優勢,但交互速度相對較慢;而訊飛星火等大模型則在閒聊、垂直領域知識庫查詢等方面速度較快,交互體驗良好。基於此,科大訊飛根據使用者提出的問題類型,智慧分配算力資源,選擇合適的模型進行處理。對於簡單的車輛控制指令,如調節車窗、空調溫度等,採用“快思考”模型快速回應,確保高效便捷;而對於旅遊規劃、餐廳推薦等需要多輪交互和深度推理的複雜問題,則啟用“慢思考”模型,通過多輪交互提供更具價值的解決方案,提升用戶體驗。

科大訊飛憑藉自身的算力底座和星火大模型,構建了一套完整的工具鏈,為車企和第三方夥伴搭建智慧體提供了有力支援。通過智慧體平臺,不僅可以開發科大訊飛自身的應用,還能促進第三方應用的創新發展。以醫療、教育、用車助手等智慧體為例,這些應用為使用者提供了更加專業、便捷的服務。此外,科大訊飛與支付寶合作開發的咖啡助手,實現了車內語音訂咖啡和刷臉無感支付的功能。用戶在開車途中只需通過語音下達指令,即可完成咖啡預訂,並利用車內攝像頭刷臉支付,到達目的地后可直接取咖啡,極大地提升了用戶體驗,為用戶帶來了更加自然、流暢的交互方式。 

隨著新能源汽車的普及,車內高品質音樂體驗成為消費者購車時的重要考量因素。科大訊飛憑藉其在行業內的領先優勢,推出了一系列創新的音效功能。“嗨唱功能”或“無麥K歌”,通過對音訊源進行分軌處理,將人聲分離出來,用戶可以在車內進行獨唱、對唱、伴唱和領唱等多種形式的K歌活動,將汽車變成移動的K歌房。以經典歌曲《鐵血丹心》為例,用戶可以根據自己的需求消除或保留特定歌手的聲音,與他人合唱,豐富了車內娛樂的玩法。“星火調音師”功能則滿足了使用者對個人化音效的需求。用戶可以通過自然語言提出對音效的調整要求,如提高高音的明亮度、增強低音的厚重感等,系統經過多輪交互后,將車內音響調校到用戶滿意的狀態,並支援使用者將個人調校模式上傳至雲端,供其他用戶下載使用,實現了行業生態的共創。針對網上音樂聲道格式的局限性,科大訊飛利用AI分軌技術,將常見的雙聲道立體聲音樂轉化為具有強烈空間感和立體感的7.1.4聲道音響效果,充分發揮了車內多通道音響的優勢,為用戶帶來更加沉浸式的音樂體驗。

圖源:科大訊飛

在自動駕駛領域,端到端模型逐漸興起。傳統的自動駕駛分模組執行,從感測器採集數據,經過感知、決策、規劃到控制,存在信息傳遞損耗和效率低下的問題。而端到端模型則從感測器輸入直接到軌跡輸出,形成一個完整的單一大模型。這種模型能夠減少信息損失,提高規劃的擬人化程度,更好地適應複雜場景,最終實現全域領航。

科大訊飛對車企的多元賦能與合作成果

科大訊飛不僅關注汽車本身的智能化發展,還著眼於車企在行銷、客戶管理、客戶服務以及生產管理等方面的智慧化需求,提供全面的解決方案。在營銷環節,利用大數據和人工智慧技術,幫助車企精準定位目標客戶群體,制定個人化的行銷策略,提高行銷效果和市場佔有率。在供應鏈管理方面,通過智慧化的分析和預測,優化供應鏈流程,降低成本,提高供應鏈的效率和靈活性。在客戶服務領域,借助智慧客服系統,實現快速回應客戶諮詢,提升客戶滿意度。在生產管理方面,利用人工智慧技術優化生產流程,提高生產效率和產品品質,助力車企實現全面的智能化轉型。 

截至目前,訊飛星火大模型已落地10余款車型,在助力中國車企出海方面取得了顯著成績。在中國汽車出海的前十強車企中,有八家選擇與科大訊飛合作。這充分體現了科大訊飛在汽車智慧化領域的技術實力和行業影響力,也表明了車企對科大訊飛解決方案的高度認可。通過與車企的緊密合作,科大訊飛將自身的技術優勢與車企的產業資源相結合,共同推動汽車智慧化技術的發展和應用,為中國汽車產業在全球市場的競爭中贏得了優勢。

圖源:科大訊飛

在汽車智慧化的浪潮中,科大訊飛憑藉對行業趨勢的敏銳洞察、持續的技術創新以及與車企的深度合作,在智慧座艙、人機交互、智慧聲場和企業數位化等多個領域進行了全面佈局。隨著技術的不斷進步和應用場景的持續拓展,科大訊飛有望在未來汽車智慧化的發展進程中發揮更加重要的作用,與車企攜手共進,推動中國乃至全球汽車產業向更高水準的智慧化邁進。

(以上內容來自科大訊飛智慧汽車事業部副總經理、科大訊飛蘇州研究院執行院長支洪平於2025年3月20日在第三屆AI定義汽車論壇發表的《多模態大模型驅動汽車智慧化新變革》主題演講。)

AI的奉獻
AI的奉獻
2025-03-30 23:57:52