加快打造民營經濟發展高地|“要大膽地用,但又不能拿來就用” 從馬上消費看渝企的大模型應用之道
更新于:2025-04-13 13:02:35

DeepSeek的問世,掀起國內人工智慧大模型應用高潮。據不完全統計,目前,重慶全市至少有超10家市屬國企、3家三甲醫院、5個區縣政務系統完成DeepSeek當地語系化部署。更多單位還在躍躍欲試。

其實,早在2023年8月,馬上消費金融股份有限公司(下稱馬上消費)就上線了國內首個金融大模型——天鏡。目前,天鏡不僅應用於這家民企自己的業務全流程,還作為一項服務產品賣給了順豐國際快遞以及多家銀行客戶。

▲馬上消費科技展廳,工作人員演示“天境”大模型的各項功能。記者 謝智強 攝/視覺重慶

近兩年的實踐,馬上消費在大模型應用上積累了哪些經驗,給全市各單位提供了怎樣的啟示?4月9日,本報專訪了馬上消費人工智慧研究院院長陸全。

像人一樣聰明,但效率高出幾千上萬倍

銀行的客服人員最怕客戶問什麼問題?

組合金融產品的投資收益是其一。一般來說,為了吸引客戶,銀行通常會同時推出幾十甚至上百種投資產品,比如我們熟悉的理財、定期存款等。客戶的錢該買哪些產品,資產如何錯期配置,換句話說,如何組合投資,客戶才能最大限度獲取收益並降低風險,這是一道複雜的數學題。

以前,接到問題后,客服人員要查閱檔,再分頭計算,找出若干方案來一一比對,最後把最佳方案推薦給客戶。一番操作下來,至少要好幾分鐘。這顯然超過大部分客戶的忍耐時間,體驗感欠佳。

為了提升服務效率,近年來,一些銀行引入了智慧客服,但並未能從根本上解決問題。陸全告訴記者,智慧客服的原理類似於“窮盡法”,就是把客戶可能要問的問題全部羅列出來,再一一設置相應的答案,通過計算機程式設計來實現對客戶的自動應答。

但是,金融創新產品層出不窮,對客戶問答的設置很難做到“全知全能”,即便出現一次“漏網之魚”,也容易讓人覺得智慧客服“開黃腔”不可信。

天鏡大模型的推出,解決了上述難題。通過海量數據的訓練,大模型瞬間就能完成各種投資收益的計算,然後根據客戶的風險等級和投資偏好,馬上給出最佳組合投資方案。同時,大模型還將一線優秀客服的溝通技巧提煉為知識庫,相當於每個客服坐席都能調用數千名頂尖客服的經驗,讓客戶體驗更好。

大模型帶來的效率提升聽起來有些匪夷所思,它是怎樣的技術原理?

陸全介紹,通過機器學習,大模型掌握了一套類似於人類的邏輯推理方法,不需要上述智慧客服那樣的“窮盡法”,遇到問題可以自行分析判斷,像人一樣聰明,但效率可以高出幾千上萬倍。“人工智慧起源於上個世紀60年代,很多年都寂寂無聞,2022年ChatGPT 大模型問世後,人工智慧大爆發,原因正是大模型開啟了人工智慧的新紀元”。

不能“為了大模型而大模型”

天鏡大模型幾秒鐘就能回答複雜的組合金融投資問題,但我們在使用DeepSeek中,常常會遭遇卡頓,為什麼?

陸全的回答令人詫異——天鏡大模型並沒有直接使用DeepSeek,它的基座,是參數量要小得多的“小模型”。“我們也用了DeepSeek,但它的作用是來當老師,指導我們的數據生產,”他說。

為啥不用時下大火的DeepSeek,後者又為何如此卡頓?

我們先來看天鏡大模型的誕生歷程。陸全介紹,和不少資訊化程度較高的行業一樣,金融業尤其是他們這樣一開始就通過互聯網開展業務的消費信貸公司,很早就實現了業務的數據化,換言之,從客戶畫像到信用評級再到風險定價,所有資訊都變成了數位,儲存在機房中的伺服器里。

不過,上述資料庫,在大模型誕生之前,其主要功能相當於資料庫或圖書館,大家要做業務,就要去查查。

2022年,ChatGPT上線。但其至今並沒有開源(模型參數),國內使用者也難以通過直接訪問它的官網進行使用。不過他們公佈了技術路線。根據其技術路線,國際國內一些企業開發出了林林總總的模型,包括國內的文心一言、通義等。

搶抓技術革命帶動產業變革的重要契機,馬上消費通過自主研發為自己的數據使用安裝上了一款國產模型,國內首款金融大模型——天鏡,由此誕生。天鏡可以對數據進行自動查詢、分析,並根據這些數據給出各個工作流程的解決方案。

這樣,從客戶提出貸款申請到後台審批再到放貸,就實現了全程無人化操作,由此,馬上消費業務效率提升了80%,人力成本降低了21%。

2025年1月,在天鏡大模型2.0發佈兩個月後,DeepSeekR1模型問世。和一般大模型比起來,DeepSeek在模型的訓練階段加入了數量龐大的數學問題進行訓練,由此獲得了更強大的邏輯推理能力。

充分利用DeepSeek的上述優勢,此後,馬上消費用它來標註數據,然後再把數據投喂給天鏡大模型用於訓練。“老師”指導,進一步提升天鏡大模型的“智商”,馬上消費業務辦理的準確率提升了15%。

不過,多達6700億的參數量,是一般“小模型”的上百倍,這導致DeepSeek雖然聰明,卻多少有些臃腫和卡頓。馬上消費年信貸規模在500億元以上,位居消費金融行業前三。

“即便馬上消費這樣年信貸規模位居消費金融行業前列的體量,也不需要直接採用DeepSeek大模型基座,否則你的速度會很慢,”陸全認為,要根據自己的實際需求,採取多種模型協同使用的策略,而不是“為了大模型而大模型”。

對沖高昂的成本,最好的辦法是物盡其用

2025年3月,《重慶市人工智慧賦能超大城市現代化治理行動計劃(2025-2027年)》發佈,明確要求構建“數據-算力-模型-應用-安全”全鏈條支撐體系,到2027年開發100個智慧體,建成60個可複製推廣場景。這意味著,重慶的數字化轉型已從“選擇題”變成“必答題”。

這道題,該如何答?就大模型的應用而言,陸全認為:“要大膽地用,但又不能拿來就用”。

首先是提升自己的信息化水準。尤其是一些比較粗放的行業,甚至還在通過手工填表的方式辦理業務。“人工智慧是資訊化的高級階段,你先要實現你的業務全流程資訊化,建立起自己的資料庫,下一步才能談大模型。”他說。

其次,要有充足的資金準備。陸全介紹,目前,不少單位都涉及到需要保密的數據,不大可能租賃使用公共資料庫,必須自行購買伺服器,自建資料庫,成本不菲。

記者瞭解到,針對這樣的市場需求,有商家推出了一體智慧機,簡單地說,就是伺服器上搭載了免費的大模型。但其售價不低,一台就需要200萬元以上。同時,一體機上用的GPU算力晶片,故障率是電腦CPU的10倍以上,維護成本高。算力晶元反覆運算速度很快,資產折舊損耗大。

對沖設備成本和維護成本,陸全認為,最好的辦法是物盡其用。目前,重慶不少單位只是在資料庫上安裝了大模型基座,只能滿足資料的查詢和生成摘要這樣的簡單功能。“所有的業務流程都需要全部接進來,尤其是用戶端,客戶或服務對象要獲得便利感,否則大模型只能滿足自己的員工,從成本上講很劃不來,同時也有悖於數位重慶建設的初衷。”他說。

以醫院為例。據悉,目前,大模型的應用場景主要是醫學影像,醫生不用逐一看片,只用看大模型篩選出的關鍵幾張。但是,診斷環節還是人海戰術。醫生需要花較長時間和病人對話,然後診斷開處方。陸全認為,對話可以交給大模型來完成,醫生完全可以根據對話來診斷,幾台裝有大模型的電腦輔佐一個醫生,可節省大部分時間。