什麼是好演算法_港資訊

什麼是好演算法

ZAKER科技

更新于：2025-03-26 06:41:15

在應用科學領域，演算法的選擇和應用是一個複雜的問題，它涉及到數學、工程和業務策略等多個方面。這篇文章，我們來看看演算法的增益、部署問題、線性與非線性模型的選擇，以及樹模型和神經網路演算法的適用場景。

其實，在應用科學領域，這是最微不足道的。

AI，就是數學的遊戲，這不能算貶義，因為數學真的是皇冠。

演算法帶來的超額效果很小。除了邏輯回歸複雜度較低之外，xgb、lgb，神經網弱等學習能力都很強，演算法的增益幾乎可以忽略不計。

選擇演算法，最重要的是考慮部署問題。如果你們工程上只會邏輯回歸的線性計算，那你就只能選邏輯回歸。選擇別的演算法，要先解決工程問題。但其實都好解決，也不好解決，主要看系統能力，其次看個人能力。

從線性和非線性的角度說吧，邏輯回歸當然是線性的，神經網路和樹模型是非線性的。這個問題帶來的結果是，線性的需要分客群，非線性的可能可以不特別需要分客群。

為什麼？

ln ( odds ) =a1x1+a2x2+ …，你看表達式就知道了，不同客群的係數矩陣 A 肯定是不一樣的，實際上連組成 X 矩陣的 woe 值都不一樣。不一樣的表達式，採用線性的方式強行合成一個，肯定是有損的。

那樹模型呢？分客群可以看作第一層分裂進行了手動分群，其實還不如不分，留給演算法自己分。如果你保證總的複雜度不變的話，我相信演算法自己分效果會更好。

也就是說，假如分了 n 個客群，建了 n 個模型，對比的那一個不分客群的模型，在相同的參數下，評估器的數量應該乘以 n。

我們這裡說的是做模型分不分客群。建模不分客群不代表策略不分客群，做策略的時候自行去劃分就好了。

有人說，神經網路演算法更適合同質類數據，即數據的每一維變數是有同樣含義的，比如圖像中的圖元、文字中的字元、音訊中的波形，決策樹演算法更適合異質類數據，比如風控場景中的年齡、收入、職業等。

有點道理，這是結構化數據和非結構化數據的另一種說法。

有人說，在風險建模的時候，若採用樹演算法，最常採用的參數為低深度、高數量（樹深通常設置為 2-3，樹的棵數設置為幾十到一百），一旦樹深設置過高，則極易產生過擬合，這與我們對金融數據缺少高階信息的評判相符。一旦涉及到高阶交叉特征，則此時帶來的雜訊極可能超過信號，甚至影響到低階特徵的學習效果。對於同質資訊，比如數據源都為多頭資訊，樹深可以設置的高一些，因為此時更深的樹也不代表高階交叉，本質上只是同一個資訊源的不同分裂節點而已。

有點道理，樹深的問題理解成高階不高階，仁者見仁智者見智，畢竟樹深越深模型越複雜效果就是越好，你不能說它有什麼大問題。設置低樹深更重要的是和策略，和人的理解保持一致，三個變數交叉已經夠你理解的了。至於同質資訊，更深的樹不代表高階交叉，這樣說也對，畢竟多個多頭變數組合你可以理解成一個更複雜的多頭變數加工。但是無須差異化，仍然保持低樹深即可。

題圖來自 Unsplash，基於 CC0 協定。

AI 三部曲之中場盤點：現在，誰還在AI的牌桌上？

AI 三部曲之中場盤點：現在，誰還在AI的牌桌上？

2025-04-01 16:32:19

夠狠！比亞迪多款車型，又降價了.

夠狠！比亞迪多款車型，又降價了.

2025-04-01 16:34:51

檀健次《濾鏡》口碑出圈！不被定義的他，憑何拿下“作品+商業”雙王牌？

檀健次《濾鏡》口碑出圈！不被定義的他，憑何拿下“作品+商業”雙王牌？

2025-04-01 21:26:29

「Apple AI」中文版正式上線：還不太好用，但確實很「蘋果」

「Apple AI」中文版正式上線：還不太好用，但確實很「蘋果」

2025-04-02 21:38:57

vivo X200 Ultra超廣角強悍，韓伯嘯曬實拍樣張

vivo X200 Ultra超廣角強悍，韓伯嘯曬實拍樣張

2025-04-03 05:19:27

Nature重磅：DeepMind AI又一重大突破，1次配置解決150種多任務

Nature重磅：DeepMind AI又一重大突破，1次配置解決150種多任務

2025-04-03 11:42:32

任天堂 Switch 2：性能變強，價格更高，還藏著這些 “小傲嬌”

任天堂 Switch 2：性能變強，價格更高，還藏著這些 “小傲嬌”

2025-04-03 15:42:48

鍾睒睒：農民要價8元一斤茶葉，我給10塊

鍾睒睒：農民要價8元一斤茶葉，我給10塊

2025-04-03 16:12:41

余承東不再任“華為車BU董事長”

余承東不再任“華為車BU董事長”

2025-04-04 10:17:28

解碼中國電信TeleAI：長期主義的AI試驗場

解碼中國電信TeleAI：長期主義的AI試驗場

2025-04-04 11:52:26

神速！iOS 18.5 首測發佈，國區 AI 解封

神速！iOS 18.5 首測發佈，國區 AI 解封

2025-04-04 18:44:13

ChatGPT高級技巧：如何寫好一本書（初級篇）

ChatGPT高級技巧：如何寫好一本書（初級篇）

2025-04-04 23:47:17

雷軍停更4天，盧偉冰回應雷軍近況

雷軍停更4天，盧偉冰回應雷軍近況

2025-04-05 23:26:22

演算法人生（20）：從“自注意力機制”看“個人精力怎麼管”

演算法人生（20）：從“自注意力機制”看“個人精力怎麼管”

2025-04-06 01:21:47

大模型的注意力機制給我們的啟示

大模型的注意力機制給我們的啟示

2025-04-06 01:26:52

AI時代產品經理必須懂得的技術，談談Rag的產生原因、基本原理與實施路徑

AI時代產品經理必須懂得的技術，談談Rag的產生原因、基本原理與實施路徑

2025-04-06 02:10:02

寵物葬禮，一場辦給活人的療癒儀式

寵物葬禮，一場辦給活人的療癒儀式

2025-04-06 16:02:47

蘋果前員工：刪掉這三種 App，iPhone 更流暢！

蘋果前員工：刪掉這三種 App，iPhone 更流暢！

2025-04-06 21:40:25

宣傳吹爆，實物卻像“搖搖車”？日本這隻狗有點迷

宣傳吹爆，實物卻像“搖搖車”？日本這隻狗有點迷

2025-04-07 07:57:21

裁員為什麼總容易先裁老員工？

裁員為什麼總容易先裁老員工？

2025-04-07 10:51:32