策略產品經理：模型訓練常知的六種演算法

ZAKER科技算法产品经理机器学习模型小于等于大于等于风控排序成长之路社交网络召回推荐算法

更新于：2025-03-26 14:55:45

策略產品經理需要瞭解一定的演演演算法邏輯，以便推進工作。這篇文章里，作者介紹了六種常見演算法，並探討了產品設計模型演算法的選擇，一起來看。

一、工業界常用演算法

作為與演算法同學對接的策略產品經理，我們必須對演算法同學常用的演演算法邏輯有所瞭解，以下我將介紹相關的底層演演算法邏輯，以及它們所適用的任務類型。

1. 邏輯回歸（logistics regression，LR）

模型訓練類別：監督學習演算法。

適用問題任務：分類。

演算法特色：複雜度低，可解釋性強，線上效果好。

函數公式：

y 表示模型預估值，取值範圍 [ 0,1 ] ，x 表示輸入模型的特徵值，可以理解為最終使用的一系列特徵對應的具體數值；T 表示矩陣的轉置，無實際數值意義；w 表示模型為每一個特徵訓練出的對應參數。以 CTR 預估模型為例，邏輯回歸模型輸出的預測值代表的業務意義是使用者對物料的興趣度。

另外，雖然線性回歸（linear regression）與邏輯回歸簡稱均為 LR，但是線性解決回歸問題，邏輯解決分類問題，逻辑回歸模型包含线性回歸模型，便是線性回歸模型。

2. K 近鄰演算法（K-nearest neighbor，KNN）

模型訓練類別：監督學習演算法。

適用問題任務：分類、回归。

K 的取值是關鍵因素，需要用交叉驗證法（測試集 + 訓練集）驗證。

注：使用 KNN 演算法的思想是每一位策略產品經理都需要瞭解的。

分類任務：

1. 計算待分類點（黑叉）與其他已知類別點的距離。

2. 按距離正排，佔比最好的類別即為待分類點的類別，計算方法有①歐式距離、②曼哈頓距離。

回歸任務：

整體思路與分類任務一致，預測點的值等於離預測點最近 K 個點的平均值。

總結：

KNN 演算法沒有模型訓練緩解，而是直接應用，所以 KNN 演算法在訓練環節的時間複雜度為 0，但是在應用環節，隨著樣本量陡增、複雜度的增加，在對於效率要求極高的場景下無法使用 KNN 算法。

3. 貝葉斯模型（Bayes Model）

模型訓練類別：監督學習演算法。

適用問題任務：分類。

模型方向：“逆概率”問題，用於郵件分類，天氣預測。

4. K 聚類演算法（K-Means）

模型訓練類別：無監督學習演算法。

適用問題任務：聚類。

K-Means 沒有模型訓練環節，利用啟發式反覆運算，K 值的選擇由業務場景確定，如無需求，可試數。

步驟：

將所有樣本分成幾個簇，即設定 K 值。

模型重新計算新簇質心，再次歸類。

不斷重複、優化。

5. 決策樹（decision tree）

模型訓練類別：監督學習演算法。

適用問題任務：分類、回归。

核心思想：根據有區分性的變數查分數據集。

基本框架要素：

1. 根節點：包含所有原始樣本數據，會被進一步分割成多個子集合。

2. 決策節點和葉子節點：葉子節點“不再被分割”，但可以分，決策節點根據特徵繼續分割。

3. 父節點與子節點：被分割成子節點的節點被稱為子節點的父節點。

決策樹種類： ①分類樹 ②回歸樹

決策樹效果評估：選擇哪些特徵組合構建效果最好呢？

分類樹：基尼不純度評估，不純度越低，效果越好。

回歸樹：方差指標評估，方差越小模型擬合效果越好。

決策樹關鍵參數：

節點拆分包含的最小樣本數：過大欠擬合，過小過擬合，需要交叉驗證來調參。

葉子節點包含的最小樣本數：防葉子節點太多，對於正負樣本不均的情況可以分小。

決策樹最大深度：交叉驗證解決。

總體葉子節點數量控制。

整體分裂中使用最多的特徵數：根據建模經驗，開根號的特徵數為最佳特徵數。

6. 深度神經網路（deep neutral network）

網上有很多資料介紹，可以自己找一下。

簡單介紹，深度學習中的“深度”指的是其 hidden layer，在輸出層和輸入層中，隱藏層越多深度越大。深度學習與常規神經網路演算法的區別主要體現在訓練數據、訓練方式、層數方面。

目前在產品策劃領域，深度學習可以解決安防領域、零售行業的視覺識別問題，也有如 ChatGPT 等的自然語音辨識、語言處理等應用，實體企業如智能駕駛中的地位正在提升，其最早被應用與搜光腿的演算法模型中。

二、產品設計模型演算法的選擇

對於同種業務場景可能使用多種演算法，然而作為產品經理，我們需要重點考核模型的兩大要點：模型預測的準確性和模型的可解釋性。

對於金融風控等受到強監管的場景，我們更偏向於使用具有可解釋性的模型，而對於搜廣推等產品體驗場景，我們更看重產品的使用效果，以下是各類演算法的使用效益分布圖：

題圖來自 Unsplash，基於 CC0 協定

特斯拉Model Y產線停工，博主稱下月7號再開工，原因未明

2025-03-31 03:43:01

大眾宣佈所有車型恢復實體按鍵，關於這事您怎麼看？

2025-04-02 21:01:34

特斯拉上海工廠放假？網友：Model Y訂單不及預期

2025-04-02 23:16:02

消息稱三星推進全固態電池研發，計劃今年應用於Galaxy Ring 2

2025-04-03 00:07:02

奧迪 A4L 200 萬輛悅享版售 28.98 萬起！推出限時終身質保

2025-04-03 16:56:39

大眾為何偏愛雙離合？DSG背後的戰略佈局與成本考量

2025-04-04 22:11:33

外媒：特斯拉在美國推出新版Model Y 價格降低1萬美元

2025-04-05 12:42:06

密歇根大學新突破：電動汽車寒冬充電速度飆升5倍

2025-04-06 04:04:43

再次牽手！快手與NBA中國宣佈達成新周期戰略合作

2025-03-26 00:35:57

Excel高手必備！4個簡單高效操作技巧速成

2025-03-26 14:23:29

機構報告：AI技術崗位薪資優勢明顯大模型演算法工程師位居高薪榜首

2025-03-26 01:20:59

抖音首次公開推薦演算法原理

2025-03-30 22:34:50

對話Halliday：在AI 眼鏡行業的起步階段，使用者使用時長比銷量更重要

2025-03-26 01:21:10

10 個機器學習錯誤以及如何避免這些錯誤

2025-03-26 14:50:33

機器學習經典演算法系列：小白也能看懂的7種分類演算法

2025-03-28 02:34:54

什麼是機器學習？

2025-03-28 08:01:21

房地產首款AI智慧體上線測試 10分鐘生成深度樓市報告

2025-04-06 12:02:50

什麼是Socket.IO？通俗的解釋並連接測試Socket.IO介面

2025-03-25 22:58:39

聽說誇克全面升級AI，我來說說體驗吧！

2025-03-25 23:08:26

模型欣賞：INART 1/6《黑神話：悟空》天命人·大聖金甲套

2025-03-25 23:44:19

速度為先：高效 AI 數據管理中的 ADC 應用

2025-03-26 00:13:49

騰訊混元推出 5 個開源3D模型： 30 秒生成

2025-03-26 00:15:02

一文搞懂“數據復盤”：思路，模型，15個建議點

2025-03-26 00:16:25

破譯呼吸里的生命密碼

2025-03-26 00:19:22