網上分享數據指標體系的文章很多,但講數據標籤的文章很少。實際上,標籤和指標一樣,是數據分析的左膀右臂,兩者同樣重要。實際上,很多人分析不深入,就是因為缺少對標籤的應用。今天系統的講解下。
一個通俗的例子
比如我們要介紹陳老師,可以有三種講法:
指標:陳老師身高180cm,體重200斤
標籤:陳老師1米8,大胖子
標籤:陳老師啊,黑旋風李逵聽說不?
這就是標籤和指標的直觀區別。數據指標,是用數據對事物的準確描述。比如身高、體重、腰圍、手臂長度,這些都是數據指標。標籤,則是基於原始數據加工的,帶了業務含義的概括性描述。一個“大胖子”,就同時概括了身高和體重,而“長得跟李逵似的”,更是把五官、身材、氣質等特徵都概括進來了。
指標 VS 標籤
顯然,對比起來,用數據指標描述事物,會更精確。但標籤也是同樣重要的。因為除了“精準”以外,人們還有更多的需求。
首先,並非所有特徵都能用一個數據指標來描述。常見的指標,一般是連續變數(比如身高183cm)或者定序變數(風險等級ABCDE)。還有大量的特徵,是以分類變數的形式存在。比如商品規格(50ml一瓶)、顏色(赤橙黃綠)、用途(比如:居家保健、外出防護……)這些商品特徵,一般是以標籤的形式進行描述,這也是“標籤”這個詞最早的來源。
其次,標籤是有業務含義的。比如光說兩個指標:身高183、體重200斤,人聽了也沒啥感覺,但一旦加上標籤:身高183+體重200,很魁梧/身高183+體重200,大胖子。是不是腦海裡立馬有畫面感了。
最後,標籤更容易被業務使用。介紹物件,說“我介紹個小蘿莉給你”,遠比“我介紹一個身高153體重85的女生給你”,更容易促成下一步行動。這就是標籤的魅力。
所以,標籤體系的建設是非常重要的,不但能豐富數據分析的素材,更能直接推動分析成果落地。
標籤有哪些
標籤有四類
1、基礎特徵標籤
2、規則計算標籤
3、綜合計算標籤
4、模型預測標籤
四類介紹如下
相當多的企業,沒有系統做過標籤梳理,有大量的散亂的基礎特徵標籤。有些營業單位自己會習慣性提規則/綜合計算的標籤,但是沒有和其他部門共識過,導致通用性差。這些都制約了標籤發揮作用。
那如果做得好的話,標籤能發揮啥作用呢?
典型的標籤使用場景
一:查詢資訊。這是最普遍的場景了。大量的一線工作人員會有需求,比如客服、銷售、售後、文案編輯,能通過標籤,快速查到對應的商品、客戶、活動等資訊,提高工作效率。而且查詢用的標籤不需要很複雜,基礎特徵標籤即可。
二:分析材料。比如做漏鬥分析,看到A管道比B管道轉化好,可怎麼解釋呢?這時候可以引入一系列標籤。比如
渠道標籤:公域、大眾私域、垂直私域
文案標籤:產品知識、優惠資訊、個人分享
商品標籤:流量款、爆款、利潤款、
優惠標籤:優惠力度大、中、小
有了這些標籤,在解讀“為什麼轉化率高”問題的時候,就多了很多分析線索。通過分類對比,追蹤,測試,能看出來哪種標籤組合下轉化率最高。比單純看轉化率、每個頁面UV這些數據好用得多。
另:很多toB類分析做得很膚淺,就是因為標籤收集得太少。對客戶情況、談判情況、交付過程一無所知,只知道:客戶還沒簽約,客戶簽約都仨月了還沒打款。這當然分析不下去了
三:策略制定。制定策略時,經常有固定的目標客戶、目標商品、目標管道。比如客戶問題上,沉睡用戶啟動、流失使用者挽留、風險使用者管理,就是常見的固定主題。這時候,使用固定的標籤,比如風險等級ABCDE,遠比每次都臨時取數拿規則省事。而且,可以通過演算法模型加持,不斷提升標籤準確性。這是標籤的高級應用了。
高級應用,需要綜合計算、模型計算類複雜標籤。在建設路線上,標籤體系和數據指標體系有重大區別。數據指標體系建設,重在:全面。一個業務場景里,盡量多收集數據指標,數據指標越多越好。而標籤體系建設,重在:有序、有效。圍繞一個業務目標,盡可能多地把零散、原始描述的標籤,組合成對業務有用的標籤。標籤在精不在多,標籤品質非常重要。
如何提升標籤品質
相比之數據指標,標籤品質天生是個難題。因為標籤是人工生產的,加入人的主觀判斷的。很有可能標籤的描述不夠準確,生產標籤的數據源不能很好地表達標籤的含義,從而產生誤判。我們常說:“不要給人亂貼標籤”,就是擔心第一眼誤判,干擾了對整個人的判斷。
因此,標籤的使用過程,與數據指標有很大區別。數據指標一旦梳理完成,除非流程更改,否則不會怎麼變動。而標籤在建設過程中,需要圍繞同一個目標,不斷地做優化,有一個明顯的“提純”的動作。
提純是以清晰目標為前提的。比如想打一個標籤:高潛力使用者。如果說“我想知道哪些用戶潛力高”,這就是句廢話!正確的表達是:“我知道了哪些用戶潛力高以後,我可以向他們投放更貴的商品組合,他們的回應率更高,我投放成本更低”。這樣把使用標籤場景,數據上差異表述清楚的,才是好的目標。
有了目標以後,可以從0開始做建設。在建設初期,經常只有零散的基礎特徵。此時可以直接用基礎特特徵;或者做探索性分析,看符合目標的使用者有啥特點;或者乾脆拍腦袋,列幾條規則。總之,整出來一個初始標籤規則即可,之後就可以逐步做反覆運算了。只要我們發現:標籤的區分效果越來越明顯了,那就行