在數據分析的世界里,區分新手和高手的往往不是工具的使用技巧,而是對業務深度理解的標籤積累。本文通過一個店鋪分析的實例,揭示了如何通過構建有業務含義的標籤來深化數據分析,從而提供更有價值的業務洞察。
很多同學覺得,相對於高手而言,自己在工作中進步很少,拿著數據,翻來覆去就是同比、環比,做了兩三年也沒進步。在這背後,有個很大問題是:缺少有業務含義的標籤積累,導致只會零散地看數據,既無法推導有業務意義的結論,也積累不了業務分析經驗。
數據分析高手日常非常重視標籤的積累,今天我們就借一個例子,讓大家看出其中的區別。諸位坐好扶穩,我們馬上發車。
某同學提交了一份店鋪分析報告,指出:A門店業績排行靠後,低於其他店,建議搞高。然而沒想到,這麼平平無奇一句話,立馬捅了馬蜂窩了。營業單位同事開始七嘴八舌地爭論:
甲同事:A是新開門店,不應該和其他店這麼比,A其實很好
乙同事:雖然A是新開店,但是A是標準店,不能和mini店比,A其實不好
丙同事:雖然A是標準店,但A是撿漏店,不能和普通標準店比,A其實很好
丁同事:雖然A是撿漏店,但是A行銷力度並不低於普通店,A還是不好
戊同事:雖然A行銷力度很大,但是行銷投入並不重,A還是很好
……
大家吵成一團。
最後總結:“數據分析做得不深入,只有數位沒解讀,要結合業務深入分析”。留下做數據的同學在風中淩亂:
“你們說的都是啥???”
“我要怎麼深入法???”
那麼,要怎麼深入分析呢?
這裡最大的問題,在於業務討論的各種細節,無法直接表示成一個數據指標,導致量化都做不了,更不要提分析了。而量化業務的關鍵在於貼標籤。注意!很多同學一提標籤,本能地想到“性別、年齡、包裝尺寸、包裝顏色”這些資料庫里現成的,直接從基礎信息導入的標籤。這些基礎標籤,大部分時候沒有直接的業務含義,對業務解讀能力很弱,需要二次加工才好用。
有業務含義的標籤,則是直接指向業務關心的問題,對問題指標有區分度,對業務行為有指導能力的標籤。比如“這個店長能力不行”,這就是個有業務含義的標籤,如果確認了能力不行,那下一步就是換店長或者做培訓,對業務行為指導很清晰。這種標籤,需要複雜的轉化過程與數據驗證,不是一蹴而就的。
那麼要怎麼打呢?一步步來看。
既然是打業務標籤,首先就得從整理“影響業務指標的假設”開始。這樣打出來的標籤才是直接指向業務問題的。比如開頭的問題,我們可以根據營業單位七嘴八舌的議論,分別列出:
1、待描述的業務物件
2、衡量業務物件好壞的指標
3、影響指標的假設
4、假設的影響方向
這樣就有了一張清晰的,待開發的標籤清單(如下圖):
下一步可以一一進行開發。
在開發的時候,先做能用基礎標籤+現有數據指標,直接計算出來的標籤。這種標籤也被稱作:規則標籤。即業務給到計算規則后,可以基於基礎標籤+現有指標直接計算。這種標籤獲得速度快,也容易驗證。
比如:是否新開店。理論上只要根據開店日期做分類即可。比如規定6個月及以內的都是新開店。那麼大於等於7個月的就是老店,小於等於6個月的都是新店。
這裡有個關鍵問題:這個“6個月”的標準要怎麼來。這裡有兩種做法:
第一種,如果營業單位有共識的話,我們可以直接用業務的標準,比如大家共識了是6個月,那就是6個月。
第二種,業務沒有具體數值的共識,但是有一個概念,比如:
1、新開店階段,門店閉店概率很高
2、新開店階段,門店營業額/訂單量處於上升期
此時,雖然沒有明確標準,但是業務給出找標準的方法。我們可以統計所有門店的生命周期數據,看閉店概率/營業額/訂單量的拐點在哪裡,從而清晰標準(如下圖)。
原則上,即使業務口頭給出了第一種標準,我也建議大家引導業務做出第二種標準。因為第二種才是有業務邏輯的標準。萬一哪天不同營業單位吵架,或者業務換了領導,不再認可第一種標準,第二種標準就是調整的原則。
類似地,門店面積標籤也可以這麼打。先列出業務假設:
1、門店面積大,對應的成本就高
2、營業面積大,收入也應該高。
之後就可以把現有的幾種店面面積列清單,看參數範圍,做出標籤(如下圖)。
這裡特別要提醒:很多同學做標籤,不和業務溝通,自己憑感覺或者看數據分佈下判斷,比如怎麼區分新店,丫自己拍個3個月……這種閉門造車的結果,很容易被業務挑戰,也無法與業務場景結合,最終使標籤工作淪為自嗨。
有了簡單標籤打底,可以再來處理複雜標籤情況。
常見複雜情況一:一個業務問題,需要分幾個標籤來描述。比如“促銷”這個標籤,促銷形式,力度,可能需要分開描述。比如:
1、促銷範圍:參與促銷的商品SKU數量
2、促銷力度:按原價折算,使用者拿到優惠比例
3、促銷形式:買贈、滿減、送禮、加一件……
(如下圖)
可能一個業務場景,需要好幾個標籤組合才能說清楚。
常見複雜情況二:兩個/多個基礎標籤合併出來的標籤(又稱綜合計算標籤)。比如“撿漏店”,潛臺詞是:這個店面積很大,但店租比正常低,同時客流並沒有比正常少很多,因此被我們撿漏了。這個時候,撿漏店是有三個基礎標籤拼接出來的(如下圖)。
類似的,比如:“這個店長能力不行”,怎麼證明能力不行,可能得從業績、工作數量、個人履歷好幾個維度來論證,考察的維度一多,就涉及如何付權重問題。付權重本身有一套方法論,同學們感興趣的話,我稍後單獨分享。
常見複雜場景三:標籤是預測未來的情況,並非已發生的情況,比如我們預判這個店是“高潛力門店”,因此要求它表現比普通更好。注意!預測本身是個複雜的活,可以基於規則判斷,可以建模,建模也有好幾種方式,因此處理起來略複雜,有興趣的話,也是稍後單獨分享。
總之,經過這麼一堆複雜計算,現在標籤已經打好,可以利用分析了。
標籤的直接應用,就是把複雜的業務問題量化,進而進行分析和檢驗。比如文章開頭那一堆複雜的業務理由,用標籤就可以直接做單維度對比,檢驗說法。
如果有多個標籤疊加,則可以構建複雜的分析邏輯,一層層進行推導。這種複雜的分析邏輯,就是我們常說的“深入分析”,一般習慣性,把考慮了很多種情況,稱為“分析全面”,把推導了多少層,稱為“分析深入”(如下圖)。
當然,標籤不止這一種用法,比如標籤可以作為進一步建模的特徵值,輸入模型做綜合性評估/預測。很多同學的評估模型/預測模型做得不準確,就是因為缺少標籤積累,直接把幾個簡單的原始數據懟進模型。
比如,標籤還可以用來推導業務行動。諸如“店長能力不行”“行銷力度不足”,可以直接導向“我要培訓店長”“我要增加行銷投入”這種結論。
綜上,深入分析、建模、提業務建議,標籤是很重要的一環。同學們可以試著多建有業務含義的標籤,特別是涉及“盲盒”狀態的業務,比如線上廣告投放,線下銷售跟進,商品選品等,標籤的作用更大。
本文由運營派作者【接地氣的陳老師】,微信公眾號:【接地氣的陳老師】,原創/授權 發佈於運營派,未經許可,禁止轉載。
題圖來自 Unsplash,基於 CC0 協定。