1. 程式人生 > >數據分析會犯的錯誤,新人十有九中

數據分析會犯的錯誤,新人十有九中

還得 做了 開頭 -s 個數 而且 center 我們 系統

作者:接地氣的陳老師

-----------------------------------------------------------------

講一個很嚴重,很明顯,但是很容易被新人們忽視的錯誤:把要求當需求。最最最典型的,某過於老板丟了句“做個用戶畫像看一下”於是數據專員吭哧吭哧跑數據,做詞雲,畫圖標,碼PPT。忙得不亦樂乎。最後辛辛苦苦交了用戶畫像的報告。老板一句話劈頭蓋臉丟過來

“我早知道了”

“你做了有什麽用”

“這不是我想要的”

那感覺,簡直就是一盆冷水潑下來,一口老血湧上頭。好想拿出錄了“做個用戶畫像看一下”的錄音筆查到丫耳朵裏。這還是好的呢。如果碰到一個不怎麽懂的話題,比如“做個聚類分析”“做個因子分析”,可能跑數的小哥還得到處找資料,查書,上各種《數據分析愛好者》QQ群問:“有沒有大神教一下怎麽做啊??”結果回來還是碰壁,就真的氣不打一處來了。

問題出在哪裏?問題出在從一開始,這就不是需求,而是一個要求。並且它是出自非專業人士的要求。舉個類似的例子,就好比病人去醫院看病,對醫生說:“來個感冒藥”然後回頭說醫生“你這藥不靈啊!你這醫生會不會看病啊!”你說這醫生當的冤不冤。

冤,也不冤。冤,是冤在明明是病人自己要求的,我按你說的辦,為啥讓我背黑鍋。不冤,是因為大家默認了醫生就是專業人士,doctor的另一重含義就是博士,為什麽一個專業博士要聽不懂醫的人安排呢?所以作為專業人士,就得提專業意見。而不是聽風就是雨。就算病人指名道姓的要感冒藥,你也得問他到底是什麽病,對癥下藥才是正道。

具體到數據分析上,類似“用戶畫像”“聚類分析”“回歸算法”只是具體的分析工具,而不是要分析的問題。領導要求看用戶畫像,可能是因為之前不了解我們的用戶群體特征,想要看個概況;也可能是因為對某一類用戶有了思考,想看深入分析。這裏要我們進一步去挖掘需求,而不是停在表面。具體來說,可以按思路如下圖所示:

技術分享圖片 先確認做這個的目的是什麽,是不是想了解用戶?是不是了解用戶有具體問題?摸清底細再動手

這樣一層層開展,不但能弄清楚問題到底是什麽,而且可以順便了解下領導期望值。哪些是已知的結論,哪些是未知領域搞清楚,就可以避免“我早知道了”的尷尬。把真正的問題找到,就能避免“你做了有什麽用”的窘境。兩者結合,自然是做出“我想要的”結果。

這樣做的另一個好處,是聚焦問題、排除幹擾。對於“用戶畫像”這種可大可小的問題特別合適。因為一提到“用戶畫像”,大家都會想到一堆用戶相關的指標,問題是:我們有沒有這些數據?我們有的數據靠不靠譜?是不是解決問題一定需要這些數據?如果不聚焦問題,做出來的東西沒有用還是小事。為了搞這個沒有用的東西而大費周章,勞民傷財,最後還不落好,就是大事了。當然,業務方可以隨口一說:我們需要用“大數據用戶畫像”解決XX。但做數據的同學們,就得特別小心觀察,到底用哪些數據,具體到一個個字段。

再進一步的討論,可以看業務方解決問題的限制。因為實際上能解決問題的手段非常有限。比如業務方想了解“高端用戶”的畫像。很有可能連這些人開什麽車,吃什麽館子,看什麽報紙,蹲什麽茅坑都想知道。問題是知道這些維度又能怎樣?去廁所門上刷小廣告“槍支麻藥迷昏劑”嗎。這種接近窺探隱私的、超細節的分析,更適合用調查的方式進行。數據分析基於內部系統采集數據,還是更適合做基礎性的常規采集。這時候可能聚焦:高端用戶從什麽渠道進入,有什麽消費習慣,對哪些品類更忠誠,更容易輸出有價值的結果。

技術分享圖片 一提到用戶畫像,大家就像各種稀奇古怪的字段,可聚焦到一個問題,比如促銷費的問題,這些字段遠沒有獲客渠道、產品組合、營銷活動這些字段管用

類似的問題還有很多,比如“做一個判斷模型”“做一個聚類分析”“做一個回歸預測”這些都是具體的要求,而不是需求。遇到這一類問題,一定要打起十二分精神,問清楚:

  • 做一個模型用來解決XXXX問題?(真實痛點)

  • 這個問題有沒有預判或假設?(真實困惑)

  • 解決問題的時間、方法有沒有限制?(可行性)

這樣摸清底,後續就會做出

  • 很想要的(真實的痛點才真實想要)

  • 眼前一亮(解決了真實的疑惑)

  • 非常有用(考慮了執行可行性)

的分析成果。廢話,我們已經到他們知道什麽不知道什麽嗎。很多同學苦思冥想,試圖想出一個業務方見都沒見過的東西,以為這樣才算是分析的高深。殊不知,真要丟出這種結果,十有八九會得到一個:“太離譜了,不符合業務邏輯”的評價。其實好的分析成果不一定復雜,不一定異想天開。答疑解惑,藥到病除,才是最好的狀態。

其他的問題還有很多,限於篇幅,回來慢慢分享,之所以只說了這一個,因為這個是方向問題。是頭等問題。這個問題不解決,只怕後續的問題會越來越多。可恰恰在這裏,新人們往往不敢深入討論,怕被鄙視能力不行,怕被人給臉色。可為什麽老手們不怕呢?一來是被坑多了,知道為了面子拿自己去填坑不值當。二來是表達技巧會更好,一圖以蔽之,看下邊。

技術分享圖片 了解需求和審問需求方是兩個問題,板著臉問:“你為什麽要這個數”肯定被人罵,溝通方式可以靈活機動。當然,如何溝通,是另一個復雜的問題了。

對了,開頭的問題已經很有技術含量了。至少提需求的時候提了“用戶畫像”四個字。更慘的場面,可能是這種:

“那誰誰,我要個數”

這時候就得更加小心了哈。本質都是一樣的,這也是個要求。然而又有很多同學聽到要個數,就急匆匆的跑數去了……o(╯□╰)o

數據分析會犯的錯誤,新人十有九中