超越咨詢顧問的算力,在BI:大數據改變管理咨詢

分類:資訊 時間:2016-10-07

消費品企業應該如何使用內部產生以及外部采集的數據,像互聯網公司一樣建立用戶畫像與會員體系,以數據驅動的方式進行精細化的生產、運營和銷售?

傳統的管理咨詢公司,雖然有無數頂尖的大腦,但是他們的大腦只靠 Excel 等簡單工具的輔助,這樣的算力,能不能滿足上述的需求?

在 2015年 上半年, 數據冰山團隊 有幸為國內一家時尚消費品行業的龍頭公司進行數據平臺的建設,歷時半年,完成了內部數據的打通和洞察,用戶畫像,會員體系的搭建,以及外部數據獲取與跟蹤。在這裏和大家分享我們的一些體會,希望更多的消費品企業可以用數據驅動的方式來進行精細化的運作。

其實作為龍頭消費品企業,其數據生產能力與中等規模的互聯網公司不相上下,支撐日常業務的 IT 系統大大小小共有十余個,比如:

1)分銷系統:支撐全國上千家線下門店每日的銷售配貨,每日訂單量在數十萬量級;

2)電商訂單系統:負責處理十余個主流電商(京東,天貓,唯品會,一號店,聚美,亞馬遜,當當網,有贊等)的訂單管理與客服;

3)倉庫管理系統:負責全國各大區域的倉儲物流,數千個 SKU 的備貨情況;

4)BI 系統:負責各主要業務系統的數據聚合,制成日常統計報表;外加大大小小的財務系統,人力系統,績效系統,品牌 / 分公司訂貨系統等,每日產生的數據維度以及量級其實已經相當龐大。

但和互聯網公司相比,消費品企業的數據消費,數據分析能力存在明顯的短板。越來越多的管理層也十分希望像互聯網公司一樣管理用戶和數據,使用數據驅動他們的決策。

面對這樣龐雜而分散的數據以及對快速實時產生數據的渴求,不僅傳統企業的 IT 及經營分析部門束手無策,再高端的管理咨詢公司也只能撓撓頭說 “臣妾做不到呀”,實在是超越了這群聰明人大腦的算力。

接下來會從三個角度分享如何為傳統行業搭建數據平臺,首先介紹大數據(數據科學)與商業智能(BI)在消費品領域的應用,然後詳細講解用戶畫像與用戶體系搭建,最後分享如何利用外部數據(電商,社交媒體)對行業趨勢與其他企業的運營進行監控。

在這裏面所用到的數據相關的技術,已經大大超越管理咨詢顧問的算力。如同封面圖中的《魔戒》水晶球 Palantiri,它如同數據技術賦予了人類及精靈看到任何地方的能力。而傳統的人類,無論如何提高人肉的眼力,也只能到目力所及的有限範圍。

1大數據和商業智能(BI)

我們很少說自己是一家大數據公司,因為大數據這三個字的意義更多是指一種概念和思維方式,並沒有什麽具體的含義,既不是一種工作也不是一種技術,可能勉強算得上是一些門檻稍高的,和數據科學有關的算法,技術以及工具的統一稱謂,比如數據挖掘 (聚類,關聯),機器學習 (邏輯回歸,神經網絡),比如自然語言處理,比如分布式運算 (Hadoop, Spark)。但在服務具體企業的時候,我們難免會被套上大數據的殼子,畢竟大家都在找能做 “大數據” 的公司。

相比大數據,Business Inteligence (BI) 的歷史就要久遠許多,在各大軟件廠商的不斷教育下,大中型公司幾乎都采購了 BI 軟件。其實 BI 也是一個比較寬泛的概念,和大數據一樣包含了許許多多的技術和工具,像是數據倉庫,OLAP cubes,Data Mart,Star schema,數據挖掘等等。那麽他們究竟是不是同一個東西呢?

1.1商業智能(BI)

其實軟件廠商所提供的 BI 軟件與廣義的 BI 概念還是有很大程度的區別。

為了追求高度的抽象化與通用性,BI 軟件大部分時間所承擔的責任是一家公司的各類報表應用:將各個 IT 系統的數據聚合至 BI,然後進行統計匯總,並統一在前端通過 BI portal 呈現出圖表與數值,便於業務人員了解日常數據和運營情況。

所以除了 ETL 部分以外,BI 軟件絕大多數的功能都是通用性極強的,跨行業,非定制化。ETL,是英文 Extract-Transform-Load 的縮寫,用來描述將數據從來源端經過抽取(extract)、轉換(transform)、加載(load)至目的端的過程。其實傳統的消費品企業面對零散的數據庫,特別需要 ETL 的服務。

ETL 看似低端,其實當今的大數據頂尖企業 Palantir,在最初為 CIA 服務的時候,也是從 ETL 開始的,讓美帝特工不用在分散的多個數據庫上分別做一次查詢。 Palantir 的故事點擊這裏。

這也就決定了 BI 軟件的 sweet spot 在於監控和繪制通用性的統計報表,比如時間序列統計,分布統計,分段統計等等。

圖 1 展示了這家消費品企業兩年間平均價格變動與總銷量的時間序列,可以看出銷量兩年來穩步增長,有小周期性(一二月份賣得少,換季的月份賣得多),而賣出商品的價格兩年保持基本一致,並呈明顯周期性變化(對於時尚消費品,冬款的造價自然要高出夏款許多)。

圖 2 展示了集團旗下各品牌的銷量分布和占比,可見此集團有一個相當強悍的主品牌,以及 2-3 個在垂直領域表現不菲的子品牌,定期輸出銷量分布,可以監控各品牌的發展情況並衡量品牌策略是否成功。

BI 軟件的強項是將這些業務數據匯總起來,無需編程即可繪制出可供長期監控的可視化報表,同時實現隨時更新,而不是傳統管理咨詢的一份靜態報告。傳統咨詢提供的報告,往往在出爐的第一天就過時了。

1.2數據科學

反觀數據科學,如果站在一個數據工程師的立場上,BI 軟件做的事情其實也屬於數據分析的範疇,任何數據洞察,數據挖掘工作都需要涉及到這些通用維度的基本統計。但在這種淺層分析的基礎之上,數據科學家可以通過帶入較強的人為幹預和行業性輸入,做到許多高於 BI 的數據洞察。而將這些洞察落地,運用至具體產品設計,營銷方案,會員體系和售後服務中,便可以像互聯網公司一樣,實現以數據驅動業務。

舉一個實際的例子,圖 3 是用戶重復購買間隔的 CDF 曲線 (Cumulative distribution function)。橫坐標代表天數,縱坐標代表百分比。數據顯示,有 37%的用戶在第一次購買後的一個月(30 天) 內會進行第二次購買,而 45%的用戶在第二次購買後的一個月內進行了第三次購買,51%的用戶在第三次購買後的一個月內進行了第四次購買。隨著購買次數的增加,CDF 曲線向左傾斜,也就意味著用戶在建立了品牌認知後,購買頻率顯著增高,兩次購買之間的間隔明顯縮短。

因此,誘發新用戶建立品牌意識,進行二次購買的窗口為 3-4 個月的換季檔,而對老客戶的消費喚醒窗口期則更短,以 1-2 個月為最優。這是一個很典型的數據工程師利用自己的行業知識和經驗來實現數據洞察的例子,也是 BI 軟件無法做到的。首先研究復購間隔是消費品行業獨有的場景,更重要的是想要完成這個洞察,其中所涉及的統計工作具有很強的定制性,也較為復雜,需要編寫統計腳本或是使用多條復合 SQL 來實現,數據工程師的價值也在此有了體現。

除了復雜和高定制性的統計邏輯外,對於非結構化數據的處理和挖掘也並非 BI 軟件的強項。對於大型消費品公司來說,全電商渠道的運營已經成了常態,每日來自京東,天貓,唯品會,一號店,聚美這些大型電商平臺的訂單數高達數萬個。而這些訂單中的郵寄地址裏包含了巨大的信息量,比如用戶所在的城市,地理位置,甚至是身份,職業,消費能力等等。通過程序和地圖 API 將這些郵寄地址轉化為經緯度後,可以對用戶群做大量的精細研究。

圖 4 便是我們利用送貨地址做的用戶群分布的熱力圖,以北京的海澱區為例,大量的用戶密集集中在中關村周邊,其次便是各大高校宿舍聚集的區域,如五道口,知春路等地。紅色標簽為品牌線下店鋪位置,可見門店已經覆蓋了中關村,北京大學和五道口等地,但對於知春路片區,以及用戶相對集中的牡丹園並未開設分店。相比之下安貞裏分店四周並沒有特別多的目標用戶群出沒。於是有了圖 4 的用戶分布及店鋪選址。

熱力圖這樣的算力往往超過了管理咨詢公司的能力範圍,然而對於用戶的選址卻是很有價值。

對於一些並無日常監控必要的統計,有時也會貢獻許多有價值的洞察。

圖 5 展示了線上用戶購買時間的分布情況。可以看得出,周末線上購物的時間十分均勻,除了半夜之外大部分時間段都有網購發生。相比之下工作日的線上購物時間分布就變得十分有趣,大量的訂單集中產生在早上九點和十點之間,也就是說大量的時尚白領在上班途中,或是步入辦公室後的第一件事便是敗一件自己心儀的寶貝,然後才能心情舒暢地開始一天的工作。

那麽不管是自營電商促銷,短信推廣,還是各宣傳陣地的推送,工作日早上 8 點至 10 點都是一個不錯的窗口。 和圖 5 類似,圖 6 將線上用戶的購買數據按照一周七天進行分布統計,也會出現一些有意思的現象,比如周六周日上網買東西的用戶極少,每周網購的高峰出現在周一和周二。或許上班族們都是通過線上血拼來撫慰自己,治愈周一綜合征的。而越臨近周末,大家在線買東西的熱情也就越低。

像圖 5,圖 6 這樣的數據洞察往往也是 BI 軟件無法捕捉到的。數據工程師們可以將這些沒有長期監控的意義的指標轉化成擁有商業價值的洞察。同時這又是傳統的管理咨詢公司無法做到的,因為他們缺乏能力整合如此海量的數據並按天甚至按小時進行實時輸出。

個人認為,數據科學 (大數據) 和廣義的商業智能原本沒有本質區別,兩者都涵蓋了非常廣泛的內容,並且兩者的核心都是通過數據處理和分析的方式,提升業務表現。

但我們平時所談論的 “BI” 很多時候其實指是軟件廠商所提供的 BI 軟件 / 套件,用於實現業務報表和統計監控的功能。暫且不提廠商們是否有故意偷換概念的嫌疑,BI 軟件和數據科學還是有著比較大的差異。可以說 BI 軟件通過高度抽象的方法,提供了一種非常便利的數據匯總,統計,可視化的工具,從而完成了數據科學的一部分工作,而許多深層次的,帶有行業性的,高於 BI 軟件的分析與洞察,仍然需要數據工程師的參與,以及特定數據系統的支撐來共同完成。

總結

與傳統的管理咨詢公司相比,在 BI 層面,大數據的相關技術勝在算力:數據整合能力、實時處理能力以及呈現能力。

這一期只是小小的開胃菜,而在後續的章節(關於建立用戶畫像和利用外部數據理解行業及趨勢),大數據的相關技術將進一步將算力的差距拉得更大,讓傳統的腦力無法追趕。

文章來源於知乎專欄: 數據冰山 ,同時歡迎關註我們的微信公眾號:數據冰山

原創文章,作者:數據冰山,如若轉載,請註明出處:http://36kr.com/p/5043565.html

“看完這篇還不夠?如果你也在創業,並且希望自己的項目被報道,請戳這裏告訴我們!”


Tags: 亞馬遜 管理咨詢 倉儲物流 分銷系統 倉庫管理

文章來源:


ads
ads

相關文章
ads

相關文章

ad