1. 程式人生 > >(轉載)大資料與企業的資料化運營

(轉載)大資料與企業的資料化運營

http://www.csdn.net/article/2014-01-22/2818218-big-data-enterprise

有一種說法,未來所有的行業都會被網際網路改造,這種說法可能會有點絕對,但確實說明了一個趨勢。前幾天參加BDTC2013,看到了越來越多的原來在傳統IT企業的同學和朋友紛紛加入移動網際網路、大資料、雲端計算的陣營,越來越多的傳統企業在眾多IT巨頭的忽悠之下開始投身大資料的浪潮。雖然很多老闆對大資料的瞭解僅僅停留在Google搜尋引擎或者Amazon的推薦系統這樣的產品層面,但是大資料的浪潮顯然已經不可阻擋。大資料在改造傳統企業中能發揮多大的力量,怎麼樣才能發揮更大的力量,我談談我的觀點吧。

PS:我是一個數據挖掘工程師,我不是PM,我是一個無證Data Scientist,我熱愛大資料,希望大資料能夠給企業帶來價值,我為自己代鹽。

其實移動網際網路、大資料已經不單單是一個IT的概念了,它更多的是一個改變人類生活方式的產業,而且誕生了一個新的名詞O2O。O2O被譽為未來一個萬億市場規模的行業。O2O企業本質是傳統行業的網際網路化或者說用網際網路的方法改造傳統行業,那麼本質上解決的問題和傳統行業沒有區別,還是人們日常生活息息相關的衣食住行等問題。例如通過電商買衣服和生活用品,通過微信解決朋友之間通訊的需求,團購買餐飲,嘀嘀打車,網上買機票和火車票,支付寶交水電煤氣費,餘額寶理財,甚至一度被叫停的醫院掛號等。要做的事還是一樣的,只是做事的方法不一樣,目的是讓使用者的生活更加便利。那麼什麼樣的玩法更受使用者歡迎呢?過去傳統企業或者靠領域知識的傳承,或者是靠使用者問卷調查的形式反饋的,顯然週期長、反應慢、服務內容和服務方式跟不上時代的發展和使用者的需求。而經過網際網路化之後,所有的使用者行為都被記錄和儲存下來,我們可以快速精準的分析和挖掘出使用者的需求變化和每一個使用者的個性化需求,從而給每一個使用者制定不同的服務策略。

我們都知道,領域知識是一個人在某個行業安身立命的本錢。過去傳統行業的領域知識是靠在行業內不斷摸爬滾打積累出來的,而網際網路化之後的這些行業的領域知識將是從海量的使用者行為資料中分析和挖掘出來的。過去的傳統企業一旦確立了領導地位,那麼被同行業的其他企業顛覆的可能性是比較小的;而網際網路化之後的這些行業中,從海量使用者的行為中挖掘出的領域知識的時效性是非常明顯的,一旦一個企業不能夠與時俱進將很快被別人超過去。舉個例子來說,著名的“啤酒和尿布”的故事在最開始的時候會給相應的企業創造價值,但是當同行業內其他企業也學會了這招之後,這個就不是一個利潤增長點了。那麼企業就需要不斷的挖掘新的利潤增長點,這個時候海量使用者資料的價值就會體現出來。未來全面網際網路化的時代中“三天不學習,趕不上劉少奇”這句話就會有深刻的體會。所以像Coursera這樣的線上教育平臺會非常有前途,因為僅僅靠十幾年的學校學習已經不能滿足一個人一生的知識和能力的需求,未來是個終身學習的時代。很多大佬們也看到線上教育這塊大蛋糕了,都開始跑馬圈地。

那麼對於一個企業來說如何讓大資料發揮出價值,推動企業業績的增長呢?我想首先需要考慮的一個重要問題就是:你的企業是一個平臺還是一個垂直行業?

平臺就好像淘寶、京東、騰訊,上面的商品或者服務的種類非常非常多,而且不同商品或者服務的特點可能差別很大,同時對使用者資料的積累是多方面的;垂直行業就是類似攜程、聚美優品,上面的商品或者服務是某一個垂直領域的,只有當用戶在這樣的垂直領域有所需求或者感興趣的時候才會光顧,那麼一般情況下你只能得到使用者在這個領域的一些資料;不過這裡面有個灰色地帶,就是網際網路金融。因為從本質上講這是個垂直行業(金融行業),但是想到金融行業在人們日常生活中的重要性,我們單單從一個垂直行業的角度來衡量這個使用者的價值顯然是不夠的,因為金融影響到人們的方方面面。

對於大資料從業者來說這三種類型的企業在利用大資料的過程中是有很大的不同的。舉個簡單的例子,在對使用者進行細分或者使用者畫像的過程中,如果一個使用者有好幾個月沒有買東西,那麼怎麼界定這個使用者是否流失了呢?仔細想想,如果一個使用者好幾個月沒有在淘寶、京東上買東西,那麼顯然是流失了;但是如果沒有在攜程上買東西,未必能認為他流失了。因為使用者對旅遊類產品的平均購買週期可能就有好幾個月,所以顯然單單是這樣一個因為未必可以把這個使用者標定為流失。

對於不同的企業在利用大資料的方法上也是不一樣的:

像阿里巴巴的目的就是做基礎設施,像自來水公司、煤氣公司、電力公司這樣人們生活中必不可少的一部分,也就是所謂的“剛需中的剛需”,所以阿里巴巴整合了多個部門的廣告團隊成立了阿里媽媽。京東在這方面也不甘示弱,一直養活著獨立DSP服務商MediaV,而且兩家企業不斷傳出收購緋聞。騰訊的廣點通也是這方面的典型代表。阿里巴巴、京東、騰訊的共同特點就是解決了使用者的剛需,成為了使用者每天生活中必不可少的一部分,然後培養起一系列的產業鏈。

阿里和京東解決了使用者購買商品的需求,騰訊解決了使用者通訊和社交的需求,而且提供的服務都是免費的,這樣使用者把自己的一些資料不知不覺中就送給了這些平臺級企業,這些企業就可以利用這些大資料分析出使用者的年齡、性別、興趣偏好、收入水平、家庭構成等跟消費密切相關的特徵,從而成為一個廣告上的目標客戶群體,把這些使用者買個廣告商。這是這些平臺級企業賺錢的主要方式,說白了就是拉皮條的。而且隨著網際網路金融的興起,一旦這些平臺廠商瞭解了和你相關的資料越來越多,那麼就可以給你推銷一些金融產品(典型的例子就是餘額寶),從而控制你的個人金融體系,這些平臺可以像銀行一樣吸納你的存款用於投資。

這才是第一步,在金融機構最重要的風險防範體系中,由於這些平臺廠商知道你交水電費很及時,剛剛買了一輛車,最近又沒怎麼生病掛號,而且還定期出國旅遊。那麼顯然你是一個優質客戶,不需要你提供任何證明來抵押貸款給你的風險。這個就是網際網路金融/大資料金融的玩法。那麼對於垂直類企業(包括網際網路金融)該怎麼使用大資料呢?

垂直類企業特別是傳統企業的最大特點就是在自己的CRM系統裡面有使用者大量的高質量資料,這個是像上面的平臺級企業所不具備的。典型的例子就是像電信、金融這樣的企業擁有質量非常高的使用者金融資料、交易資料、關係鏈資料等,這些資料所表達出的意思是最真實可靠的。但是這些垂直類企業所積累的資料量往往沒有像前面所說的平臺級企業那麼多。這個時候可以考慮通過引入第三方資料的方式來補充使用者的資料,美國twitter公司的IPO檔案中顯示其15%的收入來源是“倒賣”使用者的資料,在國內阿里巴巴與新浪微博戰略合作之後也打通了微博和淘寶的使用者資料,雖然很多微博使用者在吐槽這件事。資料交換首先要保證使用者資料的安全性,讓資料流動起來資料才能發揮更大的價值。

對於面向使用者的企業來說,如何利用大資料現在的玩法應該是比較清楚了。簡單來說就是以使用者和業務為核心,對使用者的相關維度進行資料探勘,構建使用者和業務的屬性和特徵庫,服務業務需求。具體再實施過程中還需要重點考慮以下問題:

1.以使用者和業務為核心,以思路為重點,以資料探勘技術為輔助

企業使用大資料的目的是解決問題(說白了就是賺錢),賺錢的方法就是跟自己的business model密切相關的,也就是我們通常說的業務。在這個過程中大資料技術只是一個手段,是幫助我們解決業務問題的。所以說在大資料技術選型和架構的時候,一定要搞清楚自己的業務模式,不能別人用什麼架構就跟著用,別人挖掘什麼就跟風挖。

2.小步快跑,快速迭代,持續優化

千萬別想著一次就搞出個大新聞,在網際網路領域永遠是beta版的,只要這次比上次好就行了。大資料的思想就是把現實世界中的現象用數學的形式表示出來,分析和挖掘這些現象之間的關係,並且能夠定位到哪些群體具備哪些特徵,哪些特徵會影響企業的盈利。所以很多問題並沒有或者需要嚴謹的數學證明,我們重點關注的是關聯關係而不是因果關係。

在大資料時代,ABtest是非常重要的,很多現象是不需要理論證明的,ABtest會告訴我們該怎麼改進產品,哪些產品的哪些特徵更受使用者歡迎。

3.使用者的反饋很重要,要積極調動使用者的參與度

傳統的調動使用者參與度的方式就是發優惠券或者促銷券。這種方法在有些情況下是有效的,有些情況下可能需要更深入的瞭解使用者的需求,例如使用者為什麼來我們這個平臺?為什麼流失了?舉個例子來說吧,對於有些使用者來說你給他發了10塊錢優惠券,但是他沒有買的需求或者找不到他想買的東西,那麼他不會因為這10塊錢的優惠券去製造一個需求。或者有些使用者可能比較有錢,每次買東西都是大手筆,你給他10塊錢優惠券可能他根本看不上。使用者細分模型可以幫助我們針對不同的使用者群體採用不同的調動使用者參與的方式。

大資料是幫助我們補充行業知識的一種重要的方式。現在越來越多的行業是資料驅動的,那麼這個行業的很多行業知識都是通過大資料探勘出來的。而獲取這些資料的主要方式就是使用者的行為和對運營動作反饋的挖掘,這也是未來以資料為核心的企業的價值所在。

4.從運營驅動到資料驅動

關於誰來主導大資料服務使用者這個需求,其實有很多的使用場景。例如一個推薦系統由產品經理來主導比較合適;對於一個數據化運營系統,那麼從事運營或者市場相關的人員來主導會是比較合適的。對於很多大公司來說,慢慢會發展出專門從事資料驅動業務的部門和人員,例如我們經常提到的Data Scientist的概念。

5.業務人員和資料探勘人員的密切配合

這個也是我們大部分公司經常遇到的一個問題:做業務的不太懂技術或者資料,做資料探勘的對業務又不是特別瞭解,目前社會上最缺的就是既懂業務又懂技術的。如何把資料探勘的結果應用到業務中是個比較難的問題,我們常說沒有資料是無價值的,只是要找到它發揮價值的地方。因為資料探勘的結果往往表現出的是使用者在某一方面的屬性或者特徵,那麼在實際業務中使用者的行為往往受到多個因素的影響,所以在把資料探勘的結果推廣到具體的業務過程中要和業務方密切合作,找到合適的促銷方式、展位、文案、刺激手段、效果評估方法等。

大資料的範疇內我們應該把使用者還原成一個人,而不要割裂的看他的某些行為,而要把這些行為和他的社會學屬性、生活背景、活動時間、地點、氣候因素和應用上下文聯絡起來。目前的大資料Ecosystem沒有一個很好的BI工具,給對應的分析師或者挖掘工程師帶來了很大的難度。

6.與客戶的溝通方式(運營手段)很重要

現在社會大家都很忙碌,像過去那種通過call center給使用者打電話推銷的方式的效果越來越差,因為使用者很忙碌的時候是不希望被打擾的。那麼非同步通訊的需求就比較強烈,典型的應用就是微信,可以很好的利用碎片時間,那麼對於企業營銷來說也是非常好的通道。同樣對於企業給使用者的各種促銷或者運營手段的時機也會比較重要,而且不同興趣偏好的使用者的瀏覽和購買時間最好也要區別對待。

同時運營活動設計的巧妙程度、文案和展位比大資料技術可能會發揮更重要的作用。聽過一個真實的例子,某公司的推薦系統在模型完全沒有改變的情況下只是改了下展位的位置,導致最後的下單率有明顯的提升。

7.大資料帶來的價值如何衡量

企業養了一個大資料團隊,那麼對這樣的團隊怎麼衡量他們帶來的價值呢?例如天貓雙十一的交易額有350億,那麼這350億中有多少是通過大資料來提升的?

我覺得大資料的短期回報是精準營銷,而從長期的角度來看對於一個企業或者平臺來說更重要的是客戶關係維護,增加使用者的粘性和購買力,從而使得使用者很難遷移到其他平臺上,那麼對於你這個企業來說就有點類似於壟斷了,就屬於躺著都賺錢了(就像現在的可口可樂、寶潔類似的公司)。所以說大資料的價值可以在產品的各個層次得到體現,而具體價值的衡量也要因不同的業務模式而有所不同。同時大資料也幫助企業更好的理解這個行業,建立起行業的壁壘,從而更好的支撐管理者的決策。