1. 程式人生 > >資料驅動到底是什麼?如何驅動,又能驅動什麼?

資料驅動到底是什麼?如何驅動,又能驅動什麼?

人人都在談資料驅動,如資料化管理、資料驅動的運營、或者資料驅動的測試等,關於資料驅動的應用的討論很多,但關於資料驅動基本原理的討論較少,本文試圖追根溯源,談一談資料驅動的基本原理:資料如何驅動?能夠驅動什麼?

談原理之前,先說一個我個人的經歷。

有一次我老婆從首都機場T3航站樓回家,我幫她叫了一個滴滴,後來我看到賬單顯示是80多元,路程是20多公里,而我家離機場不過7-8公里,一般滴滴專車的費用是40多元,顯然司機是繞路了,滴滴的APP上同時也顯示了一條資訊,大致意思是:車費異常,是否需要申訴?

我點選了“需要申訴”,滴滴APP立刻彈出一個介面,大意是:您有很好的信譽記錄,接受您的申訴,此次收費按42元計算(具體數字忘了,反正是按正常的計費水平)。

當時覺得,哇,滴滴這個功能太牛了,給客戶的體驗太好了!

試想一下,在滴滴之前打出租車,類似狀況是完全不同的場景:

1,  你可能根本不知道司機繞路了

2,  你事後發現司機繞路了,但你下車時忘了要票據,無法舉證

3,  你當時就發現司機繞路了,跟司機要了票據,但票據上只有里程和時間,而沒有出發地點、目的地和行車路線,你無法證明司機繞了路

而滴滴則徹底改變了這一狀況:主動提醒你是否需要投訴,你提出申訴後,立刻就做出令你滿意的處理!

滴滴的投訴處理如此貼心而智慧,它是怎麼做到的呢?如果我們對資料,以及資料與資訊、知識和人工智慧的關係有一些基本的瞭解,就能理解滴滴這種投訴處理的運作機制。

資料金字塔可以幫助我們理解資料資訊知識人工智慧的關係。

wKioL1mmGwiDMyZPAABtvzSoKaU189.png

資料本身是沒有意義的如果它不能轉化為資訊和知識的話;但如果沒有資料,或者資料匱乏,資訊和知識的產生也就成了無水之源。

  • 如果你經歷了某件事,把它記錄下來。

  • 如果你記錄了某件事,把它上傳。

  • 如果你上傳了某件事,分享它。

這意味著每個人都成為資料的採集、處理和分享者。

在上述滴滴的例子裡,滴滴顯然做到了這一點:乘客的所有用車經歷都由系統做了記錄、上傳和分享。

企業在資料層面存在的兩個問題

1. 資料存在缺失:

比如我所服務的一家網際網路公司,他們就沒有關於客戶推薦的資料(有多少客戶向他人推薦了產品),這是一個很小的例子,但資料缺失是企業普遍存在的現象,原因在於目前企業所擁有的資料主要來自於各業務系統, 如 CRM 和 ERP 等,而業務系統是為完成特定業務而設計的,資料只是副產品而已,必然導致決策所需的一些資料是缺失的;

2. 資料採集的無效性:

傳統企業很重視資料的採集,例如他們會要求門店的員工將接待客戶的相關資訊記錄下來,但所記錄的資料質量不高,用途極有限,這裡面原因有二:

一是採用紙筆或者Excel來記錄,過程比較麻煩

二是他們只是單純的資料採集、處理和分享,但資料的應用卻基本和他們無關,員工採集資料只是應付了事,缺乏內在的動力。

網際網路公司也同樣存在資料採集無效的情況,如一家網際網路公司通過QQ和潛在客戶溝通,他們所瞭解到的客戶需求資訊記錄都在QQ裡,如果要想過一段時間再跟進某個客戶,往往很難找到這個客戶的相關資訊,QQ裡記錄的這些資料實際上無法為業務所用。

要解決企業在資料層的這兩個問題,需要企業基於經營決策需要,對資料進行統一的規劃:需要哪些資料?如何採集?以什麼方式記錄?

比如上面所說的網際網路公司,如果一開始就有關於潛在客戶開發需要哪些資料支援的規劃,就有可能設計出一個結構化的需求溝通工具,既可以有效記錄客戶的需求資訊,又利於後期的資料分析。

如果沒有對資料的統一規劃,企業的資料將很可能會處於“ROT垃圾狀態”,即冗餘(Redundant)、過時無用 (Obsolete)和瑣碎(Trivial)。

資訊:是被組織起來的資料,是為了特定目的對資料進行處理和建立內在關聯,從而讓資料具有意義,它可以回答誰(who)、什麼(what)、哪裡(where)、什麼時候(when)的問題,對於企業經營而言,資訊的作用在於過程管理和績效評估。

在上述例子裡,滴滴的系統將時間、出發地、目的地、行駛路線、會員等資料整合起來,就形成了一條完整的乘客乘車資訊,從而實現了對司機服務過程的監控和管理。

將資料轉化為資訊的階段,企業存在兩個問題: 

1. 缺乏有效的資料分析工具:

少數大型企業(如銀行和電信公司)一般擁有BI系統可以實現將不同源的資料進行整合、並支援線上分析處理和報表,但很多企業還是依靠Excel進行分析和報表,比如一家擁有上百家門店的中型珠寶公司,老闆很重視資料,強呼叫資料說話,每次開經營分析會,大區經理就要熬夜用Excel來做各種分析報表,效率很低,也很讓區域經理窩火:我是帶兵打仗的,卻需要我做這麼多案頭工作!

2. 缺乏將資料轉化為資訊的分析能力:

有一定規模的企業現在都擁有大量的資料,例如我們從一家網際網路公司各業務系統匯出來的資料,就達數千萬行之多,如何從這些資料裡看到資料之間的聯絡,將他們組織成有意義的資訊,無疑是一個挑戰,一般的企業不具備既瞭解業務又會資料分析的人才。

這導致企業所擁有的資料裡,只有很少一部分得到了有效處理,變成了有價值的資訊,而大部分資料停留在其原始狀態:只是一個無意義的客觀存在。

知識:對資訊的總結和提煉。是基於資訊之間的聯絡,總結出來的規律和方法論,主要用於回答為什麼(why)和怎麼做(how)的問題,在企業裡的應用包括問題診斷、預測和最佳做法。

舉個例子,北京夏季高溫多雨,8月份溫度在20-36度之間,平均降水天數12天,這是根據多年資料總結出來的北京氣候的規律,這個知識有三個作用:

1,  問題診斷(回答為什麼),如這個知識解釋了北京今年8月份為什麼下了那麼多雨

2,  預測:明年8月份北京很可能溫度還在20-36度之間,平均降水天數12天

3,  最佳做法:8月份來北京旅遊穿短袖衣服即可,體弱者要帶長袖,最好帶傘。

滴滴的系統裡應該有一個關於如何處理司機繞路問題的知識庫,否則就不會這麼智慧化地完成投訴處理了。

大多數企業在知識層面做得較差,一些企業雖然建立了知識管理系統,但並沒有一個有效的知識生成、應用和更新機制;更多的企業沒有知識管理的體系,這些企業存在大量隱性知識,比如企業裡總有一些銷售高手,他們憑直覺或經驗能夠取得突出的銷售業績,他們也許說不清楚,但他們知道怎麼篩選潛在客戶、知道何時跟進、知道何時應該促成,這就是所謂“隱性知識”,隱性知識顯得如此神祕,導致很多管理者認為銷售高手是天生的,是無法複製的。

有效的資料驅動機制將能實現企業裡隱性知識顯性化,顯性知識結構化,從而讓企業裡的每個人可以隨時隨地獲取相關知識進行業務操作。

以銷售為例,克隆一個銷售高手或許不可能,但從資料的角度來看,如果銷售人員的銷售行為資料都能夠得以完整記錄,並得到有效整理和總結,就可以提煉出銷售的最佳做法,從而讓每個銷售人員都可以在銷售中運用這些做法。(對這個議題感興趣的可以看看Jenny Dearborn所著《銷售的革命》,它以講故事的方式闡述了資料如何幫助銷售管理者進行問題診斷、預測以及銷售最佳做法總結)

人工智慧:機器對資訊和知識的自主應用

人工智慧是系統基於資料、資訊和知識,形成類似於人腦的思維能力(包括學習、推理、決策等)。

在資訊和知識層面,資料都是提供決策支援作用,而到了人工智慧階段,則是系統模仿人類應用資訊和知識進行自主決策了。

我所經歷的滴滴司機繞路的例子,就是滴滴的系統根據我的乘車資訊,以及滴滴系統裡的知識庫,由系統而非滴滴員工完成了一個投訴處理過程。

實際上,這樣的應用早已很普遍,亞馬遜著名的推薦機制也是類似的,系統代替了員工,不厭其煩地向顧客推薦他可能感興趣的商品。

不少人認為,資料金字塔的頂端是智慧而非人工智慧,對此我有不同看法:智慧不是建立在知識基礎上的,知識不是智慧的必要條件,很多高僧很有智慧,但並沒有很多的知識,比如六祖慧能從小不識字,卻能聞經解義。

原因在於,知識來源於經驗(資料),來源於人類對這個三維世界的觀察,而智慧可以無需通過經驗,有可能通過與高維度建立連線而獲得(北大的劉豐教授有一個演講,名字叫《開啟你的高維智慧》,大家可以參考)

而人工智慧則一定要建立在資料基礎之上,沒有資料,無論是專家演算法還是深度學習都無用武之地,有了資料,計算機才有可能通過專家演算法或深度學習形成知識,進而具備類似人類頭腦的思維能力。

從這個意義上來說,人工智慧永遠無法超越人類的智慧。由此我們也可以看到資料的侷限性:它可以將人類的理性發揮到極致,但它只會模仿卻無法創造,它無法替代人類的感性和直覺,而正是這份感性和直覺,讓生命多了一些有趣和柔軟,真正的創造也由此發生!