1. 程式人生 > >袋鼠雲數據中臺專欄2.0 | 企業數據化認知:數據就是生產力!

袋鼠雲數據中臺專欄2.0 | 企業數據化認知:數據就是生產力!

驅動 模型 以及 多少 是否 消費 讀者 尋找 屏幕

關於袋鼠雲數據中臺專欄V2.0

數據中臺如何定義?企業數據化與數據中臺的關系是什麽?數據中臺如何支撐企業戰略轉型?

袋鼠雲近兩年來,先後為國內數十家大型龍頭企業提供數據中臺咨詢與實施落地服務,積累了大量的實戰經驗,同時也在為客戶服務的過程中,不斷完善和升華自身的數據中臺理論體系和實踐方法論。希望通過後續文章的分享,與諸位讀者交流,共同加快企業全面數據化進程。

本專欄每周更新1-2篇,敬請期待~

正文

一、

數據就是生產力。筆者兩年前在袋鼠雲做的國內某省一個交警項目上,面對著海量的車輛軌跡數據時,第一次感受到什麽是數據的力量。

該項目是一個非常典型的數據中臺項目,主要數據資源有:省內機動車輛數據、駕駛員數據、交通違章數據、公安系統等相關數據。核心數據是通過攝像頭識別到的車輛軌跡數據,包含:×××數據、采集時間和采集地點數據,以及部分公路上獲取到的移動電子設備數據。

袋鼠雲的團隊利用這些數據做了以下應用:

車碼合一算法
利用已掌握的移動設備軌跡數據和車輛軌跡數據,來計算移動設備和車輛的匹配關系(由於這兩種數據由兩套設備分別采集,數據獲取存在一個不確定的時間差,且每個采集點都是多車輛同時通過,所以無法直接判斷哪個移動設備是在哪個具體車上)。

為了解決這個問題,該項目起初的算法采用「概率計算模式」,匹配時間長,匹配準確率低。袋鼠雲選擇采用了另一個邏輯匹配方式,實現了一輛汽車經過兩三個檢測點,就能夠知道該車中的乘客所持移動設備與車輛的匹配關系,而且一旦匹配成功,即為確定關系。

該算法目前已申請專利,詳情還可查看專利
專利名:一種交通監控數據匹配方法、系統及存儲設備

申請人:杭州玳數科技有限公司
申請日:2017-09-22
主分類號:G08G1/01(2006.01)I

通過該算法,最終我們可以清晰地了解到手機與車輛對應的實時詳細信息,最後對手機與車輛的關聯關系進行匯總統計,為案件偵破提供數據支持。

黑車標簽

以前,非常有經驗的交警才可以很明顯地根據車輛軌跡數據,發現疑似黑車的車輛。如何將經驗轉化為通過統計學的方式進行黑車標記,我們團隊成功探索出了以下三種方式:

  • 一種是「專家經驗算法」,預制專家模型,篩選黑車。

  • 另一種是標定所有出租車,然後用出租車軌跡模型來構建「黑車軌跡模型」。

  • 第三種是在第二種方法的基礎上,「利用確認的黑車結果,反向對模型進行再次優化」。幾種算法使用後,我們可以拿出該城市的詳細黑車名單。

運毒車輛模型

我們利用「專家模型」,在海量車輛軌跡中尋找和標定可疑車輛,並對車輛當前軌跡進行實時分析和判斷,將以往在高速上某一時間段內的逢車必查模式,變成了逢車必查和重點車輛預警結合模式,從而使得黑車篩選效率大幅提升。

當我們的團隊,在計算機屏幕和交警監控大屏後輔助公安幹警抓獲一個一個犯罪嫌疑人的時候,筆者感覺自己的團隊正在觸碰一個傳統業務中從未觸碰到的領域。全知和全能是用來描繪造物主的,雖然我們還離這個定位有著遙遠的距離,但已然真實地朝這個方面邁出了堅實的一步。

二、

數據是生產力。

筆者要講的另一個例子是「國內某知名電商平臺」對顧客所做的「標簽體系」。這個也算是一個業內半公開的例子了吧,據說該企業對顧客的標簽在3000個以上,也有一個講法是該平臺比你更了解你的老婆。

曾經有人認為電子商務是一個零和遊戲,只是把傳統渠道中的一部分錢搶奪了過來而已。

其實,電商充分地利用了其所掌握的大量客戶行為數據,精準描繪用戶畫像,然後通過精準的營銷方式極大激發了用戶的購物欲望(買買買),從而創造出更多的消費需求。據筆者不準確估算,該企業每年在數據上所投入的成本應當是以百億計(幾萬個節點的存儲, 15%以上的員工為數據相關人員)。商人是逐利的,可以想象這些投入所帶來的商業產出又有幾何。

數據是每個人最原始的一種欲望。如果數據真的極大豐富了,筆者也許會希望知道天空中某只鳥兒何時發出過一聲鳴叫,遙遠的海邊是否又有一朵濺起的浪花,深邃的宇宙中某個不知名的星球上是不是在發生過一場空前的風暴。然而這些最原始的渴望在種種現實條件的約束之下被深深的隱藏了起來。

當前的時代,隨著信息化和互聯網化進程的完善,人們各種行為的上線讓我們有機會積累大量的數據,這給了我們一次小小的契機,可以利用大數據處理技術將這些源數據變成一種新的生產力,誰能夠優先地掌握和使用好這種力量,就必定會對企業整體能力帶來又一次的提升。

三、

數據是生產力,可以作用於企業的方方面面:

描繪事實

無論是描述“事”,還是描述“物”,用數據說話永遠都顯得更準確一些。即使遠隔千裏之外,只要把主要經營指標顯示出來,那麽一個企業大體上的業務情況就能夠了解到,正所謂運籌帷幄之中,決勝千裏之外。

數據便是對客觀業務關鍵要素的一種提煉和抽象。好比醫生看患者,先不管高矮胖瘦,看病之前,做上一系列檢查,然後得到各項身體體征數據,對病人的整體情況也就有了一個基本的了解。

又好比筆者的團隊,目前有多少個項目,哪些賺錢,哪些不賺錢,每個項目都進展到了什麽程度,投入了多少人,花了多少錢,收了多少錢,還有多長時間做完,有沒有什麽風險等等,都是筆者要花很多時間每周都去梳理的。

然而:

在很多企業中即使是最基本的用數據描繪清楚業務,並在第一時間獲取到這些數據這個需求都往往得不到滿足。

洞悉細節

數據會比人更加精準和敏感,通過數據可以相對容易地發現事物之間的隱秘關系。筆者上面所提到的車碼合一算法就屬於這個範疇。

最簡單的關聯商品分析也可以在實際應用中取得巨大成果。拿筆者在袋鼠雲負責實施的一個項目舉例:在該客戶的線下零售門店中,我們在顧客完成商品購買時,利用管理「商品關聯分析」和「顧客消費偏好分析」的「綜合推薦結果」,在顧客購物小票下方打印一個實時的促銷小票,推薦一款或者幾款關聯商品並給予一定折扣。根據最後的統計,這個動作為平均為每個門店提升了八到十個點的營業額。

數據智能

相對基礎的算法就能夠解決企業中的很多問題,尤其是面對大規模生產和運營場景的時候,往往依靠人的經驗就會變得非常被動。基本的統籌算法還有最優效益的求解分析,會為日常工作很多的指導。線上數據的豐富和機器學習算法一方面讓以往很多場景形成完整的「數據閉環」,另一方面也可以借助眾多的數據進一步優化算法模型。當豐富的數據量和數據計算引擎都具備時,算法工程師會為企業創造很多意想不到的收獲和驚喜。

四、

數據是生產力,但有時候也會是一種桀驁的力,用得不好,不但浪費了企業投入的大量資本,更讓業務上的一系列配合動作無果而終,甚至傷到企業元氣,表現在以下幾個方面:

只重視「數據應用」,不註重「數據獲取」和「數據質量治理」。

不能夠清晰地知道一個數據應用所對應的「數據供應鏈」,從而無法評估獲取最終數據的整體成本、過程與時間周期,很多應用對這個過程估計不足,最後無果而終。

過於關註大數據的故事,而忽視了很多基礎的業務統計工作。

數據化本身比較復雜,而且也非常綜合,不是一種力量就能夠解決的(是企業級戰略,而不是部門級工作)。

數據化缺乏整體架構和規劃,小需求難以驅動基礎平臺建設(要集中力量辦大事,基礎平臺問題要在企業整體層面統一解決)。

所以大部分的企業在這種力量面前,都顯得猶豫不定和裹步不前,很多“理智”的企業則是駐足觀望等待結果,只有少數頭部客戶有勇氣和擔當做一個探索者和先行者,嘗試啟動企業全面數據化的轉型工作。

袋鼠雲從成立之初便伴隨著數十個行業頭部客戶,一起進行企業全面數據化轉型建設。這個過程無疑是艱辛的,但也是收獲豐富的。後續的文章中,筆者會成體系的分享出來,與廣大讀者交流探討。

下期預告

企業數據化的建設,更多的要依靠規劃和設計來驅動。

我們期望把這種規劃和設計變成一個可見的,可以使用的引擎用以驅動整個企業數據化建設。

筆者用一個比喻來形容整個過程。我們把數據比作最原始的食材,業務方比作食客,數據團隊是廚子,數據中臺是廚房。

如何烹飪好“企業數據化建設”這盤菜,且看

袋鼠雲數據中臺專欄V2.0第三期:企業數據化認知 — 數據化建設三範式

敬請期待!

本文作者

張旭 (花名:老虎)

袋鼠雲解決方案與交付副總裁

原用友股份應用集成業務部總經理,主數據管理專家、業務創新帶頭人

曾主導數十家國內500強企業的數字化建設原型項目的規劃與落地

擁有十多年企業服務和項目管理實施經驗

關於袋鼠雲

袋鼠雲是企業數據化整體解決方案提供商,是數據中臺架構倡導者、引領者,通過打通數據供應鏈,構建企業數據化驅動引擎,加速企業數據化進程,讓數據成為企業核心競爭力。

袋鼠雲數據中臺專欄2.0 | 企業數據化認知:數據就是生產力!