1. 程式人生 > >貨拉拉大資料總監劉幸:大資料&智慧化體系的建立 | 2018FMI人工智慧與大資料高峰論壇(深圳站)

貨拉拉大資料總監劉幸:大資料&智慧化體系的建立 | 2018FMI人工智慧與大資料高峰論壇(深圳站)

10月28日FMI 2018人工智慧與大資料高峰論壇深圳場圓滿落幕,貨拉拉大資料總監劉幸以大資料&智慧化體系的建立為主題進行了精彩的分享。

 

貨拉拉大資料總監 劉幸

以下是劉幸演講內容,飛馬網根據現場速記進行了不改變原意的編輯(有刪減):

 

劉幸:大家好!我今天分享內容的標題是《從零建立大資料&智慧化體系》。主要分為三個部分。

 

01

第一部分:大資料行業綜述

 

首先從不同行業大資料的發展來探討一下當下的現狀。

 

金字塔頂端是互聯行業,因為網際網路行業資源充足,其次網際網路行業有成熟的工程師文化,資料團隊是作為核心競爭力,最後外包模式雄厚的資金也使得網際網路居於大資料行業的頂端。

 

第二梯隊的是金融行業,金融行業特色採用“外包+正式編制”,重分析和業務。資料可以給金融公司帶來可觀經濟效益,所以很重視資料驅動營收的模式明顯。    

 

第三梯隊是交通運輸、醫療健康、公共管理、能源、科教等等。這些偏向公益型或者政府主導的,帶有大量資料積累的行業。

 

第四梯隊、第五梯隊,是製造、建築、房地產、餐飲、農業、住宿等等。這一批資訊化弱,本身的資料沒有太多積累,且資金相對薄弱。

 

大資料、智慧化不分家,兩者都面臨著資料價值落地難的業界痛點。

 

資料團隊不直接產出價值,而是通過業務團隊間接產出價值,很難衡量中間的價值量。

 

產生價值要資料科學團隊和業務團隊緊密配合。這個配合涉及兩個很大的問題:一個滿意度問題,一個是部門牆問題。

 

怎麼解決這個問題呢?

1、構建資料體系,用好資料。

2、通過業務將資料找到價值出口,這裡面最關鍵的是團隊合作。

 

資料價值落地閉環

從資料來源開始,然後收集埋點、資訊轉化、資料處理,最後得到結果(可以是統計分析學結果,可以是資料探勘、機器學習等等出來的結果)。

 

如何用資料?

我們要運營資料,通過做迭代、做迴圈,有結果要分析、要洞察、要引導決策、持續優化,最後形成資料的反饋閉環。其中引導可以人也可以機器引導,人引導是分析師做的事情,機器引導是人工智慧做的事情。   

 

資料團隊體系的組織架構

1、矩陣型(模式典型):業務黏度最高

2、中心型:在影響力、決策相應度、可複用性和團隊結合效率更好。

 

成熟資料體系的特徵:

1、資料有價值。

2、資料成體系。

 

02

第二部分:企業級大資料體系建設實踐

 

如果要從0開始建設大資料和智慧化的體系,應該怎麼辦?

第一步做資料轉換。二是做資料的處理和整合。資訊經過分析變成情報(可以理解為組織得比較好,經過統計和挖掘相關出來的資料,這其實就是情報),情報通過學習變成知識,知識放在應用裡面變成智慧,這就是我們講的智慧城市、智慧交通。智慧的系統做出來安到裝置上就是實踐,實踐之後產生很多資料然後進行反饋,最後就形成一個閉環,這是資料自己的閉環。

 

發展願景

創業團隊或者內部創業團隊都有發展願景:一是建立資料體系,二是資料化運營,三是資料驅動業務,四是智慧物流企業,五是驅動產業鏈升級。

 

方法論

發展方法論也叫專業、夥伴、未來。

1、專業:就是深化內功,帶動技術方向,樹立業界大資料專業地位,彰顯大資料團隊的專業知識優勢資源。

2、夥伴:資料也好、智慧化也好,要通過業務找出口和價值,需要成為業務的夥伴,業務和資料是相互合作的關係。只有做成夥伴之後才能更好的驅動業務價值產出。

3、未來:讓業務更加智慧,讓公司更加適應大資料時代或者大資料時代。

 

建設原則

指導思想是平臺化、服務化和應用化。

1、平臺化:平臺使得大資料和人工智慧不再是一個工具,不再是一種技術,而是集中資源優勢,對資料資產進行深度整合、開發和利用。 

2、服務化:讓大資料像當今的專業諮詢策劃機構一樣,不僅接受諮詢HIA提供解決方案。

3、應用化:深化大資料服務,使其有形化、標準化、品牌化。

 

大資料建設初期戰略

1、建團隊。搭建一個架構團隊,先建的是大資料平臺、資料分析平臺、大資料應用平臺,大資料應用平臺是大資料產品,後面就是資料倉庫,再就是演算法,然後就是一個虛擬的架構組。

2、搭平臺:搭基礎平臺、整合開發平臺、資料服務門戶,還有企業級資料倉庫和人工智慧平臺。

3、做應用:有大資料的解決方案,大資料產品和智慧化產品。

 

資料從業者的技能棧:

1、資料技能:數學、統計學、機器學習、資料倉庫等等理論。

2、研發技能:Java、SQL、架構能力等。

3、軟技能:業務知識、抽象思維能力、歸納總結能力、溝通社交能力等。

 

相比資料技能和研發技能,軟技能很少受關注,但它們同等重要。

業務知識,抽象思維能力,歸納總結能力和發散思維,溝通及社交能力,特別是溝通能力和社交能力很重要,因為大部分資料都是通過業務產生價值,所以軟體特別重要。資料技能加研發技能,我叫資料工程。研發技能+軟技能,就是資料產品,產品經理、資料應用工程師等等這些。資料技能+軟技能就是資料分析、資料探勘。真正的資料科學就是這三個技能之間,既要懂資料技能,又要懂研發技能,還要懂軟技能。

 

03

第三部分:大資料在不同行業的案例

 

使用者畫像

所有的行業都需要使用者畫像。沒有做過資料的人一般對畫像停留在感官層面,而資料從業者則是要深入到每個人的內心,這樣才能做到資料有價值。使用者畫像是把使用者心裡怎麼想的用資料表達出來,這個技術其實就是打標籤,也即標籤化。

使用者畫像的資料構建(以金融行業為例)  

1、客戶的基礎資料:金融行業是一個要求資料特別準確的行業,包括身份證、銀行卡、收入、職業等等都涵蓋在內,其客戶基礎資料非常全面。

2、使用者交易資料:金融行業最核心的業務資料。

3、客戶行為資料:包括交易終端、手機證券易淘金、金鑰匙等客戶行為瀏覽資料。

4、外部資料:如果想要一份完善的使用者畫像,最好是和外部資料關聯結合起來。在業界一邊是通過資料買賣或者是資料交易。

 

使用者畫像應用場景

使用者畫像可以做基礎統計、場景化運營、資料探勘和運營服務評估。

1、基礎統計:個體分析和群體分析。

2、場景化運營:精準化營銷、客戶的生命週期管理。

3、運營評估服務:運營效果的評估

4、資料探勘相關的功能。

使用者畫像可以理解為不是直接產生使用者價值的業務系統,而是給很多產生價值的東西提供資料來源,提供資料畫像的資料來源,它是一個基礎工作。

 

智慧客服

智慧客服是一個典型的應用,它一般分為三個小的模組,一是機器人客服;二是機器人助手;三是智慧問答服務。

 

客戶價值管理體系

這是大資料和人工智慧典型的應用。在金融行業特別好,因為金融行業客服單價特別高。這一塊做的最多的是流失預警,原因是競爭對手比較多,單價比較高。

 

智慧語音質檢

這是智慧客服做的副產品。智慧客服是提前打一道關,語音質檢是到語音客服手上,從語音對話上發現問題,打客戶的電話說電話會被錄音,錄音就是質檢。之前抽樣質檢,10%抽樣率,有智慧化之後就變成了全量檢。

 

智慧投顧

現在金融行業比較火的是智慧機器人、股票機器人。

把人工智慧技術用到傳統投資顧問裡面去的東西,有人說這個行業變味,變成推銷產品,用技術包裝一層然後推銷基金和各種各樣的理財產品。但是脫下高科技的外衣本質是一回事。這裡強調一下,這裡和賣理財產品有區別。智慧投顧根據你的風險偏好和投資行為和風險承受能力,有的喜歡炒長線,有的喜歡搏短線,有的操作頻率高,有的操作頻率低,千人千面,每個人算一次,然後推薦喜歡的和感興趣的投資組合,進行自動組合,這是唯一的區別。本質還是一堆產品裡面挑你喜歡的。

 

手機APP崩潰分析

個性化推薦

 

我的分享到這裡。謝謝大家!

關注公眾賬號

飛馬會

 

 

 

 

往期福利

關注飛馬會公眾號,回覆對應關鍵詞打包下載學習資料;回覆“入群”,加入飛馬網AI、大資料、專案經理學習群,和優秀的人一起成長!

回覆 數字“11”50本書籍大禮包:AI人工智慧/大資料/Database/Linear Algebra/Python/機器學習/Hadoop

 

回覆 數字“12”小白| Python+Matlab+機器學習+深度神經網路+理論+實踐+視訊+課件+原始碼,附下載!