為何我國大資料市場規模不敵小龍蝦?
今年以來,根據中國資訊通訊研究院《中國大資料發展調查報告2018》資料顯示,2017年我國大資料市場規模為236億元(該統計口徑是大資料核心產業,包括大資料軟體、硬體和服務的直接產值,不包括附加值)。而同年,我國小龍蝦產業連年快速增長,市場規模超千億元。為何,作為資訊時代核心資源、未來戰略高地的大資料產業,在經歷幾年的資本流入和產業發展之後,市場規模到頭來還遠比不上如此接地氣的小龍蝦產業?
Hype 曲線透析大資料發展路線
為了客觀看待這個問題,我們需要認識、瞭解新興技術發展的Hype曲線。這是由Garnter公司公佈的技術成熟度曲線,描述的是新技術、新概念在媒體上曝光度隨時間的變化。圖1是2016年Gartner公佈的Hype曲線。任何新技術的出現,都會經歷五大週期:一是炒作期;二是隨著資本媒體的關注,達到一個期望峰值;三是新技術會遇到各種各樣的現實問題,往往現實不如期望般美好,因此會有一個泡沫破滅的下滑期;四是產業開始腳踏實地解決一個個實際問題,慢慢推動新技術的應用和發展,從而進入穩步爬升期;五是隨著關鍵短板的解決,技術會進入實質性的規模商用期,真正實現其價值。
圖1 Gartner Hype曲線
如圖1藍色方框是大資料,經過前兩年的炒作,大資料產業開始發現並面臨一個個現實問題,只有解決了這些問題,才能真正推動大資料產業進步。值得注意的是,這個Hype曲線是Gartner2016年公佈的,2017年Hype曲線並沒有大資料產業,因為Gartner覺得大資料並非是新興技術。因此現在2018年,大資料產業的實際位置應該相比上圖再稍微下移一些。
需突破3個發展瓶頸
問題來了,既然大資料產業,現在面臨不那麼美好的泡沫破滅期,那麼未來我們究竟要解決哪些瓶頸和桎梏,才能推動其真正步入穩步爬升期,體現出應有的價值?筆者認為主要有以下3個方面的問題亟待解決。
第一要解決 “ 不會”的問題。 大資料如果要作為產品和服務變現,那麼首先需要建立起資料資產的概念,把企業積累的資料當做資產去經營。“不會”用資料分為3個層次。第一個層次是壓根沒有建立起資料資產概念的問題。目前我國三大產業90多個行業中,除了少數行業如金融、電信、網際網路等行業的大資料探索起步較早之外,絕大部分行業對大資料技術認識不足,到底什麼是大資料?該採集哪些資料?採集之後怎麼用,能帶來什麼效益?絕大部分行業在這一層次的認識較為匱乏。第二個層次是有了大資料的意識,但是存在資料整合的問題。由於一個企業內部分為很多事業部,每個事業部又有多條生產線,除了生產資料,還有管理系統資料、營銷資料、維修資料、客戶資料等。多種內部的資料互相割裂,難以融合使用。第三個層次是資料實現了初步整合,但是沒有統一的資料標準,資料質量難以管控的問題。同樣的資料,在不同線條、不同事業部、不同部門間有不同的表徵方式,對於主資料、元資料的管理極不規範,導致雖然能初步形成資料礦產,但是卻是鐵礦、銅礦,價值不高。
一言蔽之,“不會”是資料來源企業內部的問題,要解決這個問題,亟待建立資料資產的概念,用科學的資料資產、科學的管理方法,把資料來源形成可用的狀態。
第二要解決 “ 不敢 ” 的問題。 解決了資料來源的原材料問題,接下來是資料流通的問題。根據《中國大資料發展調查報告2018》,企業運用大資料最多的領域,仍然是營銷分析、客戶分析和內部運營管理三大塊(如圖2)。這3塊仍然是偏向內部應用。而企業使用的大資料的來源,主要是來自自身生產資料、使用者資料、內部經營管理資料,使用的外部資料佔比較小,整個大資料仍然處於“男耕女織”的相對封閉時代,其最根本的阻礙是資料的安全合規流通(如圖3)。雖然我國已出臺了大資料相關法律法規,但仍然存在很多空白地帶,即灰色地帶。在這些灰色地帶,很多企業開始了嘗試,但是這些嘗試到底是合法還是非法,目前沒有定論。

圖2 企業大資料應用場景

圖3 企業使用資料來源
資料流通我國存在兩極分化的現象。一方面,資料流通的“汽化狀態”,即資料如空氣般快速流通。但這樣勢必會忽視掉一些資料安全問題、資料洩漏問題、資料權屬問題。例如前段時間山東的“30億條”,就是有不法公司非法獲取運營商資料開展營銷、加粉等牟利。另一方面,是資料流通的“固化”狀態,即資料根本不流通。我們也同樣看到,一些手握優質資料資源大型企業,為了規避風險,一刀切、不流通,這樣也同樣不適應行業的發展。
為了解決這些問題,不能一味訴求於法律,因為法律不可能涉及到諸多場景細節;不能一味訴求於政府,因為行政資源是稀缺的,不可能兼顧方方面面。最靠譜的方法就是行業推動來解決,通過先選取某些場景進行試點,再推廣開來,大家通過標準形成共識,一步一步解決這個世紀難題。
第三要解決 “ 不清 ” 的問題。 前兩個問題中,第一個是資料來源自身的問題,第二個是流通中的問題,那麼第三個問題便是與資料使用方相關的問題。目前,存在著很多“不清”:權屬不清、估值不清、存證不清等。大資料與普通商品和服務不一樣,A方賣給B方後,A方的使命就結束了,而大資料不是,大資料在經過層層流轉之後,還保留著最初的印記,而A方與B方還有諸多“不清”需要解決。
首先是估值不清。當前在我國大資料產業,整體的商業模式大致可以分為3種,賣資源的、賣工具平臺的、賣解決方案的(此處暫不討論提供基礎設施的)。對於後兩種,有明確的商業模式和市場已有的參考。可是對於賣資料資源的,類似於一種無形資產,尚沒有統一、達成共識的價值評估方法。這樣就會形成不同的定價方式,高低價不均衡。
其次是權屬不清。使用者的個人資料,經過服務廠商採集、處理之後,權屬到底屬於誰?A方的資料流轉到B方後,資料是屬於A還是屬於B?A方的資料通過B方加工之後,A方是否還對資料擁有主權?這些都是亟待解決的問題。今年8月份,杭州網際網路法院宣判了我國首例大資料產品不正當競爭案,在這個案件中,由淘寶在收集巨量原始資料基礎上,以特定的演算法深度分析過濾、提煉整合並經匿名化脫敏處理後形成的資料產品,其權屬是被肯定的,也給後續大資料相關糾紛提供了法律依據。
最後是存證不清。在大資料交易中,尤其是資料的多級交易中,資料授權、資料交易記錄等極為重要,這些能對資料濫用、資料洩露產生約束,從而規範整個行業的行為。目前行業中已經出現了一些授權篡改、造假、偽造的情況,這會導致使用者資訊的洩露。針對這個問題,行業已經出現用區塊鏈的方式,進行大資料的存證記錄,後續有待進一步落地深化。
儘管如此,但我們相信,在大資料這幾年“緊日子”的前途仍是光明的。當產業齊心協力,共同推動上述難點一步步解決,大資料應有的價值便會充分釋放,熠熠生輝。

責任編輯:陳近梅