1. 程式人生 > >讀《大資料》的三重大思維轉變,有感

讀《大資料》的三重大思維轉變,有感

    大資料這個詞語,這幾年炙手可熱。大資料在某些領域已經顯示出了它的價值了,比如航空公司產品銷售策略分析,淘寶使用者逛店鋪的途徑是PC還是手機,Google曾經使用大資料就準確預測過流感病毒的傳播和發源地。

    前不久國務院總理李克強就針對大資料約見了浪潮等一些廠商,可見大資料在我們國家已被提升到瞭如此高度的重視了。我們不難預測在不久的將來大資料將廣泛的應用到我們社會的各個方面。

    那麼面對這樣一個大資料時代,不能在固守原來的一畝三分地了,我們要敞開思想放下原來的固執去迎接大資料時代的到來。

    大資料與三個重大的思維轉變有關,這三個轉變是互相聯絡和互相作用的。

    首先,分析與某事物相關的所有資料,而不是依靠分析少量的資料樣本。

    原來我們不具備手段或工具去分析所有的資料樣本,而是採用抽樣分析情況。這種以管窺豹的時代會照成分析結果不準確。我們現在擁有了大資料分析的手段和平臺(hadoop 、ga 、spark 等)可以去分析某一事物的所有資料了。以前,每到過年新聞中都會紛紛報道各個省市的人均GDP,人均收入水平,幾乎很少人信這個資料是準確的。為什麼會出現民眾對新聞報道的資料產生不信任呢?究其原因是資料不準確不實際,做資料調查的群體只是抽樣了經濟發展不錯的城鎮做出的結論。因為如果要獲得相當精確的資料的代價是非常大的,要排多少調查人員,走訪多少村鎮,耗費多長的時間,想一想就是一個龐大的工程。但是在大資料時代,我們有了資料中心,我們就可以輕鬆高效全面的統計分析整個地區的結果,找出發達的地區和欠發達的地區,均衡整個地區的發展趨勢。

    其次,要樂於接受資料的紛繁複雜,而不再最求資料的精確性。

    我們的工作生活會產生多少的資料呢?街道的攝像記錄,小區的門禁監控記錄,公司上下班的打卡記錄,瀏覽網頁的瀏覽歷史,每一個人每一天不知不覺都會產生非常大的資料。更何況以後建立的智慧城市,這個資料的數量級我們難以想象了。我們不得不面臨紛繁複雜的資料,所以再去考慮某一條資料是不是精確的代價已經變得得不償失了,沒有必要再去最求資料要多麼的精確了。

    最後,重點不再去探求難以琢磨的因果關係,轉而關注事物的相關關係。

    最求事物的因果關係,我們從小就被這樣的教育。在大資料面前去分析資料的因果關係,這是鑽入資料之中,是一件非常困難的事情,因為任何一條資料的產生都可能是多種因素影響產生的,是不容易找到真正原因的。然而關注事物的相關關係,這是站在資料之上,關注資料之間的相關性,弄明白不同資料種類之間的關係型,通過這種資料型別之間的關係性就可以預測資料發展的未來。

拿出手機掃一掃下面的二維碼,關注微訊號,分享讀後感: