1. 程式人生 > >大資料時代:大資料更需謹慎分析

大資料時代:大資料更需謹慎分析

進入大資料時代後,資料統計、分析被視作兼具“前景”和“錢景”的行業。一時間,擅長髮布各種資料的機構和單位如雨後春筍般層出不窮。可是,大資料真的那麼可信嗎?


之所以有這麼一問,是因為近期連續遇到幾起資料“烏龍”事件。例如,某網路平臺釋出報告稱,平安、民生、廣發、天津等4家銀行在上海停止發放房貸,停貸銀行佔按揭銀行總數的13.33%。可真相是工、農、中、建、交五大行約佔上海所有銀行網點的六成,這些網點都正常接受房貸申請;而天津銀行在上海的網點總共才7個,其他3家所謂停貸的銀行也是從年初起就調整經營戰略、壓縮房貸業務。從這些基本的情況不難推斷出,13.33%的停貸比例是站不住腳的。還有一個數據是今年“雙十一”過後第二天,某網際網路機構稱“雙十一”退貨率已達25%。然而,當時大多數網店還沒開始發貨,消費者又怎麼可能退貨呢?

大資料時代,搶著挖掘金礦的企業和機構越來越多,應聲而動的商業敏感自然值得讚賞。但對他們提供的資料乃至一些所謂完整的調查報告,則需要謹慎分析。

一方面,那些資料釋出方是否嚴格按照統計學的原則進行調查研究依舊值得商榷。據筆者瞭解,資料統計和分析行業內的企業和機構多如牛毛,規模大小不一,水平參差不齊。有些調查機構為了儘快完成資料收集和調查報告,不惜違背隨機、客觀採集樣本的根本原則,通過花錢買樣本的方式進行資料收集。根據這些資料得到的報告,顯然與事實有很大的誤差。

另一方面,很多資料釋出方的立場也值得商榷。絕大多數釋出方都標榜自己中立第三方的身份,可不要忘了,釋出的根本目的是用資料換金錢。所以實際運作時不可避免地會牽扯各種商業利益,從而可能影響資料的準確性。更有些不靠譜的釋出者,則把資料變成商戰中的武器,或者以釋出聳人聽聞的資料來擴大自身影響。

與其他評價方式和表述手段相比,資料無疑最直觀。也正因為此,社會對資料的真實準確性抱有很高的期待。大資料時代需要我們拿出更加謹慎的態度,對資料的收集、統計以及釋出者立場多問幾遍“準確嗎”,而不是一味貪圖資料的簡明扼要。只有這樣,才能從浩瀚的資料海洋中找出真正有價值的部分。

Bingdata優網助幫匯聚多平臺採集的海量資料,通過大資料技術的分析及預測能力為企業提供智慧化的資料分析、運營優化、投放決策、精準營銷、競品分析等整合營銷服務。

北京優網助幫資訊科技有限公司(簡稱優網助幫)是以大資料為基礎,並智慧應用於整合營銷的大資料公司,隸屬於亨通集團。Bingdata是其旗下品牌。優網助幫團隊主要來自阿里、騰訊、百度、金山、搜狐及移動、電信、聯通、華為、愛立信等著名企業的技術大咖,兼有網際網路與通訊運營商兩種基因,為大資料的演算法分析提供強大的技術支撐。