1. 程式人生 > >商業大資料與工業大資料的區別

商業大資料與工業大資料的區別

塗子沛先生的《大資料》關注的重點是大資料對政治、社會、倫理等方面的影響,後來網際網路公司、IT公司將人們關注的熱點引向了商業領域,再經股評師的運作,使之成為全社會炙手可熱的概念。與此同時,學術界不失時機地將大資料的概念引入了工業界。人們很早就希望通過資料發現客觀規律、優化生產過程。很多企業急於搭上“工業大資料”這趟快車,然而在現實中遇到了很多的困惑。

從事過工業資料分析的人往往有這樣的體會:分析過程往往達不到預想的目標,資料似乎並不是傳說中的金礦。這種困惑也體現在商務活動中。企業資訊化建設原本應該遵循一個基本原則:使用者需求驅動系統開發。從事大資料業務的IT公司對使用者說:你說怎麼做,我就怎麼做;使用者卻說:我不知道能得到什麼,也不知道該怎麼做,最好你告訴我怎麼做。

誰都不知道怎麼做。

工業大資料與商務大資料是有不同點的。


現在關於大資料的流行觀點,幾乎都是針對商務大資料的,許多觀點可能並不適合工業界。

1.可發現的新知識少。

一般來說,發現新知識是大資料分析的一個重要目的。然而,在工業領域,人們對生產過程的研究一般比較深入,專業知識也很豐富,很難從資料中發現新的知識。與之相比,商務活動的大資料分析往往涉及人的喜好,這些恰恰是過去難以量化研究的,故而大資料的含金量高。

2.對分析結果的質量要求高。

工業界對分析結果的精度和可靠度要求高。如果將不可靠、不精確的分析結果用於指導生產,不僅不能創造價值,甚至可能導致極大的損失。與之相比,在許多商務大資料的應用場景下,即便分析錯誤,損失也不大。

3.分析難度高。

工業系統往往是複雜的人造系統,包含大量複雜的前饋和反饋環節。這意味著,變數間的相關性往往不是自然的因果關係。這個問題很容易誤導分析和決策的過程。另外,工業資料的信噪比往往比較低,分析結果很容易出現嚴重偏離事實的畸變(即所謂的有偏估計)。

相關性包含的資訊少。在商務大資料中,資料之間的“相關性”本身往往就具有很大的參考價值,而在工業體系中則未必是這樣。
 
工業大資料體現價值的場景有哪些?

工業大資料能否創造價值要看用在什麼場景中,例如:

1.質量要求高的生產場景。

製造業從什麼時候開始重視資料?顯然,當我們追求高質量、高穩定性的時候,資料會顯得非常重要,資料的價值才得以體現。國外先進企業追求6Sigma(一種改善企業質量流程管理的技術,主要強調通過制定極高的目標、收集資料以及分析結果,來減少產品和服務的缺陷),故而強調資料的重要性;許多企業一味追求低成本,資料的重要性自然就會低。

2.高度自動化及智慧化的生產場景。

在高度自動化和智慧化的生產單元,人的介入很少,對質量的要求一般也很高。這時,對裝置健康狀態和產品質量的自動監控就變得非常重要。

3.工業網際網路的場景。

工業網際網路能使成千上萬使用者的資料實現共享。多個使用者的共享會帶來兩個過去無法企及的效果。首先是分析結果的可靠性上升。這得益於來自不同使用者的例項,可用於對分析結論的重複性認證。其次是分析結果可以在眾多的使用者中分享,以創造更大的價值。

參考:

http://www.qianjia.com/html/2015-11/25_256202.html

http://www.techweb.com.cn/network/system/2015-12-01/2234167.shtml