1. 程式人生 > >徐宗本院士:智慧製造的大資料機遇與挑戰

徐宗本院士:智慧製造的大資料機遇與挑戰

中國科學院院士、西安交通大學教授徐宗本

作為一個數學家,用現在的話講,應該是一個數據科學家。今天,我的絕大部分內容是從基礎上演講。在聽了各位領導致辭和專家演講後,我講兩個觀點:

第一,我非常欣賞蕭山區對大資料的認識,我不認為大資料對近一兩年GDP的貢獻有那麼大,但肯定的說對於三年、五年之後的GDP貢獻巨大。換句話說,只有沉得下心,願意紮紮實實打好基礎的政府和企業,才能從大資料技術上獲益。

第二,大資料技術並不是已經成熟的技術,是一個正在從應用中逐漸走向成熟的技術,目前的挑戰多於成熟。

今天演講主要分為兩部分:大資料承載瞭如此多的期望,有些期望是合理的,有些期望未必合理,我想從科學的角度說一些科學問題。第二部分回到智慧製造,也就是工業大資料的重要方面,談談自己的認識。

第一部分:大資料及大資料原理

什麼是大資料?大家都知道資料是什麼?資料就是資料的數字化。資料是什麼?資料就是生產過程、管理過程,乃至經濟、社會、生活過程的記憶,那些記憶可能表現在一個檔案,一段演講,一段文字等等,這是資料。資料不放在計算機上,一般不叫資料。但放在計算機上就叫資料,所以有個標準的說法,資料是指以編碼形式存在的資訊載體,是資料的數字化形式。

因而,資料一定要放在機器上,要有空間。其實真正的大資料是指大而複雜的資料集,這些複雜性包括了海量性、時變性、異構性、分佈性等等,我們從網際網路資料能夠觀察到的特徵。

到底什麼是大,我畫了一張圖,希望解釋什麼是大。這件圖是我把對資料的觀測放在一起,大傢什麼都看不見,如果再觀察五年,或許還沒有看清楚。再觀察五年,放到一起看看原來是一個大象的輪廓,再觀察五年就看得更細緻了,它的牙齒、腳都可以看得更清楚。這張圖是告訴大傢什麼叫大資料,什麼叫大。

從這個觀察可以看出,隨著資訊獲取的發展,從量變到質變。量變就是資料的增加,質變就是隨著規模的增加,到某一刻開始,人們就可以只看看一些區域性,只看看一些資料就能夠知道它背後的故事。這個量就叫資料的臨界量。

凡是對一些問題積攢的資料量超過這個量,就叫大資料,反之則不叫大資料。因而講大資料是兩件事:第一,大和小是相對概念;第二,相對特定問題而言,不同的決策問題要求的資料不一樣。否則大家就認為現在是大資料時代,大資料可以解釋任何事情,我認為不要神化它,大資料可以做很多事,但也不是能做所有事,這是我的基本觀點。

現在都說大資料是基本的生產資料,大資料是基本的生產力,因而,大資料是經濟社會的基本生產資源。看看網際網路就知道,網際網路主要在資訊傳遞上發揮作用,近幾年的發展,是把網際網路從複雜的資訊傳遞到消費互聯,再到生產互聯(也就是物聯網),再到智慧互聯,這就是網際網路的大體走向。在這個走向中非常大的問題就是資訊科技在網際網路產生以後,和其他任何領域要深度整合,這就是今天談論資訊工業化、談論大資料的主要原因。

這裡面還有一些問題要說清楚。我們知道了太多的新技術,比如說物聯網、網際網路、人工智慧、移動網際網路等等,其實這些新技術都是資訊科技的一個層面,大家不要期望某一項技術包打天下。真正產生效益和作用的是所有技術的綜合運用,這是今天和大家分享的第二個觀點。

千萬不要以為有了大資料就不講物聯網,講物聯網就不講網際網路,講網際網路就不講人工智慧,其實大家是互補的,都是從不同的層面講問題。

我覺得有一點是肯定的,網際網路和雲端計算是基礎設施,這是肯定的。物聯網講的是互動方式,人工智慧講的是應用模式。那麼,大資料講的是資訊科技,是人和人、人和機器、機器和機器互動的內容特徵。

所以,從這個意義上講,大資料是最底層的資訊科技。因而,大資料掌握的技術,是基本的標配,任何工業要實現“兩化”,任何政府要實現科學決策,大資料是基本標配,這是我講的第三個觀點。

大家都知道大資料怎麼應用,我想講五句話,大資料從資料分析,到預處理,到管理方式,到適當的分析和挖掘,到結果解釋,到修正,大家記住如果大資料是不走樣,至少不走彎路。

第一,明確目標是前提。好像和大資料沒有關係,但我認為這是最重要的。我們用大資料不是說國家有個戰略,有個檔案就用大資料。我想對每個地區、每個政府、每個企業,要解決的問題不一樣,必須要真正解決問題,大資料才有用。

第二,擁有資料是基礎。什麼是大資料產業?大資料產業就是以現代技術設施為基礎,以資料為生產要素,以資料的價值挖掘為創新活動的產業,叫大資料產業。因而沒有資料談不上大資料產業。

第三,計算平臺是支撐。換句話說,沒有一定的計算架構和計算平臺,計算不了。它是支撐作用,但做企業的人不必過分強化,也不必過分低估。

第四,分析技術是核心。這是今天較少講的主題,也是領導較少講的主題。我非常擔心在整個大資料的鏈條中,有些鏈條做得過分粗壯,有的鏈條過分纖弱了一些,也就是我擔心的產業鏈佈局不均衡,有的過分膨脹,會產生新的產能過剩。

第五,產生效益是根本。給大家四句話,資料是基礎,平臺是支撐,技術是核心,賺錢是王道,記住這四句話不走樣也不失望。

為什麼大資料可以帶來超凡價值、背後的原理是什麼?在這個大潮中為思維帶來怎樣的改變呢?

我概括了三條原理:第一,量變到質變的原理。大資料之所以有用,是因為資料積攢到了可以質變,通過資料就可以知道背後的故事,這是這個原理起作用。

第二,分析出價值原理。剛才已經說了,如果儲存不分析,無疑是隻買米不做飯,產生不了GDP,所以要靠分析,要靠挖掘。

第三,跨界關聯原理。舉一個簡單的例子,假設一個火鍋店的老闆想提高營業額,這是他的目標。他當然會收集一年當中的採購量資料、現金流資料等等,這些是企業內部資料。但如果能採集到這個火鍋店周圍的人口分佈資料,如果能夠買得到這個地區天氣預報的精細資料,對火鍋店的營業而言就是極為重要的。我們都知道湖南人和四川人比較喜歡吃火鍋,天氣潮溼的時候比較喜歡吃火鍋,這就是賺錢的道理,就是跨界關聯原理。這三條原理是我概括出來的,和大家分享。

這個過程中有很多觀念要改變:第一,資料是資產,大家都知道資料和資產;第二,使用者是資源。談談使用者,過去企業是上帝,那是教育員工的服務態度,因為我們都知道神是拿來敬,使用者是心裡尊重的。但到了大資料時代,產業模式變了,使用者是我們的生產資源,要個性化服務。如果沒有使用者的反饋,為誰服務?這就是手機運營商的道理,我知道過幾年資料會免費,因為重要的是四大運營商在實時報告我們的資訊、行為、愛好,這些是他們掙錢的主要依據,是不是資源?

第三,服務即感知。滴滴、快車已經告訴了我們這件事情,還有公共服務免費,高價值服務盈利也是基本的盈利模式,就是大家很熟悉的羊毛出在豬身上,這是觀念。

剛才說了,大資料突飛猛進,能夠用來解決相當多的問題,但千萬不要以為大資料技術已經成熟了,一定不要這樣問題。其實挑戰很多,今天不是講挑戰,但概括的說基本挑戰是什麼?我認為,主要挑戰是分析基礎被破壞;計算技術待革新,真偽判定需要重建,對新技術的盲目所引起的盲從。

第二部分:智慧製造大資料:機遇與挑戰

製造大資料非常重要,“中國製造2025”主要講的就是這件事情。繼網際網路之後,真正能夠對企業產生重大影響的大概就是大資料,再次重申,講大資料的時候不要和其他技術隔離開。我也重申,現在人工智慧潮正在到來,我要告訴大家的是不要冷落了大資料,人工智慧在可見時間內,真正能夠稱得上人工智慧,真正發揮作用的就是資料智慧,就是大資料。



 

因為人工智慧簡單來說是兩個大的型別,一類是模擬人腦工作機制、行為方式,是仿腦類腦的技術。另一類是快速的認識,因為人腦對大資料的認識本身沒有那麼快,但獲取資料的速度極強,可以從資料中分析出人類認識問題特定的方式方法,這部分就是資料智慧,也叫人工智慧。所以,真正起作用的主要是資料智慧,而從這個意義上講,不要和大資料分開。

大家說大資料能服務於轉型升級,轉什麼型,升什麼級,至少要清楚這個問題。對工業來講,轉型是什麼?就是轉過去以產品為中心,以產品組織設計、製造、銷售管理的過程,到以服務為中心,以定製化為中心。

最近有一個基本的觀點,說從過去的老三基到新三基,過去的材料、工藝、零部件是老三基,現在的新三基是大資料、感測器和零部件。我希望大家瞭解對一個行業來講,資料極其複雜,來源於設計、製造、執行和服務,仔細分析每一步的資料。離散型和連續型並存,數值型和非數值型別並存,結構化和非結構化並存。

大資料必須關注完整屬性,必須關注產品全壽命特性,必須關注全方位連線,關注製造系統融合等等,這些要求使得我們認為基本難點在認知知識資料。全鏈條資料,如物理模型的結合,都將是這方面技術的難點。

我想最基本的科學問題,可以明確一些基本問題。如果大資料用在技術中,物聯網技術、雲端計算技術、大資料技術、人工智慧技術都是基本的。

總體上說,我想向大家傳遞的是如果要做工業大資料,互聯互通是基礎。首先解決資料採集問題,就是互聯互通問題;定製化服務是中心,基本模式要轉變懂資料會分析是關鍵。今天我想用這點時間和大家分析基本的觀點。

第三部分:結語

大資料是新一代資訊科技的基礎性技術,需要應用,工業大資料非常有潛力,但一定要解決好定位問題、規劃問題、切入點問題、標準問題、開發共享問題等等,互聯互通是基礎,定製化服務是中心,懂資料會分析是關鍵。