製造業的機器學習:優勢,挑戰和機會
論文: 《Machine learning in manufacturing: advantages, challenges,and applications》的閱讀筆記。
論文下載連結: https://pan.baidu.com/s/1GfQX-JBXZ7HolVlA5QFX7w
本論文是機器學習在製造業領域的一篇綜述。
一 為什麼要做這個研究?
對於這個問題,我們從論文的Introduction來尋找答案。
首先,當今的製造業正在經歷前所未有的資料增長。這些資料格式,資料語義,資料質量非常地豐富,例如:生產線上的感測器資料,環境資料,裝置引數等。面對這種現象,各個國家都有不同的戰略,例如,中國智慧製造2025,德國工業4.0,美國的智慧製造,韓國的智慧工廠等。
其次,這種大量資料的增加和可用就是“大資料”,這是大資料分析和機器學習應用的“沃土”。例如,與質量相關的資料提供了持續改進產品質量和流程的潛力。
第三,人們也認識到,大資料給製造業也帶來了新的挑戰,若是引用不恰當,甚至可能產生消極的影響,比方說,分散對主要問題或者因果關係的注意力,或者導致對適當行動的延遲或者做出錯誤的結論。
總之,製造業能夠從可用的資料中獲益。例如:質量改進計劃,製造成本估算,工藝優化,更好地瞭解客戶需求等。在對製造業可用的資料做加工和應用時,需要能夠支援和處理複雜的,高維的,動態的大資料。而機器學習的快速發展和廣泛應用,能夠很好地滿足製造業大資料的需求,為製造業大資料的問題,挑戰和基於提供了強有力的思路,方法和工具。
二 怎麼做這個研究?
本論文從四個方面來介紹製造業大資料下的機器學習,分別是:
1 從製造業角度論證為什麼機器學習對於製造業今天和未來的挑戰是一個合適和有前途的工具。
2 介紹各自領域的一些術語。
3 概述機器學習的不同領域,並提出一個總體的框架。
4 提供給讀者關於某些方法在製造業應用方面優缺點的一個高層次的理解。
製造業的重要性毋庸置疑,每個國家都很重視製造業的發展和升級。近些年,製造業改革計劃已經啟動,例如,美國的“加強美國先進製造業的實施行動”,歐盟的“未來工廠”,中國的“中國智造2025”等。今天製造業面臨的挑戰已經與過去完全不一樣。
我們羅列下論文關於製造業領域的一系列挑戰。
1 採用先進的製造技術
2 製造高附加值產品的重要性日益增強
3 使用先進的知識,資訊管理和人工智慧系統
4 可持續生產流程和產品
5 敏捷而靈活的企業能力和供應鏈
6 產品,服務和流暢的創新
7 業界與研究機構緊密合作以採用新技術
8 新的製造管理模式
這些關鍵挑戰說明製造業正在變得更加複雜和動態。
為了克服當今複雜製造系統的一些主要挑戰,機器學習技術作為有效的工具。這種資料驅動方法可以在不同型別和來源的資料中發現高度複雜和非線性的模式,並將原始資料轉化為特徵空間,即所謂的模型,然後應用於解決預測,檢測,分類和迴歸等系列問題。
當今,ML已經廣泛應用於製造業的不同領域,例如優化、控制和故障排除等。
1 機器學習在製造業適用性
機器學習在製造業適用性綜述,如下表:
接下來,探討下機器學習在製造業領域的優勢和挑戰。
2 機器學習在製造業領域的優勢和挑戰
ML已經成功地應用於製造業的各種流程優化,監控和控制應用。
ML技術被發現為改進製造系統的質量控制優化提供了有前途的潛力。
現在,已經有許多不同的ML方法,工具和技術可用,每種方法都有優點和缺點。
2.1 優勢
1 ML技術能夠處理高維,多變數資料,以及能夠在複雜,動態,甚至混亂的環境中提取大資料集內隱性的關係。
2 面對製造業的資料豐富而知識貧乏的狀況,ML作為一種有效工具可以增強對資料的理解,挖掘和應用。
3 在製造業領域,ML技術可以降低迴圈時間,提高資源利用率,持續改進產品和服務質量。
4 ML技術擅長處理高維問題和資料。
5 ML技術提升了演算法的可應用性。
6 ML演算法提供了從動態系統中學習的機會,並在一定程度上自動化適應變化的環境。
2.2 挑戰
1 ML技術的一個常用挑戰是獲取相關的資料。
2 ML技術需要資料的預處理。
3 資料缺失值的挑戰。
4 機器學習演算法和模型的選擇性問題。
對於某一問題選擇合適的ML演算法的思路如下。
-
首先,檢視可用資料和資料的描述,在有監督,無監督,強化學習裡面做出選擇。
-
其次,分析現有演算法在所研究問題的適用性,特備註意可用資料的結構,資料型別,資料總量,這些可用於訓練和評價模型。
-
第三,對演算法在類似問題上的應用進行研究,以幫助確定合適的演算法。
5 演算法結果的可解釋性
3 機器學習技術和演算法結構
ML在過去幾十年的裡已經發展成為一個廣泛而多樣的研究領域,這產生各種不同的子領域,演算法,理論和應用域。
圖1,根據任務和可用的演算法來構建DM的ML域。
圖2 ML技術的主要分類。
圖3,ML技術和演算法的結構。
4 機器學習的型別和所解決的問題域
4.1 無監督學習
無監督學習是一個大的研究領域,無監督學習中所定義的屬性,沒有來自外部教師或者知識專家的反饋。
在大資料領域,獲取標籤資料代價大,無監督學習顯得愈發重要,或者無監督學習和有監督學習組合的學習,即半監督學習得到廣泛地研究和應用。
4.2 強化學習
強化學習是學習者必須通過嘗試而不是被告知來發現那些行為產生了最好的結果。
4.3 有監督學習
有監督ML技術在製造業得到廣泛地應用。
有監督ML技術是學習有標籤的資料。
有監督ML技術的一般流程包括幾個步驟來處理資料,並由教師設定訓練和測試資料集,因此是有監督的。
5 有監督機器學習在製造業中應用領域
-
5.1 機器狀態監測,故障診斷和道具磨損是支援向量機連續成功應用的領域。
-
5.2 製造業中損壞產品的識別或者分類問題。
-
5.3 手寫筆跡分類。
-
5.4 影象識別問題。
-
5.5 信用評級
-
5.6 食品質量控制
-
5.7 規則提取
-
5.8 產品分類
三 這個研究做了什麼?
這個研究探討了機器學習在製造業上挑戰,優勢和應用。
面對製造業日益增加的資料集,如何利用好資料集以實現製造業的升級改造,機器學習成為有效的“候選人”。
四 這個研究帶來的啟發是什麼?
1 機器學習是一個方法論,並且是一個可以與各種行業做跨界和融合的。機器學習+製造業,為智慧製造貢獻力量。
2 製造業的關鍵問題,先進的製造技術,產品和服務的質量,流程的優化,故障的預警等等,都是非常有價值的,通過資料,結合ML技術,可以有效地解決好這些問題,以創造新的價值和增長。
3 製造業的資料收集是一個挑戰,也是資料驅動和演算法決策落地的根基。一旦確定和採用了ML技術,資料收集就需要成為一種戰略,引起足夠的重視和持久地投入。
版權宣告: 作者保留權利。文章為作者獨立觀點,不代表資料人網立場。嚴禁修改,轉載請註明原文連結:http://shujuren.org/article/786.html
資料人網: 資料人學習,交流和分享的平臺,誠邀您創造和分享資料知識,共建和共享資料智庫。