1. 程式人生 > >結合深度學習的工業大資料應用研究

結合深度學習的工業大資料應用研究

 

摘要:如何將大資料等核心技術與智慧製造結合,進一步提高產能與質量,並且降低成本,是新一代製造業革新的關鍵任務。通過一個具體應用案例,即針對工業中常見的機床刀具消耗冗餘的問題,提出了基於大資料和人工智慧的方法,以準確預測機床刀具的崩刃,從而增加了機床的生產效率,降低了生產成本。相對於以往使用資料統計和傳統機器學習進行刀具磨損預測的方法,新方法通過高速電流採集器獲取主軸電流值,結合了卷積神經網路的強擬合性和異常檢測演算法的強泛化能力,對大資料量的電流值進行預測分析,實現了更快的網路收斂及更高的預測準確率和頑健性。

在這裡我還是要推薦下我自己建的大資料學習交流qq裙: 957205962

, 裙 裡都是學大資料開發的,如果你正在學習大資料 ,小編歡迎你加入,大家都是軟體開發黨,不定期分享乾貨(只有大資料開發相關的),包括我自己整理的一份2018最新的大資料進階資料和高階開發教程,歡迎進階中和進想深入大資料的小夥伴

關鍵詞:深度學習;工業大資料;智慧製造;異常檢測;刀具磨損

智慧製造(intelligent manufacturing)是指整合知識工程、製造軟體系統與機器人視覺等技術,在無人工干預下由智慧機器人獨立實現的生產過程。智慧製造系統是一種融合智慧機器與智慧行為,在訂單製作、產品設計、生產、營銷、銷售等製造過程的各個方面都可以整合,用一種靈活的方式充分發揮先進生產系統的製造能力的系統。隨著雲端計算、物聯網、大資料、人工智慧等新一代資訊科技的發展,智慧製造的內涵有了突飛猛進的變化。目前,智慧製造已經成為每個工業發達國家的國家戰略。

在工業智慧製造中,李傑提出將智慧製造體系分為3個階段。首先,把問題變成資料,也就是傳統的資訊化過程,利用資料對問題進行建模,把過去老工人的經驗變成可挖掘、可量化的持續價值,從而不會因為人的原因而失去知識。然後,把資料變成知識,從“解決顯而易見的問題”延伸到“探索不可見的隱藏問題”,不僅要明白“怎麼解決問題”,還要理解“為什麼會出現問題”。最後,把知識再變成資料,這裡的資料指的是生產中用到的裝置指令、機械加工的工藝引數、可執行的決策等所有能夠量化的指標,用從知識得來的量化資料修正和完善製造過程,從根本上避免問題的出現。

作為智慧製造最重要的技術之一,大資料技術對傳統工業製造業的影響是巨大的。智慧製造的基礎是將工業生產中的問題資料化,利用獲取的資料對問題解決方法進行資料建模,當類似的問題出現的時候,能夠根據模型提出解決問題的方法。這樣,將知識固化於資料與演算法模型中。

通過對大資料的深入挖掘,獲取產品的需求感知,基於大資料分析實現製造業“需求— 製造 — 需求 ”的全流程生命週期管理,實現數字化、網路化、智慧化的生產優化、流行預測、精準匹配、供應鏈優化、營銷推送等眾多智慧製造核心應用,進而驅動產品設計和產業發展。大資料技術對製造業的影響主要有兩個方面:一是在製造和管理流程中運用大資料技術提高產品質量和生產效率;二是在現有產品與服務中融入大資料技術,以進行顛覆式的革新。簡而言之,融入大資料技術的智慧製造關心的兩大重點分別是製造流程技術和製造出的產品技術。

深度學習是機器學習研究中的一個新的熱門領域,作為人工智慧領域的熱門技術,近年來發展迅猛。隨著深度學習技術的流行,使用人工智慧技術在各行各業進行創新應用成為發展趨勢。不同於傳統的機器學習技術,深度學習對於影象處理具有先天優勢,因此大部分在智慧製造中的深度學習技術應用案例是在計算機視覺領域的,例如通過影象對產品外觀進行檢測,以發現殘次品。在工業的製造過程中,使用深度學習技術的自動光學檢測(automatic optic inspection,AOI)裝置也開始替代傳統檢測裝置。

本文通過一個智慧製造的實際案例,驗證了使用深度學習技術對數控機床進行刀具壽命檢測的可行性。從實際應用效果來看,在製造生產過程中,結合了大資料技術的方法比過去採用傳統的方法獲得了更好的效能提升,同時也節約了成本。

2 智慧製造應用

本文將深度學習技術運用到了製造業最重要的環節——使用數控機床(或數控加工中心)進行加工製造,用人工智慧代替生產工人對數控機床加工中用到的數控刀具(又稱工具)進行壽命監控。通過採集、測量機床電流負載資料的方式,證實了數控機床主軸電流負載的變化與刀具的磨損程度之間存在一定的相關性。例如,當刀具磨損等異常狀況(如刀具的崩缺)出現時,電流負載在極短時間內會劇烈波動。然後,進一步採集某一類刀具從正常使用到崩刃的全生命週期的電流資料,從中找到能夠反映刀具磨損趨勢的特徵。經過驗證,筆者構建的卷積神經網路(convolutional neural network,CNN)可以使刀具異常狀態檢測的準確率達到96%。

2.1 問題描述

根據實際生產製造中的資料統計得知,20%以上的數控機床停工是由刀具的過度磨損引起的。及時更換刀具能夠將機床的利用率提高至150%,並且節約30%以上的成本。為了及時更換過度磨損的刀具,防止過度磨損的刀具對機床部件造成損壞,傳統的辦法主要有兩種:一種是計數法,根據經驗對刀具設定極限加工次數,在刀具達到這個加工次數之後,無論好壞都將其廢棄,這種方法的優點在於對刀具壽命進行了管理,缺點在於有些刀具在達到設定的極限加工次數後還能夠繼續使用,從而造成浪費,或者有些刀具在達到極限次數之前就已經損壞,從而影響生產質量;另一種方法是通過對加工完的工件進行質檢來判斷機床的刀具是否正常,這種方法的優點是能夠克服刀具壽命管理“一刀切”的問題,但缺點在於質檢滯後於生產,在檢測出廢件的時候往往已經有一批廢件產生了。

為了解決傳統方法的不足,一個更加科學的方式是在刀具發生異常的極短時間內進行響應:提醒工人換新刀,或者機床自動換新刀。實際上,在加工過程中直接測量刀具的磨損程度幾乎是不可能的,但是,刀具的磨損狀況是可以從聲音、振動、切削力,甚至從電流負載變化反映出來的。

在這裡我還是要推薦下我自己建的大資料學習交流qq裙: 957205962, 裙 裡都是學大資料開發的,如果你正在學習大資料 ,小編歡迎你加入,大家都是軟體開發黨,不定期分享乾貨(只有大資料開發相關的),包括我自己整理的一份2018最新的大資料進階資料和高階開發教程,歡迎進階中和進想深入大資料的小夥伴

2.2 解決思路

本文采取測量機床電流負載的方式,證實數控機床主軸電流負載的變化與刀具磨損程度之間的相關性是存在的。主流數控系統對主軸變速系統進行了閉環設計,即刀具在加工時能夠通過感測器將轉速恆定在設定數值。假定數控機床主軸夾載的刀具會根據磨損狀況影響主軸轉速,而主軸負載電流則能夠通過調整來穩定主軸轉速。於是筆者猜想,通過觀測主軸電流變化能夠預測出刀具的磨損程度。因此,需要研究以下幾個問題。

(1)負載電流能否反映出刀具磨損度的變化

筆者希望在刀具磨損以及出現異常狀況(如刀具崩缺)的過程中,在電流負載上找到能夠反映出刀具磨損度變化的趨勢,於是在機床電氣箱內部加裝了高精度的霍爾感測器(電流感測器),用來採集機床的主軸電流訊號,再通過時域、小波域等特徵進行分析。

(2)電流負載和刀具磨損程度之間的聯絡能否實時檢測出刀具的磨損程度

筆者將採集某一特定種類的數控刀具從正常使用到異常(例如崩刃)過程中的電流資料,並用“刀具崩刃”“刀具正常”這兩個標籤將資料進行分類。在這個過程中,需要確定一些能夠反映刀具磨損趨勢的特徵。筆者構建了一個簡單的卷積神經網路,並用這些特徵資料做訓練測試,從而計算模型對刀具崩刃檢測的準確率。刀具實時性檢測主要由資料的實時性決定,筆者採用的霍爾感測器取樣率為每秒20000個數據點,足以識別出極短時間內的電流變化,達到實時檢測的目的。而模型檢測存在一定的延時,這主要是受特徵資料的時間跨度(即輸入資料的大小)、計算機的運算速度的影響。

通過測量數控機床主軸電流資料,對機床刀具出現的異常狀況進行建模,從而挖掘出這些電流資料中的潛在價值。在實驗中,主要解決3個問題:證明電流分析刀具磨損的可行性;找出能夠反映刀具磨損的特徵;通過神經網路的方法檢測刀具崩刃。

在實驗中,筆者抓取到的原始電流訊號往往雜亂無章,因此在證實電流分析方法可行性之前,需要在原始電流訊號上進行特徵處理,找出能夠反映刀具磨損變化趨勢的特徵,並且保證該特徵在大多數的刀具電流訊號上能夠反映出變化趨勢。另外,一個特徵往往是不夠的,不具備可靠性,因此需要從多個角度進行多個特徵的分析。最後,將找出的特徵作為模型輸入,訓練筆者設計的演算法模型。

3 實驗過程及結果分析

3.1 實驗環境

該實驗使用霍爾感測器和NI資料採集卡對數控機床的主軸電流訊號進行採集,採集頻率為每秒20 000個數據點,機床的主要加工資訊見表1。

 

 

3.2 時域分析與特徵工程

因為採集到的電流訊號是一種時序訊號,常見的時域、頻域訊號分析方法有均值、方差、峰峰值、偏度、峰度、快速傅立葉變化、短時傅立葉變化、能量百分比分析、小波變換等。筆者發現電流訊號在時域特徵上有著明顯的變化,並且從均值、方差、峰峰值、峰度、偏度上進行了特徵分析。

電流的均值往往表徵了一段時間內電流的穩定性和訊號的變化中心,通常對電流的分析是基於電流有效值進行的,從計算效率上考慮,本文通過計算電流值的絕對值求解電流在一段時間內的均值,從而進行分析,如式(1)所示。

 

 

 

電流的方差描述了資料偏離平均值的程度,同時還揭露了資料之間的波動程度,其計算式如下:

 

 

電流的峰峰值描述了訊號中最大值和最小值之差,也往往被用於檢測整個訊號段的波動大小,如式(3)所示。

 

 

 

峰度描述了頻率分佈曲線的峰值和資料分佈的平坦程度。峰度通常可以在異常檢測問題中取得良好的結果,高峰度意味著方差的增加是由低頻率大於或者小於平均值的極端差值引起的,如式(4)所示。

 

 

 

偏度描述了實際隨機變數概率分佈的不對稱性。偏度為0,意味著資料均勻分佈在平均值兩側;偏度為負,意味著大多數資料在平均值的右側;偏度為正,表明大多數資料在平均值的左側。偏度的計算式如下:

 

 

 

本文分別對5 把數控刀具的全生命週期電流訊號以1 s、1 min為時間跨度進行了時域分析,實驗中5 把數控刀具的分析結果是平行的,考慮到資訊冗餘,本文以1把刀具的特徵分析為例,取得的分析結果如圖1、圖2、圖3所示。

 

 

圖1 

 

 

圖2 時間跨度為1 s的時域分析

 

在這裡我還是要推薦下我自己建的大資料學習交流qq裙: 957205962, 裙 裡都是學大資料開發的,如果你正在學習大資料 ,小編歡迎你加入,大家都是軟體開發黨,不定期分享乾貨(只有大資料開發相關的),包括我自己整理的一份2018最新的大資料進階資料和高階開發教程,歡迎進階中和進想深入大資料的小夥伴

圖3 時間跨度為1 min的時域分析

去除不必要的電流資料之後,筆者分析了均值、方差、峰峰值、峰度、偏度等在數控刀具的全生命週期上的特徵表現情況。可以看出,在時間跨度為1 s的時域分析中只能發現在生命週期的尾部有一個突變,而對於刀具磨損的趨勢卻反映得不太明顯,這可能是因為圖中的資料點仍然很多(原始影象中每分鐘120萬個資料點),於是將時間跨度改為1 min,又進行了時域分析。

通過對比可以看出,時間跨度為1 min 的影象更平滑,並且趨勢變化更明顯,這也是很容易理解的,因為時間跨度的提升相當於對訊號做了一種類似於平滑處理的操作。在時間跨度為1 min的時域分析中,不僅在尾部出現了較大的波動,並且也體現出了明顯的上升趨勢,這與刀具磨損的物理現象是吻合的。普通銑刀在加工過程中,隨著表面磨損的增加,其與工件的接觸面也增加,從而造成機床負載的增加,並最終反饋於電流上,電流呈現逐步上升的趨勢。在刀具嚴重磨損到崩刃的時候,刀具在物理形態上出現了變化,大多數情況是崩缺,刀具上缺了一小塊,使得刀具與工件的接觸面突然少了,這使得機床負載也突然減少,但是現代機床具有負載補償的功能,在刀具崩刃之後,機床會開始補償,於是負載在驟然下降後又會上升,而負載上的變化又會反映在電流訊號中。通過檢查現場工作人員記錄的加工情況表(見表2)與實驗的時域分析圖的對應情況,進一步驗證了本文的結果。

 

 

表2展示了數控刀具在加工過程中的切削聲音情況。由於現場加工環境惡劣且複雜,在加工過程中用儀器直接測量刀具磨損狀況十分困難,故在實驗中由現場工作人員根據經驗記錄當前機床加工的聲音。在時間跨度為1 min的實驗中,發生驟變的時間點是加工到58 min時,這與加工情況表中機床切削出現尖銳切削聲表明刀具崩刃的時間在同一個區間。通過監測刀具的整個生命週期可以看出,刀具磨損在電流訊號上的表現趨勢與刀具磨損在物理意義上的變化是相符的。本文在同等加工情況下進行了5 次實驗(即5把刀的全生命週期),都得到了類似的變化趨勢,由此證明了電流方法的可行性,同時也提取出了能夠很好地反映刀具磨損的特徵:均值、方差、峰峰值、峰度、偏度。峰度和偏度從兩個不同的角度展示了刀具崩刃的驟變情況,呈現出了與均值、方差、峰峰值類似的變化趨勢,因此也將其作為神經網路的輸入,以幫助網路進行資料擬合。

3.3 小波包分析

小波包變換是在小波變換的基礎上發展起來的,具有多分辨特性,可以由粗到精逐步地對訊號進行分解分析。利用小波包分析技術進行時頻域分析,將原始訊號正交地分解到精細的、相互獨立的頻帶上,可以同時獲得時間和頻率上的區域性特徵以及通過多解析度分析得到的特徵。將各個頻帶內的訊號能量作為相應的特徵量。小波包變換效果經常受到小波基和分解層數的影響,本文使用db5 作為小波基,同時對訊號進行了5層分解,分析結果如圖4所示。

 

 

圖4 數控刀具初始加工的頻率帶能量分佈

從圖4可以看出,訊號能量主要集中在第31頻帶(0 ~312 .5 Hz)和第32 頻帶(312.5~625 Hz)內。本文對整個刀具生命週期中這兩個頻帶的能量進行了分析,分析結果如圖5所示。

 

 

圖5 第31頻帶、第32頻帶的能量分佈

從圖5可以看出,這兩個頻帶都表現出了明顯的變化趨勢:第31頻帶隨著加工時間的增加,能量逐漸下降,在刀具崩刃之後,能量又逐漸上升;第32頻帶隨著加工時長的增加,能量逐步增加,並在刀具崩刃後下降。

通過對電流訊號進行頻域、時頻特徵分析,從多個特徵域中發現了電流隨刀具磨損變化而產生的上升趨勢或下降趨勢的特徵,在模型訓練和檢測中,本文選取了均值、方差、峰值、峰度4個特徵作為網路的輸入特徵。

3.4 斷刀檢測

經過驗證,神經網路往往比傳統機器學習演算法具有更好的頑健性、表達能力和學習能力,筆者期望神經網路的這些優點可以穩定、準確地檢測出刀具崩刃。筆者從CN N 和傳統的反向傳播(backpropagation,BP)神經網路著手,對電流訊號進行擬合訓練測試,並對比兩種網路的表現能力。神經網路相關引數見表3。

 

在這裡我還是要推薦下我自己建的大資料學習交流qq裙: 957205962, 裙 裡都是學大資料開發的,如果你正在學習大資料 ,小編歡迎你加入,大家都是軟體開發黨,不定期分享乾貨(只有大資料開發相關的),包括我自己整理的一份2018最新的大資料進階資料和高階開發教程,歡迎進階中和進想深入大資料的小夥伴

其中,CNN的具體框架如圖6所示。受計算資源和資料的限制,5層神經網路引數(神經元權重引數接近5億)已經具備擬合訓練資料的能力,實際上也正是如此,本文設計的網路在訓練集上已經達到了過擬合,具有足夠小的偏差,此時更需要做的是使用一些正則化方法來減少網路的方差。本文在網路的1、2、3層的卷積層後添加了批標準化層以減小過擬合,並認為小卷積核能夠提取更細緻的特徵,Adam方法可以幫助網路更快速、安全地到達網路最優點。本文共有4 0 4 個數據樣本,52 080 000個數據點,在每次網路的輸入批次中,隨機抽取了正常加工資料和刀具斷刀資料,並且比例為1:1。最後,通過對網路的訓練和測試得出的實驗結果見表4。

 

 

圖6 卷積神經網路的設計框架

 

 

本文將準確率作為度量標準,CNN取得了96.46%的準確率,BP神經網路取得了86%的準確率。CNN的96.46%準確率在正樣本(正常加工樣本)中表現很好,正樣本預測全部正確,剩餘的3.54%錯誤率主要表現在對負樣本(斷刀資料樣本)的預測上。筆者分析,主要有兩方面原因:一是負樣本與正樣本之間分佈差異較大,並且不同的刀具負樣本之間分佈差異也較大;二是負樣本資料量少,網路的引數大部分用於擬合正樣本資料,而對負樣本資料的擬合情況較差,因為在加工生產中負樣本獲取的成本較高,所以在實際中獲取大量可利用的負樣本資料從而減少網路的方差,也是不太符合實際的。但是網路9 6 .4 6% 的準確率依然表現了神經網路的優勢,達到了較為滿意的效果,並驗證了通過神經網路的方法檢測刀具崩刃的可行性與應用前景。

3.5 異常檢測網路

從異常檢測 的角度來看,負樣本少、樣本奇異是異常檢測問題的特徵之一,刀具崩刃是一種典型的異常檢測問題。在異常檢測中,異常點與正常點通常有著較大的差異,因此,閾值法是異常檢測問題中一種常用的方法。筆者發現,同一個加工環境下不同刀具的正常加工往往類似,但是刀具發生崩刃的異常情況卻各不相同,因為沒有包含所有斷刀形式的資料集,所以使用普通CN N很難擬合負樣本情況。針對這類問題,提出了一種不同於一般CNN方法的異常檢測卷積神經網路(convolutional neural network using anomaly detection,CNN-AD)方法。在訓練階段,CNN-AD只使用正常樣本訓練,而在測試階段,通過設定閾值判斷網路的損失值是正樣本還是負樣本。在實驗中,CNN-AD的結構與之前設計的CNN結構相同,不同的是在網路的訓練集中只有正樣本,即CNN-AD 訓練階段只對正樣本進行擬合。在測試階段,CNN 通過softmax層輸出的是概率,而CNN-AD取消了softmax層,最終的輸出為網路的損失函式值。本文設定了一個閾值(如設定閾值為1),用以根據損失值劃分正負樣本。在測試階段,加工前期的正常樣本輸入網路中產生的損失函式的值極低,接近於 0;而加工後期,刀具崩刃的異常樣本輸入網路中產生的損失函式的值與正常樣本的差異巨大,通過閾值很容易將其區分開。在訓練階段,網路只對正樣本進行訓練,因此所有引數都用於擬合正樣本資料。在測試階段,異常樣本與正樣本差異較大,網路沒有訓練負樣本的“經驗”,從而產生較大的損失函式的值。這樣就可以使用閾值很好地將正負樣本區分開。

除了對CNN-AD進行測試以外,本文還構建了其他網路作為比較,包括CNN、BP、SVM。其中BP和CNN的架構和模型資料與第3 .4節中的一樣,不同的是通過PCA方法SVM的輸入資料維度從7 200×4 降到了1×4。同樣使用準確率作為主要度量標準,但是引入了召回率和F1-Score作為參考,其實驗結果見表5。

 

 

刀具破損檢測是典型的異常檢測問題。因此,選擇召回率和F1-Score作為評估標準更為合適。從表5可以看出,CNN-AD表現最佳,準確率為100%,這可能是由正樣本與負樣本差異較大並且資料集不全面導致的。CNN、BP 和SVM的效能不如CNN-AD,這可能是由正負樣本比引起的。因為與正常加工相比,刀具崩刃的時間非常短,1把刀具的完整生命週期中往往只有少數幾個負樣本,但是卻有幾十個正樣本。另外,每把刀具崩刃在電流訊號中的表現(例如電流幅度的差異或變化趨勢)不同。這些原因使得網路不能很好地擬合負樣本。SVM在正樣本判斷中表現良好,但在異常情況檢測中表現不佳,負樣本檢測全部錯誤,筆者分析可能是因為正樣本和負樣本之間的差異不足以讓SVM找到最佳分割點。

在實驗中,CNN-AD收斂速度最快,BP次之,CNN需要花費更多的迭代次數才能完成收斂。CNN-AD只用了不到10次的迭代就完成了收斂,這是因為CNN-AD只使用正樣本進行訓練,而不需要考慮對負樣本的擬合,不同正樣本之間差異不大,網路不需要太多的引數就可以完成擬合,因此只需要很少的迭代次數就達到擬合收斂。BP收斂速度快於CNN,但 BP的測試結果卻在波動,其準確性有時超過 8 0%,有時卻低於 6 0%,這是由於BP的引數較少,不能很好地提取出崩刃和正常樣本之間的關鍵特徵。相比 BP的結果,CNN較為穩定,CNN在網路收斂之後,準確率穩定在9 5%以上。這是由於 CN N更復雜且引數數量超過 BP,能夠擬合更多的資料情況,而BP的結構相對簡單,易於收斂。

3.6 討論

在C N N 的方法中,網路的準確率主要表現在對正樣本的識別效果很好,而對負樣本的識別效果不佳,於是本文提出了CNN-AD,利用正負樣本之間的差異,不使用負樣本進行訓練,以這種方式減少負樣本對預測準確率的影響,但是該方法依賴於正負樣本之間的差異性,因此該方法存在侷限性。神經網路的效果依然還有較大的提升空間,而這些提升空間主要表現在減小網路方差上。從目前機器學習領域內可以瞭解到有兩個方向有助於網路擬合負樣本,同時也將是筆者進一步的研究方向。

(1)生成模型

生成式對抗網路( generative adversarial network,GAN是目前機器學習領域的研究熱點之一,G A N 得到了很大的擴充套件,例如:CGA NInfoGAN、DCGAN、WGAN等,學術界已經出現了GAN 變種方法,能夠取得很好的生成效果。筆者期望通過GAN生成類似於負樣本分佈的資料,從而間接地增加負樣本數量,使網路更好地擬合負樣本。

(2)遷移學習

遷移學習主要包括同構遷移和異構遷移,而很多方法採用的將源域分佈空間與目標域分佈空間對映到一個共同潛在空間,或者使源域對映空間與目標域對映空間優化,使其儘可能相似的思想,也被稱為對稱變換和非對稱變換。對於不同的加工環境,電流資料的分佈也不同,這也叫作資料集偏差,直接使用這些資料有可能使網路效果更差。筆者希望通過遷移學習將不同的機床資料變為可利用的資料,這樣就間接增加了資料量,也增強了網路的頑健性和適應性。

本文介紹了大資料與智慧製造的概況,並且通過一個智慧製造的實際案例讓大家認識到在實際工業場景中使用深度學習進行智慧化的生產製造是可行的。筆者發現,對於過去需要依靠工人的知識與經驗進行判斷的場景,現在可以用大資料技術來代替,可擁有更高的效能提升並節約成本。雖然本文的本研究仍然有進一步提升的空間,但是本文的研究邁出了深度學習在智慧製造運用中的重要一步,為智慧製造的發展提供了新的研發思路。

在這裡我還是要推薦下我自己建的大資料學習交流qq裙: 957205962, 裙 裡都是學大資料開發的,如果你正在學習大資料 ,小編歡迎你加入,大家都是軟體開發黨,不定期分享乾貨(只有大資料開發相關的),包括我自己整理的一份2018最新的大資料進階資料和高階開發教程,歡迎進階中和進想深入大資料的小夥伴