1. 程式人生 > >基於PaddlePaddle的新能源充電樁智慧運維

基於PaddlePaddle的新能源充電樁智慧運維

隨著大資料、人工智慧、雲端計算技術的日漸成熟和飛速發展,傳統的運維技術和解決方案已經不能滿足需求,智慧運維已成為運維的熱點領域。同時,為了滿足大流量、使用者高質量體驗和使用者分佈地域廣的網際網路應用場景,大型分散式系統的部署方式也成為了高效運維的必然之選。如何提升運維的能力和效率,是保障業務高可用所面臨的最大挑戰。本篇文章以百度基於PaddlePaddle的新能源充電樁為切入點,深入介紹智慧運維在電力行業的實際應用。

以下為演講實錄

電力行業運維過程中的痛點與機遇

眾所周知,典型電力行業包括髮電、輸電、配電、用電等多個階段,而電力作為關係國計民生的重要資源,在各個階段無論針對電網或是終端裝置的執行維護都是保障電網安全穩定執行的重要手段。此外,目前中國已經建成全球範圍內資訊化程度最高的電網,而電網的工程師們仍在持續學習和引入新技術,大資料和深度學習是他們重點關注的方向。我們發現,針對電力運維,有三個典型的場景比較適合大資料與深度學習技術,包括: 1.電網裝置維護:通過對電網電能質量分析系統、分散式監控系統產生的資料進行學習,實現故障提前預警,減少電網裝置運維成本; 2.規劃電網排程:通過對氣象資料、使用者行為資料等分析建模,實現用電管理,優化電網排程提升效率; 3.用電異常識別:通過對終端裝置,如智慧電錶的資料分析,實現用電異常識別,降低用電損失提升效率。

基於電力行業四大特點,充電樁智慧運維需要新的技術方案 在這裡插入圖片描述 圖一:電力行業四大特點

電力行業有四大特點: 1.市場規模大:發改委在2015年頒佈的《充電樁建設指南》指出,計劃到2020年全國建成超過480萬個充電樁,圖中為根據指南及目前市場情況的測算,到2020年整個市場規模將達900億。而2017年全國保有量為21.3萬個,僅北京地區已超3萬個,一方面鮮有保有量已經不小,此外從今年開始將是充電樁建設的高速爆發期; 2.強制性檢測:國家電網要求存量市場充電樁每年必須定期檢查並出具報告,新增充電樁全部聯網並要求強制測試。如果沒有運維保障,一旦出現問題就有可能帶來車毀人亡的重大事故; 3.運維成本高:現場故障多,環境複雜,造成現場運維人力成本高; 4.行業痛點強:目前針對充電樁運維已經有技術方案,但傳統廠商一般基於傳統資料庫搭建方案,一旦出現增量上網,很難應對大資料和擴容的挑戰。此外由於缺乏資料探勘的工具和知識,資料利用率不高。基於以上四個特點,充電樁智慧運維需要新的技術方案。 在這裡插入圖片描述

圖2:充電樁智慧運維新方案

在此背景下,我們和博電電氣聯合提出了充電樁智慧運維新方案。博電電氣是行業領先的電力測試裝置供應商,主要服務國家電網、南方電網和海外電網運營商。在這套新的方案中,我們通過一攬子技術方案包括底層的物聯網裝置接入、邊緣計算,到中層的雲端計算平臺,上層的大資料平臺,解決裝置管理複雜、擴容難等問題。同時,基於百度AI能力,我們搭建了多種運維模型,包括裝置監測,到故障診斷,到預測性維保。以充電樁故障診斷為例,基於傳統資料分析工具如matlab、labview和本地計算資源,已經達到95%的故障識別率。但我們通過PaddlePaddle的深度學習和分散式計算,比較容易的就將準確度再提升了4個點,並給客戶帶來了經濟價值。

在這裡插入圖片描述

圖三:基於PaddlePaddle的充電樁異常診斷建模

提問環節 提問:充電樁如何聯網? 趙喬:本身充電樁是離線的,我們採取的是在充電樁上出一個加了硬體的槍頭,這個硬體裡面跑的是模型和功能等等,除模型外,上面還加了3G的模組,這個模組就是支援IOT標準的工業企業,這樣就能聯網了。

提問:資料如何上傳到雲端到伺服器? 趙喬:資料會直接傳上去。演算法分別跑在本地和雲端,其中會有一部分跑內部端,在演算法要求高實時反饋的情況下,如閉環的反饋是在毫秒級,那演算法就要跑在前端,這是不能特別複雜的模型。 提問:通訊技術很複雜嗎? 趙喬:不復雜,是一個標準的通訊技術,跟4G一樣的業界標準,且本身底層演算法不需要開發。

提問:我們現在的演算法要上傳到伺服器,是在雲區,有沒有什麼解決方法。 趙喬:我們之前的演算法在海上訊號不好,但是有專用的工業wifi,可能距離是15米,但軟體會比較麻煩。比如先快取,等聯網了再斷,這樣很麻煩。我覺得這個沒有辦法繞開,如果你的應用要求聯網必須一直聯,可能通過軟體很難做,你只能通過考慮硬體,我們之前想專門用工業WIFI,功率很強。

提問:我在做LT的預算,利用RFID感測器,採集相當大的wifi訊號資料,現在遇到的幾個問題,第一個問題是呼叫的人工智慧的演算法,對硬體的算力要求比較高,想問老師是怎麼看這個問題? 趙喬:跟你跑的模型有關係,需要執行的是引擎,比如百度的ERE,需要知道部署地方的環境,會佔資源,百度的佔十兆資源,還有的不用考慮,編譯好的直接下去。 提問:一部分是在本地,另一部分在雲上? 趙喬:雲上很少,雲上的算力比較大,相當於是不斷訓練模型,但是在端上用,我們的部分是跑在AIM上,其實端不一定是嵌入式,也可以是牽扯硬體,如筆記本。

提問:百度雲平臺對IOT開放嗎? 趙喬:可以,你可以在上面搜百度雲天工。

提問:我想問規劃處理,你們有非數值型別的資料嗎?是一串字串。 嘉賓女:我們處理這個,只涉及到數值類的,非數值的就是詞項量,你算一些方法嘗試一下。 提問:非數值型別的怎麼處理? 嘉賓女:變成向量。 提問:如果這個字串不是固定的,有可能是千變萬化的。 嘉賓女:你規劃的目的是什麼? 提問:不會像詞向量那樣,詞可能是約定好的一萬個,可能有很多種,無法做到詞向量。 嘉賓女:還是要回歸到解決問題是什麼,你的目標是想看一下訓練資料的多樣性,你就可以用資料統計的方法設計一些。 提問:我的場景是日誌分析,有很多資訊,如使用者名稱、使用者名稱的操作方法,這樣會產生很長的字串,也有很短,那這部分資料怎麼處理。 嘉賓女:給大家分享我們在公司內做專案或者做To B的專案遇到這些問題的思考路徑,上述問題是兩個方向,一個方向是怎樣使得資料更乾淨,讓我確定這個資料對我是否有價值;另外一個問題,這些資料拿到了怎樣去應用。第一個問題,百度的已有資料用的是統一的格式,所以做一些標準和定義。第二個問題,這些資料怎麼用,要想好你要解決的目的是什麼,目標是什麼,用我們掌握的技術和經驗去變通找到方法。

提問:比如說95%提升到99%,提升了4%,提升的那4%具體體現的是什麼? 趙喬:我們和客戶合作是通過大量已有的功能仿生出來,在模型裡跑。4%怎麼算出來的,傳統的是95%,我們拿著這4%,實際上就是0%。無法檢測的資料拿過來,在這上面我們最後做到86%,所以綜合下就是提升4%。

提問:診斷之後,故障的維護也是我們這邊直接去完成? 趙喬:不是,我們做預警或者提前一天或者提前半天預警,但維護還是要人力做的。

提問:那我們現在這個診斷系統,同時可以處理多少個裝置的診斷? 趙喬:目前因為我們在合作的客戶實際上是負責了國家電網超過一半的充電樁,所以如果是說後續要增加的話,需要買更多的資源擴容,之所以是分散式系統,這是比傳統系統的優勢。

提問:我們現在存在多個裝置需要診斷的話,診斷也是併發性的了? 趙喬:沒錯,剛才所說的這些模型很多是跑在端上的,對於雲上的資源的依賴度沒有那麼大,只不過是把處理出來的資料在雲上做監測,理論上來講所有東西都跑在這裡,所以對這一部分的壓力不算很大。我們做一款硬體,實際上有類似於裝置標籤,如果用過MPD的話就專門針對這種標籤進行設計的。

提問:這個產品已經在實際用了是嗎? 趙喬:我們2月份在做,今年7月份在百度開發者大會上公佈出來,因為這是個典型的To B的產品,不是To C的產品,不是天貓上可以賣,所以有To B的流程。我們給國家電網報了3萬份的報備量,但是這裡面還有一些沒有解決的問題。之前提到的模型,我們現在只做了其中一部分,真實使用還有很多東西需要去做。

提問:在建模過程中,建模和深度學習的關係,是串聯還是並聯。 趙喬:我們當時做了兩個演算法比較,想看深度學習PaddlePaddle的結果,最終比較驗證,這是並聯關係,不是串聯。

實錄結束

趙喬,百度大資料部高階產品經理,負責百度工業大資料產品規劃及專案落地。曾在華為、美國國家儀器從事產品、技術、銷售工作,服務新能源、國防軍工、汽車等典型製造業企業。