競賽 | 全球物聯網資料創新大賽冠軍:成本降低16%,如何給垃圾車搭好路徑優化平臺
經過兩個多月的激烈角逐,2018全球物聯網資料創新大賽落下帷幕。這項比賽屬於天池大資料競賽的視覺化大賽專案,有來自全世界636支隊伍,1036名選手來參加比賽,最後決出了金銀銅三個獎項和技術實力獎、最佳設計獎、媒體特別獎、商業潛質獎四個單項獎項。
其中來自眾安科技的DVexplorer戰隊脫穎而出,獲得總冠軍。這個隊伍有三名隊員,參賽方案是垃圾車路徑優化平臺。
獲獎專案展示
賽題和資料
賽題以“智慧城市”為主題,圍繞飛鳳平臺應用開發、神經節應用開發、鴻山物聯網小鎮和慧海灣感知小鎮實時資料分析,參賽選手,選題包括但不限於城市政務、旅遊、產業、安居、環境,要求參賽隊伍分析並深挖對城市各種公共資料之間的價值,並最終以視覺化方式進行展示。
換句話說,題目開放,選題自由。
整個賽制分為初賽和複賽以及決賽,作品必須使用主辦方提供的資料集中的至少一種,鼓勵使用多種資料集。作品可以自由使用任意資料加工處理、分析挖掘和視覺化工具。
整體來說,主辦方提供了四個方向的資料,分別為城市功能區規劃、分析、選址;企業幫扶和人才優化;天氣情況、企業經營和環境治理關係分析;政府效率評估。
冠軍團隊所選擇的方向為天氣情況、企業經營和環境治理關係分析。其下的資料集有無錫市歷史天氣預報資料、無錫市公開資料、無錫市統計年鑑資料、 線上神經節資料等。在構建模型時,選手對多個數據集進行了加工處理。
關於資料質量,在接受大資料文摘採訪時,冠軍團隊這樣回答:“其他資料庫並沒有過多涉及。但清掃車部分提供了經緯度座標、時間、車牌號、車速等多維度的資訊,資料比較完整,並且資料庫中GPS定位資料是實時變化的”。
所以,處理資料並不是專案需要攻克的難點,另外在採訪中,冠軍團隊談到:“目前對多車輛、存在容量限制的行車路徑進行優化問題,仍較多停留在理論研究層面。將優化的結果進行視覺化展示,並允許使用者自定義場景,輔助使用者決策,這一類的應用案例仍比較少見,這使我們在方案與演算法的實現階段遇到了挑戰。”
垃圾車路徑優化平臺方案的目標是:在規定時間內。用最短的里程,完成清掃任務。
為了完成這一目標,採取了資料處理、拓撲網建模、數學建模、演算法優化、視覺化平臺搭建等五個步驟。
資料處理
新吳區垃圾清運現狀
資料處理分為三步,在這過程中使用了QGIS系統對路線進行了分析。
● 行駛路徑提取
● 重要節點提取
● 重要指標提取
第一步,行駛路徑提取:使用組委會提供的車輛GPS資料,提取了車輛的行駛時間,經緯度座標,以及車輛行駛的速度等等,繪製出11輛行駛路線圖。
第二步,重要節點選取:經過嚴格的計算與分析,提取了兩個重要的的節點,分別為環衛所,即開始與結束的停留點;垃圾場,即反覆出入的點。
第三步,重要指標提取:進一步分析資料可以統計出所有車輛在一天內行駛296公里,清掃33個小時,75分鐘裝滿垃圾並進行一次傾倒。
拓撲網建模
將得到的資料去繪製出清掃車經過路線圖,得出共有117個主要的頂點和165條主要經過的道路,將117個點中最主要的39個車輛經常停靠的點定義為垃圾清掃的點,並且計算出每一個點垃圾清掃時所需要消耗的時間。
數學建模和演算法優化
將目標優化函式設定為行駛里程最小值函式,並且設定了三個約束條件,第一個是限制所有車輛從環衛所出發並最後回到環衛所。第二個是限制每一個清掃點只能有一輛車進行清掃。第三個是限制車的裝載量不能超過車的總容量。
經過這些資料的輸入,比如說清掃點權重,清掃點耗時,清掃點的路徑矩陣等等輸入到演算法中,運用遺傳演算法,設定總群個體數為80,並且進行演算法的收斂,最終得出優化結果的資料。
視覺化平臺搭建
將優化結果的資料輸入到視覺化平臺工具當中,並且最終完成了垃圾車路徑優化平臺的搭建。從結果來實現了在規定時間內用最短的里程完成清掃任務。以一個有10輛清掃車的站點為例,經過優化後垃圾車可以減少行駛17500公里,這將近要繞地球半圈,同時可以將站點一年的運營成本降低16%。

模型優化結果
可以對於不同的條件進行方案的優化,比如說管理者要在規定時間內用最少車輛數進行任務的完成,比如想在早高峰8點之後完成任務,那輸入不同的車輛,最終可以得到一個方案是:需要11輛車完成這樣一個任務。
另外也可以幫助管理者去確定,在特定的時間,資源不足,任務又重的情況下如何去模擬一個方案。比如說大年初一這一天假設只有6輛車在值班,但是清掃點的垃圾會更多,通過我們的平臺可以模擬出當天車隊無法在8小時內完成這項工作,所以建議管理者額外排程一些車輛過來完成任務。
對於環境,平臺可以有效減少車輛行駛時間,從而減少環境汙染。
評委問答

Q: 你們資料分析的方法為什麼選用遺傳演算法,好處在哪裡?跟別的演算法相比有什麼優點嗎?
A: 遺傳演算法是比較簡單的,主要是分為有四步,初始值的確定,交叉運算元,編譯運算元,得出最終結果比較簡單。第二是可以拓展,這個演算法可以很容易,只要變換資料,很容易擴充套件到其他模型當中。這個模型用得比較多的還有TS用得比較多,但是TS有一個問題,它對於初始值影響比較大,因為我們這是可互動的,如果初始值影響很大的話,每次互動結果會發生非常大的偏差,所以我們當時就沒有選擇那種演算法,選擇了遺傳演算法。
Q: 優化目標函式是最短路徑,為了節省運營成本,有沒有考慮城市清潔效果?
A: 清掃是到垃圾點裝載垃圾的,而並不是清掃道路,這是根據提供資料分析出來的,只要在裝載點把垃圾裝到車上就可以達到我們的任務。
Q: 簡單介紹一下視覺化平臺的特點。
A: 他是眾安科技自己研發的視覺化平臺,最主要的功能是可以搭建資料大屏,但是也不僅僅侷限於資料大屏,可以搭建這樣一個比較簡單的互動系統。
在這次搭建中相當於除了資料分析這一部分需要對資料進行處理以外,其他所有的結構都是不需要單獨再去開發,直接使用平臺就可以完成所有前端介面的搭建和互動的搭建實現的。
這個平臺目前已經可以提供非常多圖表的樣式,包括簡單的篩選,全域性篩選等等的互動以及圖表聯動的互動模式。
本次大賽由無錫市新吳區人民政府和阿里雲端計算有限公司強強聯合,從初賽到決賽一共歷時2個多月。全球636支隊伍,1036名選手參加了此次飛鳳物聯網大賽,其中國內選手佔到84.8%,海外選手佔到15.2%。他們的職業主要有科研機構的員工、公司員工和學生組成,這一次比賽也是打破了過往天池平臺上高校學生佔比的突破,公司員工參賽佔到將近小一半的比例。
原文釋出時間為:2018-09-25