1. 程式人生 > >深度學習在高德ETA應用的探索與實踐

深度學習在高德ETA應用的探索與實踐

1.導讀

駕車導航是數字地圖的核心使用者場景,使用者在進行導航規劃時,高德地圖會提供給使用者3條路線選擇,由使用者根據自身情況來決定按照哪條路線行駛。

同時各路線的ETA(estimated time of arrival,預估到達時間)會直接顯示給使用者,這是使用者關心的核心點之一。使用者給定起點和終點後,我們的任務是預測起終點的ETA,ETA的準確率越高,給使用者帶來的出行體驗越好。

2.基於深度學習模型的探索和實踐

2.1模型選擇

傳統機器學習模型在ETA中,比較常用的有線性迴歸、RF(隨機森林)、GBDT(梯度提升決策樹)等迴歸預測類模型。線性模型表達能力較差,需要大量特徵工程預先分析出有效的特徵;RF通過樣本隨機和特徵隨機的方式引入更多的隨機性,解決了決策樹泛化能力弱的問題;GBDT是通過採用加法模型(即基函式的線性組合),以及不斷減小訓練過程產生的殘差來達到迴歸的演算法。

傳統機器學習模型相對簡單易懂,也能達到不錯的效果,但存在兩個問題:

  • 模型的表達能力跟選取的特徵有關,需要人工事先分析出有效的特徵。
  • 沒有考慮上游對下游路段的影響,產生了如丟失上下游關聯資訊、下游受上游影響導致的不確定性等問題。

第一個問題很好理解,深度學習模型能很好地彌補這方面。針對第二個問題,以歷史速度資訊選取存在的不確定性為例來說明一下,歷史速度資訊是一個區分週一到週日七個工作日、10分鐘間隔的歷史平均時間,可以根據該路段的預計進入時間所在10分鐘區間來選定。如下圖(歷史平均速度)從0:00-24:00的變化曲線,可以看到一天中特別是早晚高峰,速度值存在較大波動。

而在選取歷史平均時間時,依賴的是預計進入時間,這個時間依賴於上游路段的預計通行時間,因此其選取存在不確定性,進而導致ETA計算不準確。

考慮到以上問題的存在,我們選擇利用RNN的時間序列思想將路線中上下游路段串聯起來進行路段ETA的預測。

另外考慮到RNN存在的長依賴問題,且結合實際業務情況,我們選擇使用LSTM模型來進行建模,LSTM的門結構具有的選擇性還能讓模型自行學習選擇保留哪些上游的特徵資訊進行預測。

2.2網路架構

上圖為整個模型的框架圖,主要分為兩部分,使用LSTM模組對路線中的路段ETA的預測和最終使用N層全連線模組對累計路段ETA及路線各特徵進行完整路線的ETA預測。

2.3路段ETA預測

上圖為各路段ETA預測使用的LSTM結構圖,Xt為路線中第t個路段的特徵資訊,主要包含對應的實時路況資訊、歷史路況資訊、路段的靜態特徵等。

LSTM本是輸入時間序列資料的模型,我們利用該思想,將路線中各路段序列依次輸入模型。

2.4完整路線ETA預測

在LSTM模組得到累計路線ETA預測值後,結合該路線的靜態屬性,使用全連線模組將其整合成最終輸出的完整路線ETA預測值。

路線的屬性特徵主要指一些人工提取的特徵,如該路線的長度、導航規劃發起特徵日、是否早晚高峰時段等,用以加強模型在不同場景下的表達能力。

損失函式選用線性迴歸常用的平方形式:MSE,公式如下:

其中,N是路線數量,ETA路線j為路線ETA,即預測值;使用者實走j為使用者在該路線的實走時間,即真值。

3.模型效果

衡量模型效果,即路線上ETA的預測值時,主要考慮的是準確率。一般情況下,使用者對ETA偏長和偏短的容忍度不同,對偏長容忍度更高。比如使用者要去機場,ETA給的時間偏短10分鐘比偏長10分鐘對使用者的損害更大。因此準確度的指標設計傾向於ETA偏長,定義為滿足使用者一定容忍範圍的請求比例,即準確率作為主要衡量指標。

在北京市上的實驗結果顯示,ETA準確率得到提升,MSE loss下降比例28.2%,效果有了明顯的提升。

4.小結

本文介紹了引入深度學習模型,幫助建模導航規劃的預估到達時間預測,成功解決了線性模型的不足,也為後續引入更多特徵、進行更多探索打開了空間,如歷史速度資訊的不確定度、時效性、週期性、突發事件、路網結構等。

相關推薦

深度學習ETA應用探索實踐

1.導讀 駕車導航是數字地圖的核心使用者場景,使用者在進行導航規劃時,高德地圖會提供給使用者3條路線選擇,由使用者根據自身情況來決定按照哪條路線行駛。 同時各路線的ETA(estimated time of arrival,預估到達時間)會直接顯示給使用者,這是使用者關心的核心點之一。使用者給定起點和終點

深度學習駕車導航歷史速度預測中的探索實踐

導讀 駕車導航服務是數字地圖提供的核心功能。通常而言,使用者在發起導航之前會對比高德前端展示的三條路線(如下圖),以決定按照哪條路線行駛。     而預估到達時間是使用者參考的最為重要的指標之一。給定一條路線,對應的預估到達時間的計算需要兩組資訊輸入,分別是實時路況資訊和

深度學習入門:基於Python的理論實現 清中文版PDF電子版下載附原始碼

本書特色1.日本深度學習入門經典暢銷書,原版上市不足2年印刷已達100 000冊。長期位列日亞“人工智慧”類圖書榜首,超多五星好評。2.使用Python 3,儘量不依賴外部庫或工具,從零建立一個深度學習模型。3.示例程式碼清晰,原始碼可下載,需要的執行環境非常簡單。讀者可以一邊讀書一邊執行程式,簡單易上手。4

深度學習入門:基於Python的理論實現 清中文版PDF電子版下載附源代碼

圖形 alexnet 1.7 法則 門電路 版本 求解 ·· 訪問 本書特色1.日本深度學習入門經典暢銷書,原版上市不足2年印刷已達100 000冊。長期位列日亞“人工智能”類圖書榜首,超多五星好評。2.使用Python 3,盡量不依賴外部庫或工具,從零創建一個深度學習模型

(自我學習篇之地圖)使用獲取marker的點選事件

獲取之後下載SDK然後倒入libs用什麼導什麼我先簡單說一個2D的實現與獲取marker的點選事件  3d的多了一步   OK就可以使用了   注意許可權 <uses-permission android:name="android.permission

深度學習在搜尋業務中的探索實踐

本文根據美團高階技術專家翟藝濤在2018 QCon全球軟體開發大會上的演講內容整理而成,內容有修改。 引言 2018年12月31日,美團酒店單日入住間夜突破200萬,再次創下行業的新紀錄,而酒店搜尋在其中起到了非常重要的作用。本文會首先介紹一下酒店搜尋的業務特點,作為O2O搜尋的一種,酒店搜尋和

衛星影像識別技術在資料建設中的探索實踐

導讀對於地圖服務而言,地圖資料的準確率和覆蓋率是服務質量的關鍵因素,而地圖資料的更新,依賴於多種資訊源,如軌跡熱力,實採影象,衛星影像等。近年來,由於遙感衛星數量的增多及高解析度光譜相機的出現,以及衛星影像圖自身覆蓋廣、視角好、資訊豐富的特點,衛星影像作為地圖資料更新的資訊源起到了越來越重要的作用。 對於衛星

【Spark深入學習 -14】Spark應用經驗程序調優

aps 它的 stack 申請 vco 用戶 統一 persist 資料 ----本節內容------- 1.遺留問題解答 2.Spark調優初體驗 2.1 利用WebUI分析程序瓶頸 2.2 設置合適的資源 2.3 調整任務的並發度

數據挖掘機器學習——weka應用技術實踐

lin 網絡服務 開發 對數 結果 gre 枚舉 挖掘 int 第一章 weka介紹 1.1 weka簡介 weka是懷卡托智分析環境(Waikato Environment for Knowledge Analysis)的英文縮寫,官方網址為:<htt

15天倒計時:深度學習端講座免費聽,最後200位贈教材名額!

技術講座 深度學習 tensor 深度學習是對使用多層神經網絡過程進行機器學習的統稱。目前已經被應用到圖像識別,語音識別,自然語言處理,機器翻譯等場景並取得了很好的行業應用效果。由谷歌研發的新一代深度學習工具Tensor Flow,於2015年底正式向公眾開源。Tensor Flow技術是當前最值

深度學習在 CTR 中應用

核心 融合 輸出 -s 情況 ... 能夠 rec 數據 歡迎大家前往騰訊雲技術社區,獲取更多騰訊海量技術實踐幹貨哦~ 作者:高航 一. Wide&&Deep 模型 首先給出Wide && Deep [1] 網絡結構: 本質上是線性模

深度學習深刻理解和應用--必看知識

3.1 講解 target 社區 github flow deep 卷積 work 1.深層學習為何要“Deep” 1.1 神經網絡:從數學和物理兩視角解釋,見:https://zhuanlan.zhihu.com/p/22888385 1.2 網絡加深

機器學習之路--機器學習演算法一覽,應用建議解決思路

作者:寒小陽 時間:2016年1月。 出處:http://www.lai18.com/content/2440126.html 宣告:版權所有,轉載請聯絡作者並註明出處 1.引言提起筆來寫這篇部落格,突然有點愧疚和尷尬。愧疚的是,工作雜事多,加之懶癌嚴重,導致這個系列一直沒有更新,向關注該系列的同學們

深度學習入門-基於Python的理論實現 感知機

目錄   感知機 感知機是什麼 權重和偏置的含義 單層感知機的侷限性 多層感知機 感知機 感知機是什麼 就是人工神經元 權重越大,對應該權重的訊號的重要性就越高。 權重和偏置的含義 權重是控制輸入訊號重要性的引數,偏置是調整神經元被

第一篇關於深度學習在NER上應用的綜述文章

《A Survey on Recent Advances in Named Entity Recognition from Deep Learning models》 這是第一篇關於深度學習在NER上應用的綜述文章   這篇文章比較注重多語言和多領域的基於深度學習NER的綜述

java地圖根據座標具體地址互轉,計算兩地距離

package com.shineyoo.common.utils; import com.alibaba.fastjson.JSONArray; import com.alibaba.fastjson.JSONObject; import java.io.BufferedReade

機器學習演算法一覽,應用建議解決思路 (實用!!!劃重點!!!)

1.引言 提起筆來寫這篇部落格,突然有點愧疚和尷尬。愧疚的是,工作雜事多,加之懶癌嚴重,導致這個系列一直沒有更新,向關注該系列的同學們道個歉。尷尬的是,按理說,機器學習介紹與演算法一覽應該放在最前面寫,詳細的應用建議應該在講完機器學習常用演算法之後寫,突然莫名奇妙在中間

深度學習介紹及簡單應用

引言   深度學習背後的主要原理是從大腦中汲取靈感。,這種觀點產生了“神經網路”術語,大腦包含數十億個神經元,它們之間有數萬個連線。 在許多情況下,深度學習演算法類似於大腦,因為大腦和深度學習模型都涉及大量的計算單元(神經元),這些單元在未啟用時並不是活躍的,它們彼此互動時會變得智慧化。 神經元   神經網路

Python深度學習 深度學習入門基於Python的理論實現 學習資料

《Python深度學習》由Keras之父、現任Google人工智慧研究員的弗朗索瓦•肖萊(François Chollet)執筆,詳盡介紹了用Python和Keras進行深度學習的探索實踐,涉及計算機視覺、自然語言處理、生成式模型等應用。書中包含30多個程式碼示例,步驟講解詳細透徹。由於本書立足於人工智慧的可

Python深度學習 深度學習入門基於Python的理論實現 學習資料

提高 自然語言 誤差 實用 由於 理論 進行 學習資料 獲取 《Python深度學習》由Keras之父、現任Google人工智能研究員的弗朗索瓦?肖萊(Fran?ois Chollet)執筆,詳盡介紹了用Python和Keras進行深度學習的探索實踐,涉及計算機視覺、自然語