1. 程式人生 > >智能分析平臺疊加AI,觀遠數據行業首發「AI預測引擎」

智能分析平臺疊加AI,觀遠數據行業首發「AI預測引擎」

開始 梳理 日歷 用戶 又能 團隊 為我 模式 展現

前兩篇我們為大家梳理了AI的演進路程以及需求預測在AI+零售命題中的行業洞察,均取得了不錯的反響。在廣大粉絲熱烈的呼聲當中,該系列筆者觀遠產品天團-小剛同學馬不停蹄,為我們帶來了AI企劃的第三篇文章。本篇,他將首次公開觀遠智能分析平臺上「AI預測引擎」的神秘面紗!

作為觀遠數據今年重磅推出的新模塊,「AI預測引擎」不僅僅引入了先進的AI預測算法,更將觀遠數據團隊多年與諸多500強企業合作中沈澱的、符合本土日歷特征的零售數據預測經驗預置進了算法模型裏面,同時結合觀遠智能分析平臺,為本土零售企業提供從數據接入、整理、預測到展現的端到端整體解決方案。

技術分享圖片

話不多說,切入正題

觀遠數據已經幫助聯合利華、百威英博等多家500強客戶實施需求預測,有大量的零售領域數據預測經驗。我們看到,500強企業之所以願意花上百萬,甚至大幾百萬來做AI預測項目,是基於其龐大的業務體量來評估ROI後作出的選擇:

? 一方面,高質量的數據預測確實需要專業的數據科學家和分析人員深入了解業務場景,不斷叠代優化預測模型,經過長時間的錘煉才能獲得;

? 另一方面,當業務規模足夠大時,細微的預測準確度的提升都能給企業帶來巨額的利潤回報。

但同時,我們也意識到,不是任何企業都有這個資金實力去做此類高質量的數據預測的,並且在業務需求上也可能僅僅是想做一些初步預測來為決策提供參考。因此,為了滿足這類客戶的預測需求,觀遠數據的「AI預測引擎」將為他們提供 入門級的零售預測操作門檻,同時又能為他們提供 比一般的統計預測方法更精準的預測結果!

什麽是觀遠數據「AI預測引擎」?

了解過觀遠產品的朋友們都知道,觀遠數據在BI平臺裏面內置了Smart ETL智能數據處理模塊。該模塊基於Spark大數據計算引擎開發,提供拖拽式、圖形化的數據流開發方式,使得一般業務人員也能做專業的數據分析處理。

一般的ETL過程整理主要做的是數據的清洗、轉換、關聯、加載等操作,那觀遠的Smart ETL何以稱之為智能呢?這是因為Smart ETL中除了支持Spark本身自帶的函數之外,還支持自定義的UDF、UDAF函數開發,具有非常強大的智能算子擴展能力。

舉個例子,如果你想挖掘商品間的潛在聯系,開拓更多銷售機會,你就可以使用Smart ETL內置的“關聯性挖掘”這個智能算子來快速實現商品銷售關聯分析。

而「AI預測引擎」則是另一個重要的智能算子。你可以用它來做各種級別的銷售預測,大到門店,小到品類,甚至SKU的預測。有了這些可靠的銷售預測的數據,你將實現:

降低庫存金額:對於庫存成本較高的零售企業,通過銷售預測來指導進貨與庫存,在保證供給的前提下,進一步降低庫存金額,降低成本。

降低報廢風險:對於可售時長比較短的商品(比如水果、面包、鮮食),通過精準的銷售預測,來指導備貨,降低報廢率(並不是追求零報廢),節約成本。

把握銷售機會:對於潛在的銷售機會,比如節日、活動、天氣變化等,通過銷售預測來指導提前備貨,充分把握銷售機會,最大化銷售額。

指導排產、配送:對於可以做到自產自銷的零售企業來說,準確的銷售預測,還能夠將預測數據倒推到生產、配送環節,指導排產、物流。

指導人員配置,優化排班:通過分時段的銷售預測,來指導門店進行更為合理的數據化排班,最大化地利用人力成本,同時保障客戶消費體驗。

評估銷售目標的進度:通過對當前累計銷售額與未來銷售預期的預測分析,評估銷售目標的完成進度與質量。有需要的還可以及時調整銷售目標,做到敏捷運營。

增強客戶體驗:通過進銷存各個環節的預測,增強客戶體驗,避免各類因缺貨、延遲交貨、延遲發貨等情況導致的客戶消費體驗下降的情況發生。

技術分享圖片

「AI預測引擎」智能算子

在觀遠Smart ETL中,用戶僅需要拖入一個「AI預測引擎」算子,接入事先預處理好的歷史數據,然後簡單配置日期字段、預測指標,以及指標聚合維度(日/周/月/季度/年)和預測周期數,便可開始預測。預測結果可以輸出到數據集進行下一步的展示分析與決策支持。

技術分享圖片

「AI預測引擎」節點配置

觀遠數據的「AI預測引擎」主要適用於零售企業的銷售預測或需求預測。上圖所示只是一個極簡模式的預測算子。但即便配置如此簡單,卻能輸出相當精準的預測結果。

? 對 零售行業門店級別(以超市數據為例)的日商預測平均準確度達到 83%(MAPE≈17.65%),個別門店 接近 90%;

? 而細化到 單門店單品類(鮮肉類)的日商預測,準確度達到84%。

在這個基礎上,我們還能提供更多配置項,添加諸如天氣情況、促銷活動、品類級別的日期特征等外部信息,進一步提升數據預測的準確度;同時也可以提供多門店、多品類的批量預測。

架構解密

為什麽如此簡單的操作,便能實現還不錯的銷售數據預測呢?

這是因為架構層面觀遠數據將預測算法封裝成Spark UDF函數,有機地融合進Smart ETL,成為一個可點選配置的智能算子;算法層則采用了先進的算法,並將觀遠數據多年沈澱的零售行業預測經驗轉化為相應日期特征優化配置後預置進算法包裏。

如此一來,看似簡單的時序預測,其實已經包含影響零售行業銷售數據的周期性特征、節假日特征以及節前節後特征,這樣的預測自然是要比一般時序預測方法準確度提升不少了。

未來,我們還會根據不同品類的消費特征,分別給予不同的品類特征日歷,進一步提升品類甚至SKU級別的預測準確度。同時,還可以增加天氣作為額外特征,這樣對於一些極端天氣情況下的銷售預測也會進一步提升準確度了。

算法解密

具體到算法層面,為什麽觀遠的AI智能預測算法能夠比市面上通用的預測算法在預測準確度上再提升一個層級呢?

首先我們來看一般時序預測工具中常用的ARIMA模型(Autoregressive Integrated Moving Average Model)。它是一種結合自回歸與移動平均方法進行預測的模型,要求時序數據是穩定的,或者通過差分化後是穩定的,一般來說很難符合現實數據的情況。與之類似的還有GARCH模型等傳統時序方法,大都只能進行單變量的建模,局限性較大。

近年來湧現出更多復雜時序模型,以便解決實際業務中的復雜情況。例如比較有代表性的TBATS的預測模型,結合了Box-Cox轉換,趨勢擬合,ARMA建模,周期性分析等復雜技術手段來進行建模預測。它實際上是一種狀態空間模型(State Space Model)的算法實現,類似的還有隱馬爾可夫模型,RNN等也都屬於此類。這類模型主要限制是參數繁多,計算量大,在大規模時序預測時往往需要花費很大的計算成本實現。

那零售行業現實狀況是怎樣的呢?我們不妨先來看看零售數據本身具有的一些特征:

趨勢特征:一般銷售數據在一個比較長期的時間範圍內,具有整體增長或下滑的趨勢特征。
周期特征:銷售數據具有明顯的周期性和季節性。
非規律性的節假日特征:節假日及節假日前後對銷售數據有顯著影響。
各類外部因素影響:促銷活動、天氣、搜索指數、銷售指標等因素也會顯著影響銷售數據。
數據稀疏性:一般零售行業的SKU,門店等維度的組合會非常巨大,但每個組合中的時序數據數量往往比較有限。

基於直觀的理解,我們就可以發現簡單的ARIMA模型與復雜的狀態空間模型對於零售數據的預測都有一定的局限之處。而觀遠數據則是根據具體的業務數據情況,結合使用高效的廣義累加模型和狀態空間模型,統籌考慮零售時序數據的趨勢性、周期性,並加入對節假日及促銷、天氣等可預測波動因素的分析,給出綜合預測結果,可以說這是一個專門為零售預測而生的算法模型!

預測結果的可視化呈現

觀遠數據對預測數據呈現做了定向優化,對實際數據與預測數據進行了顏色和線型的區分,並添加了預測數據的置信區間,提供時間軸的縮略展示。

技術分享圖片

「AI預測引擎」數據展示

小結
本文給大家介紹了集成在觀遠BI平臺內的「AI預測引擎」功能的架構設計與算法實現方案,感興趣的同學歡迎點擊文末閱讀原文提交免費試用申請。

下一篇我們將給大家介紹更多觀遠數據在AI領域的實際落地案例與應用效果,歡迎持續關註!

智能分析平臺疊加AI,觀遠數據行業首發「AI預測引擎」