1. 程式人生 > >千人千面、個性化推薦,解讀數據賦能商家背後的AI技術

千人千面、個性化推薦,解讀數據賦能商家背後的AI技術

div 並且 聊天 接收 線上 體驗 超越 金礦 docke

12月6~7日,由阿裏巴巴集團、阿裏巴巴技術發展部、阿裏雲雲棲社區聯合主辦,以“2016 雙 11 技術創新”為主題的阿裏巴巴技術論壇,來自商家事業部的技術總監魏虎給大家分享了數據賦能商家背後的AI技術。首先對大數據和人工智能進行了簡要介紹,接著著重分析了客戶運營平臺,包括實時分群算法、match和rank框架以及千人千面技術,最後講解了千牛頭條、服務市場和智能客服中AI技術的應用。

背景介紹

大數據

大數據主要有四個特征:Volume(大量)、Value(價值)、Velocity(速度)、Variety(多樣)。

  • Volume(大量):互聯網實時采集用戶的各種行為,數據量龐大;
  • Variety(多樣):數據格式發生了翻天覆地的變化,數據類型的多樣性也是大數據的特點;
  • Velocity(速度):信息采集速度為秒級或毫秒級;
  • Value(價值):海量數據中存在很多金礦,價值密度低,須通過不同類型的數據挖掘才能完整刻畫用戶,產生價值。

人工智能

  • 通用人工智能(General AI)概念,指擁有人類五感(視覺、聽覺、嗅覺、觸覺、味覺、甚至更多)、推理能力以及人類思維方式的神奇機器。
  • 弱人工智能(Narrow AI):執行特定任務的水平與人類相當,甚至超越人類的技術。

技術分享圖片

上世紀50年代,人工智能的概念就已提出,人工智能的發展也經歷了坎坷的階段;上世紀80年代,機器學習開始興起,開始用模型、算法和數據組成軟件部分;隨著處理能力的提升和海量數據的累積,2010年以後,深度學習火熱起來,它源自於人工神經網絡, 深度學習的發展也得益於算法模型的優化,自動學習特征。

技術分享圖片

人工智能的核心點由大數據、處理能力、數據模型組成。人工智能給我們帶來了四大方向:

1. 發現:通過人工智能可以發現一些有價值的數據,比如發現一些用戶的購買行為,經常購買搭配的組合套餐;

2. 預測:可以對用戶進行預測,預測購買哪些商品,購買概率是多少;

3. 推薦:預測後就要推薦,通過各種推薦技術,比如猜你喜歡進行推薦;

4. 自動化:了解用戶定期購買什麽商品,自動化的定期進行推薦。

客戶運營平臺

CRM:企業為提高核心競爭力,利用相應的信息技術以及互聯網技術來協調企業與顧客間在銷售、營銷和服務上的交互,從而提升其管理方式,向客戶提供創新式的個性化的客戶交互和服務的過程。其最終目標是吸引新客戶、保留老客戶以及將已有客戶轉為忠實客戶,增加市場份額。

客戶運營平臺來自於CRM,是為阿裏商家打造的數據驅動的客戶精細化運營平臺,商家可以對自己的客戶進行洞察和分群,同時可以針對自己的客戶在各個溝通的通道上(店鋪首頁、詳情、微淘、旺旺等)進行千人千面的溝通和表達。客戶運營平臺承載著從流量運營到客戶精細化運營的使命。

個性化店鋪首頁

技術分享圖片

頁面級千人千面,通過面向不同的客戶人群投放不同的個性化店鋪首頁來提升轉化效果。面向消費者部分,我們需要做實時偏好算法分群。因為是需要賣家參與設計對應的人群的頁面,所以不同商家效果有區別,做的好的商家,成交轉化率能有50%的提升;面向商家部分,我們不僅僅是做一個工具,包括人群細分(年齡、性別)、個性化頁面選擇(屬性偏好)、策略診斷(匹配度)、選品助手、效果跟蹤,背後都是AI在支持。

技術分享圖片

談到實時分群算法,它的分群方法是基於實時商品分組、品類等維度定義標簽,算法實時預測匹配分群,實時分群策略可與普通標簽交叉使用,實時分群策略還可以透視。算法體系包括行業級別的模型,GBDT在線預測,長期+近期+實時偏好相結合,還引入了增強學習方法根據實時的累積受益來調整偏好閾值。

圖中從上到下分為離線、近線、在線算法。離線部分有離線特征計算,我們用了用戶、搜索、瀏覽、加購、支付等,離線算法也應用很多,包括普通的LR、SimRank、圖計算以及深度學習等,我們都做了很多嘗試,並且取得了一些成果,最後通過模型庫訓練產生一些結果;離線部分可能一天算一次,而近線部分是分鐘級或小時級,包括流計算引擎,實時接收各種瀏覽加購行為,實時計算用戶特征;在線部分需要給用戶展示商品,商家需要設置模塊,在線部分我們也引入了投放策略,通過增強學習動態調整每個店鋪用戶的偏好閾值。整個個性化店鋪首頁背後技術由離線、近線和在線三套架構來支撐人群分群策略。

雙11店鋪承接頁

技術分享圖片

店鋪承接頁包括三個模塊。“所見即所得”,根據用戶個性化進行推薦;樓層商品的個性化排序,商家可以參與選擇;猜你喜歡瀑布流完全由算法幫助實現個性化推薦。對比有AI支撐承接頁和沒有AI能力的承接頁,人均成交率提高20%以上。

Match框架

技術分享圖片

Match框架分為基礎日誌、訓練數據構造、match算法引起三部分:

1. 基礎日誌:日誌抽取解析和數據清洗;

2. 訓練數據構造:生成用戶序列,商品用戶關系圖,進行rank i2i樣本構造,樣本去躁以及特征工程。

3. Match算法引擎:主要分為Online和Offline兩部分,具體類別主要包含:基於節點關系,基於hash,基於learning,基於熱度,基於屬性匹配,基於流式計算的match數據。以上數據,可以在不同層次滿足數據match召回方式,具有極強的覆蓋率和準確性。

Rank框架

技術分享圖片

Rank框架主要分為樣本、特征、模型三個點:

1. 樣本:通過預處理、去噪得到幹凈的訓練數據,根據不同樣本的策略訓練效果最好的模型。

2. 特征:千萬級的ID類特征,包括用戶、商品基礎特征及相互組合特征;場景反饋類特征如ctr、cvr等;實時特征如召回類型、召回分數以及用戶類目、價格偏好等;業務類特征如會場類目信息、承接頁頁面信息,大促商品折扣率,商品加購率等。

3. 模型:通過PS版的LR、PAI平臺的DNN訓練天級及小時級模型,做到模型的準實時;並在線上通過融合CTR、CVR模型,做到線上效果最佳。

旺鋪個性化模塊

技術分享圖片

商家可以通過場景化商品池實現多樣化的營銷需求,只要選擇商品庫,其余都可交給AI來做。這樣,消費者端千人千面投放可實現高速轉化,整個模塊點擊率平均提升20%,成交轉化率提升超過40%,千次展現支付金額提升超過50%。

智能海報

技術分享圖片

通過素材生產能力與千人千面技術結合,提升店鋪、詳情等場景banner投放效果。

技術分享圖片

背後的技術就是圖像技術與個性化投放的結合,商家可以自動選模板將商品放進去, 自動生成海報。

詳情個性化

技術分享圖片

我們提供給商家易於運營的詳情個性化訪客運營工具,提升轉化效果和客單價。我們給予商家自主權,可以自主選擇在詳情推薦模塊放哪些商品。在商家端,操作成本低、可以批量覆蓋多款商品,“一鍵升級”直接覆蓋最多100款商品,並支持高階配置(商品池、加權商品池);在消費者端,基於當前用戶、當前商品的個性化投放,商家配置的加權商品能夠獲得曝光保障。詳情個性化很好的將商家的確定性和個性化融合起來。

粉絲&會員運營算法

技術分享圖片

我們提供對粉絲/會員的深入洞察,進行分群剖析。我們也提供一些場景化的能力,比如粉絲個性化營銷算法,提供高購買潛力粉絲、預流失粉絲等;對於會員個性化營銷算法,提供預復購會員、預流失會員等人群;對於前端投放算法體系,提供投放時機算法和人群權益匹配算法,根據預測模型預測概率值。

千牛頭條

千牛頭條定位於面向B端商家的電商媒體門戶,旨在引入媒體、小二、服務商幫助商家緊跟行業動態、官方規則變化,以及實時的直播內容。

技術分享圖片

通過AI能力賦能千牛頭條。資訊在千牛頭條中很重要,實施個性化後,整個頻道頁個性化點擊率有了很大提升,也提升了單個用戶的資訊消耗率。

技術分享圖片

千牛頭條的算法架構也分成離線、近線和在線。離線部分,對用戶進行分層,抽取行業特征,包括店鋪規模、關鍵詞等等,對商家做360度的刻畫,此外,離線部分還有各種帖子質量的打分模型,通過大規模的離線計算得出商家對哪些帖子感興趣;近線部分個性周期更加快,可以對帖子進行自然語言處理,包括關鍵詞提取、環境信息提取等,還要建立索引,對帖子進行相似度的計算;在線部分是一個流程,商家過來一個請求,我們會拿到商家的profile,生成一個query,到實時檢索引擎中進行召回,去重過濾,在模型裏我們也做了如圖創新,每一篇帖子訓練一個模型,接著後處理帶有一些運營規則,包括多樣性的處理,最後推薦給用戶。

服務市場

技術分享圖片

阿裏巴巴集團推出的主要面向商家,為其提供店鋪、訂單、營銷管理等軟件工具以及運營、客服外包、攝影等服務為一體的運營平臺,是阿裏生態體系的重要組成部分。很多服務商與我們一起為商家提供工具,通過AI能力進行賦能,使服務市場效果有顯著提升。

技術分享圖片

技術分享圖片

數據賦能服務市場搜索,解決商家在服務市場“搜什麽”、“搜不到”、“搜不準”、“搜不好”的體驗問題。使之達到更精準的搜索體驗、更高效的平臺導購、更多優秀服務得到曝光。采用基於前沿的NLP技術的Query理解,基於語義的檢索,也有數據驅動的自適應模型優化,個性化排序模型優化,還有實時個性化技術,熱搜詞挖掘、引導價值分析等。通過AI能力使搜索點擊率增加25%,跳失率降低16%,搜索空結果率降低452%,付費轉化提升20%。

技術分享圖片

搜索之後就是個性化推薦技術,包括首頁、結果頁、詳情頁、付款、購後整個商家的服務市場流程中,進行深入分析和挖掘用戶訂購行為,嘗試前沿AI算法,提升推薦精準性;深入挖掘優質的服務和服務商,為用戶推薦優質的服務;深化服務市場個性化導購,進一步提升用戶訂購體驗和效率。我們做了一些導購場景布點,主要技術與推薦相關,包括用戶商家的實時意圖分析等,使服務市場的商家更容易搜到想要的服務。

智能客服

技術分享圖片

我們制定了智能客服的全新接待模式,消費者通過聊天窗口與客服溝通時,推薦消費者可能問的問題,並給出相應答案,大大節省了客服工作量。

技術分享圖片

智能客服管理團隊,實時分析消費者和客服之間聊天記錄,實時做語義分析,幫助監控客服效率,機器可以自動挖掘好的問答對。

技術分享圖片

智能客服背後的算法,從下往上,第一層基礎數據,我們會對聊天記錄、店鋪、商品和評價等底料進行挖掘;第二層是AI算法,包括自然語言處理、在線學習、深度學習等等;第三層是知識沈澱,包括知識庫、知識圖譜、績效指標體系等;第四層是公共服務,提供意圖識別、多輪交互、情感分析等等;第五層是業務,包括智能搜索、智能績效、熱點挖掘等。通過AI能力,我們的目標是提升店鋪銷售額,降低運營成本,提升服務體驗。

總結

技術分享圖片

通過這些技術的深入理解,在各個產品的功能裏升級,在毛細血管中融入AI能力,可以更好的賦能商家,提升效率。

阿裏巴巴集團商家事業部技術總監魏虎,早期負責淘寶網站架構,主導了淘寶多個大型架構變遷項目。後期從事大數據方向的技術研發,主導研發了阿裏集團的個性化推薦平臺,推動並支撐阿裏所有重要個性化推薦場景的落地。目前的主要工作是通過大數據和人工智能相關技術提升阿裏商家的效能,從而為商家賦能。

大會所有資源(視頻回放、PDF、文章整理)一鍵下載:https://yq.aliyun.com/articles/65238

大會系列整理文章:

  • 阿裏雙11背後的網絡自動化技術——張銘(阿裏巴巴研究員)
  • 演講整理文章:https://yq.aliyun.com/articles/64680
  • 阿裏大規模數據計算與處理平臺——林偉(阿裏巴巴資深技術專家)
  • 演講整理文章:https://yq.aliyun.com/articles/66113
  • 在線AI技術在搜索與推薦場景的應用——徐盈輝(阿裏巴巴研究員)
  • 演講整理文章:https://yq.aliyun.com/articles/66158
  • 揭秘阿裏虛擬互動實驗室——袁嶽峰(阿裏巴巴高級技術專家)
  • 演講整理文章:https://yq.aliyun.com/articles/66105
  • 阿裏超大規模Docker化之路——林昊(阿裏巴巴研究員)
  • 演講整理文章:https://yq.aliyun.com/articles/65377
  • 雙11媒體大屏背後的數據技術和產品——羅金鵬(阿裏巴巴高級技術專家)
  • 演講整理文章:https://yq.aliyun.com/articles/66098
  • 數據賦能商家背後的AI技術——魏虎(阿裏巴巴資深技術專家)
  • 演講整理文章:https://yq.aliyun.com/articles/66159
  • 面對雙11的前端“極限挑戰”——舒文亮(阿裏巴巴高級技術專家)
  • 演講整理文章:https://yq.aliyun.com/articles/66106

千人千面、個性化推薦,解讀數據賦能商家背後的AI技術