1. 程式人生 > >譚安林:大資料在智慧外呼系統的應用

譚安林:大資料在智慧外呼系統的應用

歡迎大家前往騰訊雲+社群,獲取更多騰訊海量技術實踐乾貨哦~

譚安林,騰訊高階工程師,2015年加入騰訊,8年網際網路從業經歷,從事大資料平臺與產品開發相關工作;先後參與廣告、金融等領域產品專案,目前負責行為預測解決方案,幫助客戶盤活現有客群、挖掘潛在高價值新客。目前我們的產品包括:智慧客服、大資料套件、騰訊移動分析、騰訊移動推送等。

img

商業是一個價值交換的事情,並不是一個等價交換的事情,我們因為資訊不對稱,很有可能導致一些效應:贏者通吃。大家買一個什麼東西,可能比較關注的是市場知名度比較高的,這種會導致有一些同樣的質量,甚至質量更高更便宜的產品,他們曝光度沒有那麼高,他們銷售的時候並不佔優勢。我們作為一個數據團隊,希望基於通訊技術,大資料技術提供數字化智慧化的服務,提升我們營銷的價值點。

img

大家目的都是賺錢。我們要去解決這種溝通的一致性,資訊的不對稱。我們去淘寶或者京東買一個東西,如果質量出現問題就會找他們人工客服,出現什麼問題幫我們解決。還有一種大家在訂機票訂酒店的時候會用到線上的服務,就是人工呼叫,還有越來越多文字類或者語音類機器人持續提供這種福利。

img

我們現在這種工具,並不能直接解決營銷上的問題。比如教育行業,每一個學生成績模型是不一樣的,有些數學比較好,有些語文比較差,我們需要因材施教,為標準化產品對接,也就是說教育行業會有很多細分場景,我們要去做一個具體場景的推銷,一個宣傳,以及讓我們使用者可以從註冊到轉化。這一塊流程非常長,假如我們打電話給一個客戶,使用者說我們有一個數據產品非常不錯,你孩子聽了之後可能從80分變成90後,剛開始聽的時候會很感興趣,過了一天或者晚上,他的鄰居說有個張老師他的課程還不錯,這時候就會導致你整個營銷鏈路斷了,在整個過程之中,我們希望能夠解決一些資料能力,通訊的能力,去持續的為我們客戶解決服務,從售前到售中售後都可以貫穿。

我們在做的一個事情,有相應的客戶在用,我們從售前給我們客戶尋找到一個高價值的人群,可以讓他針對性的做一些營銷,本來是有30萬的營銷經費,如果說直接找到一批可以轉換的一批人,可以定點的做相應的簡訊投放,去做呼叫,提高我們的ROI,我們行業客戶就會去買單。

在這裡我們可以看到售前主要是行為的預測,行為預測我們會支援兩種模式,一種模式是對線索的評分,我們在做一些線下宣傳,線下活動推廣的時候,我們會收集到一些使用者一些聯絡方式,通過這些聯絡方式電話號碼給他做一個評分,根據大資料上面一些特徵判斷他是否可能被我們轉化,是否會在我們產品上面進行付費。還有一塊是大家也去投過廣告,不管是2B還是2C,大家都會投一些廣告,給到曝光人群,點選你目標網站的人群也是線索人群。

另外一個就是大盤,我們會告訴你網際網路上可能存在某些人群,哪些人是你的潛在人群。這裡我們第一個階段做的是售前行為預測,包括一些挖掘,評分了之後就會告訴客戶,高價值的這些人可以拿去做直接的外呼,一對一的外呼,這個成功率非常高。我們其他的高價值轉換隻佔10%,最多佔20%。那麼有人想問了,還有70%、80%的使用者群體是直接放棄嗎,當然不是,這些人群我們希望可以結合簡訊,還有外呼渠道做一個漸進式的立項評估,以及促進轉化意願的提升。

如果說一個使用者已經轉化了,他掏錢了,買了十節課,在十節課過程中會去學,我們後面會給他提供售後客服服務,所以這不僅僅是一個被動服務。我們後面會講到怎樣反哺前面兩個環節,融合資料的能力。

img

剛才一直在提教育,今天也是會主要以教育這個行業講這個事情。我們在教育行業做行為預測,預測一個使用者發生註冊,或者是購買某一類產品。我們會從兩大維度,一個是付費的意願,一個是付費能力來進行評估。大家可以看到,我們的期望留學型和素質教育型還有望子成龍型人群,他們付費意願會非常高,實際上在我們一些案例裡面表現出來付費轉換率也是很好的,還有一個就是打拼江山型,這種付費意願並不那麼高,但是他有錢,只要成一單,客單價相對來說比較高。對我們客單價比較高的產品來說,打拼江山型的人群對他們來說非常有價值,我們也是對不同行業,不同具體客戶進行這種不同的定製化的建模,進一步做支援。

img

剛才說的線索評分部分,會結合線上線下兩個環節,我們以前做的更多是線上,當前也在做線下這部分。

img

另外一塊是潛客挖掘。我們客戶比如教育、金融的很多企業,他們有一批已經買過產品的使用者種子,包括有電話號碼,有身份證這樣一些資訊,他們希望根據這個包,能夠找到更多的人,相似的人去做一些擴散,去分道他的使用者盤,這裡我們整合大資料的相關特徵,去做一個人群擴散。這裡做的方式可以簡單分享一下,因為只有種子,正向的樣本,沒有副樣本,就是從大盤裡面隨機抽一部分出來做,這種方式效果不太好,我們後面用標籤抽取方式,抽取一些種子人群,比較負向標籤關聯的人群,這種方式做出來,評估上會非常好看,但是在具體落地的時候穩定性差。後面就是做了一個Pulearing,會先從種子使用者,放進副樣本里面去先做一個種子篩選模型,再真正抽取出來的正負樣本去做預測建模,最後我們會達到一個比較好的效果。

img

整個行為預測這塊在售前這部分能力,在做機器學習的時候,會對自己資料進行處理,先有資料,進行資料的預處理,這部分耗時會非常久,同時我們要去把資料實驗各種不同的演算法,去調參,去做模型線上除錯,去上線,我們不同的行業,不同的客戶有不同的模型,需要去做針對性的上線服務,我們時間開銷很大,而且要上線一個新的東西,本來需要改一些引數,甚至有一些模組需要重啟。

img

這裡我們用了騰訊雲上面一個TI One大資料平臺,在上面是可以支援各類的機器學習的框架,我們在上面是用到了像CNN,GBDT這樣一些演算法。

img

給大家介紹一個TI One好用的點,我寫一些計算任務,可以串起來,做一個任務流,像我們要做一個模型的訓練,訓練好了之後可以再形成一個演算法結果的評估節點。我們可以看到一個簡單的評估,演算法評測效果,在釋出的時候不同的客戶有模型迭代,這個迭代可能是一個小的迭代,可能是大的迭代,很多環節都需要做更新,甚至有些環節會強依賴;TI One實現了一定的解耦,讓演算法同學直接做,通過TI One開放出來,再在工程上面做整合。

img

介紹一下我們行為預測的一些模型樣板,當前我們是在四個行業,可以先分享一下這兩個行業的案例,我們的匹配率在市場上還是很有優勢的,假如使用者提供100萬的號碼包,我們可以識別出來在我們體系內有畫像有特徵的可能就是在教育這裡有93%,在房地產有87%,比其他友商高很多。在模型效果上面我們會做預測上面的意向分級,我們高意向的拿去做營銷效果會更好,模型的排序能力也比較好。

img

我們剛才提到售前,怎麼去挖潛在的人群,潛在高價的人群,形成人工外呼流程的功能。但是對於我們對他的意向評估不是太完善,對這樣一些人可以走簡訊營銷,在這裡我們還可以從簡訊營銷鏈路裡面把他意向拆分出來是強意向還是中意向,在對簡訊營銷做二次過濾意向的人群做一個外呼,經過外呼,在座可能有很多做這方面的東西同學,我們外呼或者呼叫之間通訊的基礎能力,或者在這個接入能力之上加上我們資料能力,我們可以希望做到一個點是我們一個電話在呼叫的時候可以辨別性別、學歷、收入、興趣。根據不同的型別選擇不同的模板,走相應的劇本。同時我們也基於這樣一些機制做了一些後面的營銷。

img

這是一個簡訊投放的案例,我們在簡訊投放整個過程裡面,會用斷鏈服務,到監測,監測整個轉換鏈路上面資料變化,使用者走到哪一步,在這裡可以看一下下面這個案例,兩個包,第一個包42萬,高意向的,可以看到分成三個小包做投放,效果比較好,。在這個基礎上可以提供不同營銷方案,或者你傳送的時間,週期的不同可以做一些營銷方案的對比。

img

這裡面是我們當前外呼這一塊的服務框架,我們能力是偏向於在後端鏈路邏輯處理,像FS軟交換伺服器,我們當前也是在建設中,更多會希望外部的合作伙伴建立一些合作的機制,我們更希望藉助與智慧裝置做整體大資料方面的解決方案。

img

這是當前的一個ASR識別和TS流程,我們引入話術,這樣是有特徵的邏輯在裡面,進入之後我們會進行呼叫AI引擎。

img

這是一個當前的產品頁面,這個頁面上可以支援相應話術,可以有多個話術入口,以及特別的特徵組合,我們可以有不同的針對性入口,他進來的話可以去到他相應不同的節點,在這上面我們對每一個節點也可以有多個下游,比如肯定意向,否定意向,未知意向。

img

這是我們的一個Demo,我們以後可以對望子成龍型的不同客戶群體,根據他的特徵做不同的話術營銷,像期望留學型使用者他們更偏重外教優勢,會介紹有多種外教經驗,如果是可能意向就會走到說給你提供相應體驗課程,去體驗體一下,下面會有轉人進行跟進。像望子成龍型他們希望自己小學學習成績好,可以在周圍有一定地位,在這裡會給他推出某個教育產品,如果方便的話,我們的師資配備或者我們歷史經驗會比較豐富。對於否定的意向,我們再進行一些挽留,並詢問原因,希望在這一點讓他們可以看到,可以把他們顧慮,他們關注的點拋給我們,我們可以做後續的分析。假如是費用顧慮,我們可能會自動做一些打折的模板去進行專門的呼叫進行服務。我們提供一個被動預語料庫,我們很難預估到客戶會說什麼話,在這種情況下我們需要保證這樣服務完整性,比較好的體驗,我們增加被動語料庫,這一部分是我們智慧客服的能力。

img

這裡剛才提到了客服,我們是用客服來做溝通,做技術支援相關東西,我們其實希望客服可以承擔更多的角色,比如承擔一些營銷的任務,可以在產品售後讓營銷的觸達之後,可以做一個營銷的二次觸達,產品售後之後可以做回訪跟進,剛才提到一個點,我們一個使用者在買一個課程之後,這個課程可能是十個課時,他只上了兩三個課時,後面沒有上,這個時候客服可以做後面的跟進,這種方式可以把我們使用者關係穩定維護起來,也可以提高我們使用者滿意度,從而可以提高我們復購率的指標。

img

客戶服務平臺。當前其實我們很多客戶端的渠道,像網頁版或者APP,像H5,企業微信也打通了,還有微信公眾號這塊也比較成熟,我們是把多渠道可以提供客服售後給到最終C端使用者,進行客服系統使用,這在一塊彙集了這些資料,不僅僅是客服資料,還可以用來做後續其他的分析,整合出來之後可以做市場、銷售、新的功能研發點一些啟示,可以找到一些新的機會。

這是我們一個機器人AI客服的案例,當前是像我們公安、政企一些企業,還有像運營商的一些公眾號。我們把微信的公眾號和人工客服服務檯資料進行打通,客服可以看到這個使用者近期和機器人互動的環節,可以做出更精準的一些問答。

img

這是整個技術框架,在這裡包括我們機器人客服和人工客服這兩塊,會有一些AI人工狀態管理,多輪問答,上下文管理,在這裡我們人工客服這塊的資料扭轉使用了。首先是說和微信H5或者網頁端,這在塊整合之後給使用者側資料會到伺服器,到伺服器和人工客服臺是通過websocket做一個實時機制,外加非同步訊息處理提供高效能,更穩定性的保障。

img

整個客服AI機器人的架構,我們會從接入層接入不同渠道,在問答層當前是支援四種類型機器人,有相應的單輪問答,多輪互動,任務和閒聊的機器人,我們也是提供相應的服務工具,像知識圖譜,資料運營分析的工具。後面是常規的兩個,一個是後臺引擎,會做向所有系統,像分散式的快取系統,後面是演算法,演算法引擎,還有深度學習等等。

img

整個客服演算法框架,是採取了檢索平臺方式。一開始我們會對每一個問題進行一個糾錯,文字的糾錯,一個使用者在發一個問題的時候,可能會發送錯別字,這時候先把錯別字做識別,會根據我們分詞做分析上成相應的top1,去索引系統查出來相關的問題,查出來之後要計算相似度,計算相部分我們原來是直接把一個文字分拆成相應特徵變數,用這種方式做相似度的計算,後面我們採用深度學習CNN,效果也有一個提升。

img

我們一開始給客服是提供一個7X24小時落地保障。但是別人在問我們問題的時候,我們自己員工不可能全天候服務,這時候我們就有一些常規問題希望可以給他們進行一些回答。在這裡我們一開始做的滿足基本需求,後面我們希望提升工作效率,節省技術支援的能力。創新這一點,就是當前做的事情,其實客服這一塊的興趣是可以反哺行為預測。一個使用者他來投訴或者他來諮詢更多東西的時候,他是表示有興趣的,這些點會加入到營銷體系裡面去,他的轉化率是有一些提升的。後面做文字分析,做資料分析,會發現很多客戶行為裡面沉澱下來資料,使用者相關提問資料,跟客服的互動資料,可以做一些產品新的規劃。

img

我們以前一直是一個被動的客服服務,後來很多場景都是做主動服務,在營銷上面看還是需要做更主動化部分營銷的切入服務。

img

這是教育這個行業在加入大資料的能力之後,我們可以做到更精準,更智慧,還可以把售後和售前進行連通,提供全棧式的服務,這在教育行業,還有汽車、房地產、金融行業是類似的,我們都有相應行業不同解決方案。

Q&A

Q:我們做這個語音還有人工客服這塊整個系統的風控是怎麼處理的。

A:我們會考慮避免電話騷擾,讓使用者覺得體驗不好,簡單來說去給他做一些限頻,還有我們可以在呼叫時候做一些預判。有一些使用者在廣告上面他的行為可能就會不太去點選,不太關注這一點,這些在我們其他應用,我們還有其他渠道,也可以判斷出來他們會對我們發出的東西比較抵觸,我們把他們加到一些灰名單和黑名單;當然,其他更多的措施也在持續落實中。

Q:您好我想問一下,我現在手機每天也在不斷被各種簡訊和電話騷擾,當然咱們這個系統方面比如說可以把一些沒有意向的加入黑名單。我想問一下,除了簡訊和電話這種方式,還有沒有其他的方式維繫客戶,您剛才就是指了兩種,這兩種方式我們客群不是很接受的。

A:我們還有其他方式,但是其他方式和這個場景不是太切合,比如說廣告曝光方式,但這種方式會和我們當前這些營銷鏈路不契合,因為我們做的這套營銷鏈路是為了在有線索,或者有這樣一些意向再去做事情;因為主要是一些有意向的使用者群,騷擾的頻次頻率就會相對較低些。

附件如下:

此文已由作者授權騰訊雲+社群釋出,更多原文請點選

搜尋關注公眾號「雲加社群」,第一時間獲取技術乾貨,關注後回覆1024 送你一份技術課程大禮包!

海量技術實踐經驗,盡在雲加社群