優秀傳送門
-
英特爾深度學習
:https://software.intel.com/en-us/ai-academy/students/kits/deep-learning-101pytorch https://in.udacity.com/course/deep-learning-pytorch--ud188
資料科學家必須知道的 10
個深度學習架構https://blog.csdn.net/u011808673/article/details/80541630
北郵奪冠D-linknet
http://baijiahao.baidu.com/s?id=1604493613928815729&wfr=spider&for=pc麥克風陣列的語音訊號處理; https://zhuanlan.zhihu.com/p/23420891
語言模型技術; https://zhuanlan.zhihu.com/p/23504402
聲學模型; https://zhuanlan.zhihu.com/p/23567981
語音識別之解碼器技術簡介; https://zhuanlan.zhihu.com/p/23648888
使用者畫像: 通過姓名預測性別:考慮到中文中偏旁具有性別的識別能力(如嬛等女字旁文字),因此可以用 姓名+五筆編碼
作為特徵輸入模型,如女V+罒L+一G+衣E = VLGE
(參:https://mp.weixin.qq.com/s?__biz=MzI2MzM3MzkyMg%3D%3D&mid=2247484433&idx=1&sn=f30a6a3585becc1a500772aaa78fd937&scene=45#wechat_redirect)通過訪問網頁的正文內容抽取(參eBay案例:https://blog.csdn.net/u013382288/article/details/80385814)
標籤間關係
樹狀關係:儘可能的遵循MECE原則(相互獨立、完全窮盡),尤其是一些有關使用者分類的,要能覆蓋所有使用者,但又不交叉。比如:使用者活躍度的劃分為核心使用者、活躍使用者、新使用者、老使用者、流失使用者,使用者消費能力分為超強、強、中、弱,這樣按照給定的規則每個使用者都有分到不同的組裡(參:https://mp.weixin.qq.com/s?__biz=MzU4NzM2NTQ0Nw==&mid=2247483913&idx=1&sn=2b819b3da396b181895a0527f5bb4da9&chksm=fdec6f21ca9be637357ac5db31f2df8dfd035f19d7dca9a06b26e7914f0df082fa7bbc4103cd&scene=21#wechat_redirect)
網狀關係:
標籤間關係的識別:簡單地如共現,複雜的如標籤embedding
二、使用者畫像實踐案例
case1 順豐使用者畫像
案例地址:http://100000p.com/article/2c9f60ee5e3d631a015e5e939dd10993
目的:面向C端,做品牌維護和精準營銷
資料來源:
內部:快遞資料、金融資料、電商資料、O2O資料
外部:向第三方購買的資料、自己爬取的資料
會員標籤維度:使用者ID、基本屬性標籤、快遞類標籤、金融類標籤、電商類標籤、O2O標籤
會員畫像維度(通過標籤的組合實現):客戶價值(基於使用者的寄快遞行為以及社群行為,如“寄快遞少但是出於寄快遞網路的核心節點”)、購買力、營銷響應、品牌態度、客戶忠誠
業務實踐效果:無介紹
case2 58同城
案例地址:https://mp.weixin.qq.com/s/pzABJ-uwh2bx7AXBWJDJRQ
目的:
Face API:實時查詢標籤
離線畫像資料:使用者統計分析、建模,如搜尋、推薦、推送、廣告、金融、使用者身份識別、安全
Smart 網站:
推送篩選:幫助運營人員選定目標人群
人群分析:以標籤為維度,生成報表,方便產品和運營人員使用
資料來源:各子產品的日誌、簡歷庫、帖子庫、使用者資訊庫、商家庫、認證資訊庫等
會員畫像維度:人口屬性、業務偏好、裝置偏好等
case3 友盟超級使用者
案例地址:https://mp.weixin.qq.com/s/gjrWS9QTeqMN5Jm4XNOoTg
企業選定自己的“超級使用者”,上傳超級使用者列表。友盟根據使用者畫像做超級使用者的lookalike得到放大後的目標人群,然後對目標人群進行細分、確定營銷方案、投放廣告觸達
case4 電信使用者畫像使用者e9套餐升級營銷活動
案例地址:https://blog.csdn.net/mousever/article/details/50189847
背景:某省電信運營商e8套餐(寬頻+固話)升級e9(寬頻+固話+手機)的主要業務目標為針對e8客戶加裝電信C網號碼併購買手機,升級為e9融合套餐或e9自主套餐使用者。即,通過電信的自身的寬頻客戶資源,進行精準電話營銷,促使使用者購買手機,從而提升電信在手機市場的佔有率。
目標:
找到目標投放人群
目標投放人群細分,設計針對性的營銷方案
資料來源:電信內部已經有比較完善的資料體系,並且有已經轉換的使用者資料。因此建立有監督模型即可
過程:
特徵選擇與合併:
分類器:由於主要需求是指定營銷方案,因此採用單棵決策樹作為分類器
結論
目標使用者群:
使用者細分命名:
case5 基於使用者畫像的騰訊大資料防刷架構
案例地址:http://bbs.qcloud.com/thread-10745-1-1.html
目標:區別刷單使用者與普通使用者,對於疑似刷單使用者採取二次驗證的方式檢驗
使用者畫像維度:
網路屬性:代理IP、VPN IP、閘道器IP、伺服器IP
地域屬性:國外IP、IP歸屬地、高危地區
業務屬性:登入騰訊業務、登入的騰訊使用者量
惡意屬性:DDOS IP、肉雞IP、騰訊業務作弊IP
case6 美團外賣使用者畫像實踐
案例地址:https://zhuanlan.zhihu.com/p/25731678
目標:
新客運營:新客在哪?偏好如何?消費力如何?
場景運營:公司/家 * 飯點/下午茶/夜宵 * 週末/工作日
流失預測:流失概率標籤,以及流失原因分析
case6 使用者畫像在金融領域應用
目標:銀行、保險、證券,找到目標使用者;並參考使用者畫像,設計營銷方案
資料來源:
社交媒體資訊
呼叫中心
垂直論壇:汽車、母嬰等
移動軌跡資訊:住宅區、消費地區、工作地區等,同時可以作為對使用者資訊的檢驗(是否是真實的高收入人群?)
APP使用資訊:與運營商、推送SDK公司等合作
使用者畫像主要維度:
人口屬性:能定位到使用者是誰的資訊。包括姓名、性別、電話號碼、郵箱、家庭住址等
信用屬性:描述收入和收入潛力情況的資訊。包括職業、收入、資產、負債、學歷、信用評分等
消費特徵:描述消費偏好,使用者找到高頻和高價值客戶。包括差旅人群、境外遊人群、旅遊人群、餐飲使用者、汽車使用者、母嬰使用者、理財人群等
興趣愛好:使用者定向營銷活動。包括旅遊愛好者、科技發燒友、健身愛好者、奢侈品愛好者等
社交資訊:使用者的社交媒體評論,用於瞭解到使用者的近期需求,如在哪旅遊、是否正要買車
caseN 小案例
寶馬廣告投放:寶馬X1今年剛上市,他們把去年購買X1的使用者都上傳上來,我們會分析這樣的使用者在哪些方面是有特性的,比如年齡段、地域分佈、收入、偏好。有了這樣的分析後,我們可以選擇相應的人群,基於歷史的偏好、特徵,然後再去投放;如果中間我們會發現人群量不夠,最初選擇10萬人可以放大到100萬人。最後輸出到媒體、RTB等渠道商。做預算,看效果,將效果資料迴流,再去迭代,以進一步提高投放的精準率(參:http://www.sohu.com/a/192628425_770765)
餐飲店:
使用者畫像學生為主:寒暑假為營業淡季,需要調整策略;九月份需要做顧客重召回
使用者畫像白領為主:價格不敏感;考慮辦公室飲食場景;考慮減肥餐以及包月餐等
word2vec :https://blog.csdn.net/xbmatrix/article/details/67102698