推薦系統架構-(附ppt&代碼）

阿新 • • 發佈：2017-10-23

用戶標簽 als kubernets nbsp ted 軟文 embed 歷程快速叠代

Part1.樂視網視頻推薦系統

推薦系統：和傳統的推薦系統架構無異（基礎建模+規則）

數據模塊特點：用戶反饋服務數據-》kv 緩存-》log存儲

行為日誌-》解析/聚合-》session log-》cf/用戶模型

系統推薦流程：

召回：聚類算法；tensorflow（topN）；分類，top個性化標簽（微軟lda）；cf/als；人工幹預

排序：時效+相似度+gbdt/ LR

過濾

策略調整：分類多樣性

調優—提升較明顯的組合：

1.分類+標簽倒排排序

2.itemcf+als召回+分類多樣性

3.itemcf召回優化排序+此召回的用戶反饋調權占比40%

4.item召回打分引入曝光

短視頻冷啟動：排序未點擊的會馬上落下

Part2.RoadMap of YouTube isrecommendation System（Ke Wang）PPT

Youtube推薦系統的發展歷程：

1.get tags：user共現圖/pagerank思想 && 引用視頻相關視頻中top tags

2.基於user興趣推薦多級相關視頻

3.視頻排序：質量，多樣性，多頻道源

4.相關視頻推薦優化：避免cf缺點（cf缺點：新鮮性 and 長尾）

1）retrieval with weighted topic（短期內觀看視頻中大眾類型標簽推薦計算）

2）防止（1），learning topic transitions

用戶行為去擬合topic的權重大小

5.優化應用：deep learning

召回建模中的策略：

deep learning輸入embedding：歷史搜索+觀看+用戶特征，最後輸出概率；

顯性反饋沒有隱含反饋重要；

用戶最近100條興趣 better than 最近100天用戶的興趣；

feed流中：放棄序列輸入防止過擬合用戶模塊

新用戶的興趣挖掘：時序行為挖掘 better 隨機行為

ranking 建模：（用戶觀看時長為指標）

dnn架構和召回類似。

dnn輸入：視頻，視頻均值，用戶語言，視頻語言，距離上次觀看時間開方，原值，平方；先前的印象原值，開方，平方；等embedding

輸出：加權lr（正樣本評估加權）

Part3 58同城智能推薦系統的演進和實踐詹坤林

評價指標：推薦點擊占比，推薦轉化比，點擊率，轉化率，覆蓋率（評價長尾）

特點：用戶標簽和帖子標簽很完善

用戶標簽挖掘：

標簽會有分類：購房偏好，租房偏好，購車偏好，通用屬性（時間，質量分，關鍵詞，圖片），動態屬性（pv、uv、閱讀時長）等

召回：

興趣召回（基於興趣標簽檢索），熱門召回（統計ctr，平滑處理），地域召回，關聯規則，協同過濾（實時itemCF），SVD（效果一般），DNN

召回融合：

1）分級先後順序融合

2）調制融合（比例融合）

排序模型：

單一模型LR/XGBoost/FM

融合模型：XGBoost+LR/FM

深度模型：FNN（提升2%） / Wide deep/CNN

多目標優化（多權）：

點擊率，轉化率，停留時長預估（回歸，分類）

學習平臺：

深度學習在kubernets中融合tensorflow，caffe，Distribute tensor flow

機器學習：Yarn融合MLib，DMc

深度學習和機器學習平臺通過hdfs打通

規則叠代（AB test）：

去重策略/打散列表/產品邏輯/頁面展示叠代

A/Btest（有web操作頁面，可供全公司配置實驗）

請求分流/數據監控

A/B多層實驗架構

系統優點：

耦合性低，擴展性佳；協同開發，快速叠代；

關鍵技術

58自研RPC框架SCF

系統立體監控：

業務總體監控/關鍵模塊監控（請求量，失敗量，平均延時，最大值，最小值）+告警閾值

數據監控：

推薦埋點設計：每一次曝光seqNo，進入點擊click標誌鏈式關聯；溝通時長決定是否打上埋點commucate

埋點開發測試流程：

埋點文檔沈澱+EtL抽取文檔

效果數據統計：

hive上用Kylin（多維數據）做可視化，郵件報警和監控

推薦效果：

推薦占比20%～30%，流量2億，響應30ms

Part4 58個性化推薦push系統

推送的作用：

服務用戶，提高日活和留存，活動運營和推廣

推送點擊率預估&效果數據監控

原策略bug：條數限制，先來先推，精準度差，幹擾性大

推送控制系統：

機制化推送+運營推送—》通用推送平臺—〉消息總線—》推送平臺

推送點擊率預估：樣本（推送點擊1；推送未點擊0）；特征工程（用戶行為特征，推送上下文環境特征：周幾，推送信息特征：軟文）；模型算法：xgboost（分布式版）

模型離線評價：批次召回率整體召回率

推薦系統架構-(附ppt&代碼）

用戶標簽 als kubernets nbsp ted 軟文 embed 歷程快速叠代 Part1.樂視網視頻推薦系統推薦系統：和傳統的推薦系統架構無異（基礎建模+規則）數據模塊特點：用戶反饋服務數據-》kv 緩存-》log存儲

自己主動升級系統的設計與實現（續2） -- 添加斷點續傳功能（附最新源代碼）

blog down 決定 top lin dom itl com 關於一.緣起　　　　　　之前已經寫了兩篇關於自己主動升級系統OAUS的設計與實現的文章（第一篇、第二篇）。在為OAUS服務端添加自己主動檢測文件變更的功能（這樣每次部署版本號升級時，能夠節省非常多時間。

解密區塊鏈寵物養成遊戲系統（附代碼）！

區塊鏈區塊鏈寵物區塊鏈寵物養成區塊鏈寵物系統區塊鏈作為一種架構設計的實現，與基礎語言或平臺等差別較大。區塊鏈是加密貨幣背後的技術，是當下與區塊鏈寵物養成遊戲等比肩的熱門技術之一，本身不是新技術，類似Ajax，可以說它是一種技術架構，所以我們從架構設計的角度談談區塊鏈的寵物養

java利用WatchService實時監控某個目錄下的文件變化並按行解析（註：附源代碼）

tomcat啟動 interrupt extend red -name 利用 end eba tor 首先說下需求：通過ftp上傳約定格式的文件到服務器指定目錄下，應用程序能實時監控該目錄下文件變化，如果上傳的文件格式符合要求，將將按照每一行讀取解析再寫入到數據庫，解析完之

Unity讀取Excel文件（附源代碼）

canvas ces factory xlsx ext reat 文件夾 system 鏈接今天想弄個Unity讀取Excel的功能的，發現網上有許多方法，采用其中一種方法：加入庫文件 Excel.dll 和ICSharpCode.SharpZipLib.dll庫文件，（

用Html5/CSS3做Winform，一步一步教你搭建CefSharp開發環境（附JavaScript異步調用C#例子，及全部源代碼）上

轉載界面設計右鍵異步一個由於編寫 scrip 調用本文為雞毛巾原創，原文地址：http://www.cnblogs.com/jimaojin/p/7077131.html，轉載請註明 CefSharp說白了就是Chromium瀏覽器的嵌入式核心，我們用此開發W

（考研）哲學家進餐問題（附代碼）

fcc bsp 思路按順序 pst blog clas 條件 com 問題描述一張圓桌上坐著5名哲學家，每兩個哲學家之間的桌上擺一根筷子，桌子的中間是一碗米飯，如圖2-10所示。哲學家們傾註畢生精力用於思考和進餐，哲學家在思考時，並不影響他人。只有當哲學家饑餓的時候，才

Android模糊演示樣例-RenderScript-附效果圖與代碼

tracking _id pro out 依據 tree 部分 observe scrip 本文鏈接 http://blog.csdn.net/xiaodongrush/article/details/31031411 參考鏈接 Android高級模糊

（四）整合spring cloud雲服務架構 - particle-common-framework代碼介紹

.cn server control 簡單的阿裏巴巴統計 icontrol htm 回顧上一篇我們介紹了spring cloud雲服務架構 - particle雲架構代碼結構，簡單的按照幾個大的部分去構建代碼模塊，讓我們來回顧一下：第一部分：針對於普通服務的基礎

【黎明傳數==>機器學習速成寶典】模型篇05——樸素貝葉斯【Naive Bayes】（附python代碼）

pytho res tex 機器學習樸素貝葉斯 spa 什麽之一類別目錄　　先驗概率與後驗概率　　什麽是樸素貝葉斯　　模型的三個基本要素　　構造kd樹　　kd樹的最近鄰搜索　　kd樹的k近鄰搜索　　Python代碼(sklearn庫) 先

CQUPT萌新賽題解(附F代碼）

mil 不能遞推 strcmp 記憶化搜索代碼好用字典 std 題解或許會遲到，但永遠不會缺席(逃還是感謝qs手下留情和mzjj給弱智一點面子，才讓本蒟蒻拿到了鍵盤( 題目貼了網址也沒意義，鶸校只讓內網進(蘭兒鶸校oj也見不得人那麽開始正題： T1，T2： OR

頤和果園微商管理系統開發編程技術代碼

方式構造至少存在 upper 保持防禦性編程分配機制都是　頤和果園微商管理系統開發婷經理【184電話7578微信0020】　頤和果園微商管理軟件開發　　頤和果園的成功的三大要素：　　一、靈活實用的培訓：從溝通話術到朋友圈打造，從營銷技巧到品牌運營，一個

在線小說站點的設計與實現（附源代碼）

bold nsf 子節點 water page exists 匹配 AD tst 近期在做一個課程設計。在線小說站點的設計，下面是課題要求。須要項目練手的童鞋能夠試

Int32 最大的數值是多少？？？（附十進制十六進制相互轉換且包含正負數的java代碼）

反碼個數 alt input return scanner 判斷 mat pan 正數轉二進制很簡單，轉十六進制也很簡單。那麽負數的情況下呢？在計算機中無法識別你給的符號“+”,"-"，計算機只認識0和1 那麽在二進制中如何表示負數。先簡單介紹一下負數如何轉二進制

音頻降噪算法附完整C代碼

公開 lob oid 算法 rtc eve init 核心語音降噪是音頻圖像算法中的必不可少的。目的肯定是讓圖片或語音更加自然平滑，簡而言之，美化。圖像算法和音頻算法都有其共通點。圖像是偏向空間處理，例如圖片中的某個區域。圖像很多時候是以二維數據為主，矩

音頻自動增益與靜音檢測算法附完整C代碼

kron gmm input del led sampler 文件 += frame 前面分享過一個算法《音頻增益響度分析 ReplayGain 附完整C代碼示例》主要用於評估一定長度音頻的音量強度，而分析之後，很多類似的需求，肯定是做音頻增益，提高音量諸如此類做法。

音頻自動增益與靜音檢測算法附完整C代碼【轉】

free 例如般的 ron nbsp bsp log 梳理 .cn 轉自：https://www.cnblogs.com/cpuimage/p/8908551.html 前面分享過一個算法《音頻增益響度分析 ReplayGain 附完整C代碼示例》主要用於評估一定長

音頻增益響度分析 ReplayGain 附完整C代碼示例【轉】

.html ssi ifdef bar read IT 輸出標準 avi 轉自：http://www.cnblogs.com/cpuimage/p/8846951.html 人們所熟知的圖像方面的3A算法有： AF自動對焦(Automatic Focus)自動對焦即調

浮點數據有損壓縮算法附完整C代碼

com ldr dct vip deb from stdio.h 也好提升在幾年前的時候在做修圖APP算法的時候，曾經一度想過對3D Lut 預設數據進行壓縮，主要用於提升用戶體驗。關於3d lut算法開源的資源也挺多的，就不多做科普了。有興趣的朋友，可以去查閱

MTCNN人臉檢測附完整C++代碼

若有文件 nta return 版本 list warnings rtt task 人臉檢測識別一直是圖像算法領域一個主流話題。前年 SeetaFace 開源了人臉識別引擎，一度成為熱門話題。雖然後來SeetaFace 又放出來 2.0版本，但是，我說但是。。。沒

推薦系統架構-(附ppt&代碼）

Part1.樂視網視頻推薦系統

Part2.RoadMap of YouTube isrecommendation System（Ke Wang）PPT

Part3 58同城智能推薦系統的演進和實踐 詹坤林

Part4 58個性化推薦push系統

相關推薦

Part3 58同城智能推薦系統的演進和實踐詹坤林