1. 程式人生 > >第一篇:你不一定了解的"推薦系統"

第一篇:你不一定了解的"推薦系統"

auto 目錄 主動 類目 好友 mage 放棄 百度 博文

前言

[推薦系統 - 基礎教程]可能是穆晨的所有博文裏,最有趣最好玩的一個系列了^ ^。

作為該系列的[入門篇],本文將輕松愉快地向讀者介紹推薦系統這項大數據領域中的熱門技術。

為什麽要有推薦系統?

從字面意義來看,推薦系統,就是向各位讀者們推薦物品的系統。於是大家自然會想到推銷......

技術分享

顯然,這並不好玩,因為誰也不想被人打擾,而這個"推銷系統"也不是本系列教程要講解的推薦系統。

該問題的根本原因在於:傳統推薦方式太low了;而一個可能讓讀者們感到詫異的事實是:你們已經開始頻繁使用推薦系統了,而且還用得很爽。

不相信?那麽我們來一一列舉吧!

1. 你用過聽歌軟件吧?類似網易雲音樂、QQ音樂、蝦米音樂:

技術分享

2. 你上過網上書店買書吧?類似當當、京東書城、卓越書城:

技術分享

3. 來個新穎點的...你玩過王者榮耀吧?下面截圖你懂的:

技術分享

4. 再來個新穎點的...你還是單身嗎?聽說世紀佳緣、珍愛網這些婚戀網站的對象推薦系統也做得很不錯:

技術分享

5. 其他應用:推薦社交網絡好友、推薦新聞文章、推薦美食......太多太多,這裏就不一一例舉了。

真的不需要推薦系統?

即使筆者舉了上述例子,相信仍有讀者不服,表示他們不需要推薦系統。

這群讀者應該主要分為三類:

1. A類讀者:我就需要那些熱門物品; --- 排行榜是個好東西,但啥都和別人一樣,豈非太無趣了?

2. B類讀者:我喜歡自己去搜索我需要的物品; --- 難道沒試過突然想看本書,但糾結買哪本好?

3. C類讀者:我覺得推薦系統侵犯了我的隱私; --- 那您放棄的可能不只是推薦系統,而是整個互聯網了。

不論這三類讀者有沒被說服,不可否認的是,對於大部分人來說,已經開始擁抱這個新生事物。

另小道消息稱,亞馬遜20%以上的營業額就是通過推薦系統實現的。這不單單是說明推薦系統對物品購買行為有影響,更說明對物品銷售行為有影響:你也許不但能用推薦系統買東西,還能用推薦系統賣東西

推薦系統的本質

推薦系統其本質,是為了幫助人們解決信息過載(Information Overload)問題的一項工具。

所謂信息過載,是指你所真正需要、真正感興趣的東西,被淹沒在其同類物品的海洋裏。因此,為了找到它,你需要耗費巨大的時間和精力。為了解決信息過載問題,截至至今,人們經歷了分類目錄、搜索引擎、推薦系統三個階段。

文將以信息檢索為例,說明人們檢索方式(或者可以理解為解決信息過載方式)的演化:

在N年前,筆者熱衷於使用類似5566這樣的導航網站檢索信息:

技術分享

該網站將其他網站分門別類地整理好,我對哪個類標簽感興趣就可點進去瀏覽相關網站信息。這就是所謂"分類目錄"的檢索方式。

後來,有了百度。筆者直接往裏面輸入關鍵字,它就能提供我想要的網頁,這讓我覺得信息檢索的效率更高了:

技術分享

這就是所謂“搜索引擎”的檢索方式。直至今天,它依然是信息檢索的最主流方法。

再後來,筆者發現QQ經常給我彈出類似這樣的信息:

技術分享

這就是所謂“推薦系統”的方式了:我們不需要主動告訴系統我們對哪類數據感興趣,也不需要提供關鍵字,系統根據我們的歷史行為、偏好數據,將我們需要的信息提供給我們。

仔細一想,這不就是從海量的數據中挖掘知識,這不正是數據挖掘的定義麽?等等,那推薦系統和數據挖掘有什麽關系?好吧,再發散一下,大數據、數據挖掘、機器學習、人工智能、推薦系統等等這些概念又有什麽關系?

哈哈,是不是有點暈了?這幾個問題就留給讀者自行思考吧,思考的過程,也是我們提升對大數據,或者說對數據本身理解的過程。

小結

閱讀完本文,讀者已經體會到了推薦系統的重要意義了吧。

那麽,推薦系統的"後臺"是如何通過建立"高大上"的算法模型,從海量數據中精準地為用戶篩選出其感興趣的物品,並將之推薦給用戶呢?

這就是本系列博文後面將要涉及到的重點內容了。歡迎讀者關註,和穆晨一起探討研究當今火熱的推薦系統技術~!

第一篇:你不一定了解的"推薦系統"