1. 程式人生 > >機器學習基礎(三十五)—— 協同過濾(從匹配使用者到匹配商品)

機器學習基礎(三十五)—— 協同過濾(從匹配使用者到匹配商品)

考慮如下的使用者對影片的打分,由巢狀字典定義:

critics = {'Lisa Rose': {'Lady in the Water': 2.5, 'Snakes on a Plane': 3.5,
                         'Just My Luck': 3.0, 'Superman Returns': 3.5, 'You, Me and Dupree': 2.5,
                         'The Night Listener': 3.0},
           'Gene Seymour': {'Lady in the Water'
: 3.0, 'Snakes on a Plane': 3.5, 'Just My Luck': 1.5, 'Superman Returns': 5.0, 'The Night Listener': 3.0, 'You, Me and Dupree': 3.5}, 'Michael Phillips': {'Lady in the Water': 2.5, 'Snakes on a Plane': 3.0, 'Superman Returns'
: 3.5, 'The Night Listener': 4.0}, 'Claudia Puig': {'Snakes on a Plane': 3.5, 'Just My Luck': 3.0, 'The Night Listener': 4.5, 'Superman Returns': 4.0, 'You, Me and Dupree': 2.5}, 'Mick LaSalle': {'Lady in the Water': 3.0, 'Snakes on a Plane'
: 4.0, 'Just My Luck': 2.0, 'Superman Returns': 3.0, 'The Night Listener': 3.0, 'You, Me and Dupree': 2.0}, 'Jack Matthews': {'Lady in the Water': 3.0, 'Snakes on a Plane': 4.0, 'The Night Listener': 3.0, 'Superman Returns': 5.0, 'You, Me and Dupree': 3.5}, 'Toby': {'Snakes on a Plane': 4.5, 'You, Me and Dupree': 1.0, 'Superman Returns': 4.0}}

我們知道如何為指定人員尋找品味相近者,通過歐氏距離或者皮爾遜相關度係數。假如我們想了解哪些商品之間是彼此接近的,又該如何做呢。這一現實應用即是,各大電商網站的“瀏覽該商品的使用者同時購買了”諸如此類的推薦。

我們通過檢視哪些人喜歡某一特定物品,如同某個人喜歡哪些商品一樣,然後像定義使用者之間的相似度一樣,定義商品之間的相似度。

def transformPrefs(prefs):
    result = {}
    for p in prefs:
        for item in prefs[p]:
            result.setdefault(item, {})
            result[item][p] = prefs[p][item]
                                                # 活脫脫一個轉置
    return result