【推薦演算法】協同過濾演算法——基於使用者 Java實現

阿新 • • 發佈：2019-01-01

基本概念就不過多介紹了，相信能看明白的都瞭解。如果想了解相關推薦先做好知識儲備：
1.什麼事推薦演算法
2.什麼是基於鄰域的推薦演算法

筆者選用的是GroupLens的MoviesLens資料
傳送門GroupLens

資料集處理

此處擷取資料 UserId + MovieId 作為隱反饋資料。個人的實現方式並不是很好，之後再考慮優化，如果有好的想法歡迎小紙條。
基本設定專案結構如下：


    /project
        /analyzer --推薦分析
            -CollaborativeFileringanalyzer
        /bean --資料元組 

            -BasicBean
            -HabitsBean
        /input --輸入設定
            -ReaderFormat
        /recommender --推薦功能
            -UserRecommender

首先思路是擷取MovieLens資料，轉化為格式化的書籍格式。MovieLens資料基本格式為

讀取後的資料為表結構，實際可以用 Map 或者 二維陣列 進行儲存。
考慮到之後轉化的問題，決定用二維陣列。

設定BasicBean用於儲存表結構中的行，主要設定List < String >用於儲存一行資料中的單項資料

    /**
     * A row of data sets describes in witch the parameters are included.
     * 
     * @author wqd 
     * 2016/01/18
     */
    public class BasicBean {
        private List<String> parameters;
    //  private int num;
        private 
 boolean tableHead;

        ///Default constructor,the row set n floders and is or not a table head
        public BasicBean(boolean head) {
            parameters = new ArrayList<String>();
            this.tableHead = head;
        }

        //Default constructor,the row set table head and how much the row 
        //set is defined by the variable parameters,it isn't a table head
        public BasicBean(String... strings) {
            this(false, strings);
        }

        //Default constructor,the row set table head and how much the row 
        //set is defined by the variable parameters and is or not a table head
        public BasicBean(boolean head, String... strings) {
            parameters = new ArrayList<String>();
            for(String string : strings) {
                parameters.add(string);
            }
    //      this.num = parameters.size();
            this.tableHead = head;
        }

        public int add(String param) {
            parameters.add(param);
            return this.getSize();
        }

        //replace a parameter value pointed to a new value
        //If success,return true.If not,return false.
        public boolean set(int index, String param) {
            if(index < this.getSize())
                parameters.set(index, param);
            else
                return false;
            return true;
        }

        //Get the head.If it has table head,return ture.
        //If not,return flase;
        public boolean isHead() {
            return tableHead;
        }

        //Override toString()
        public String toString() {
            StringBuilder str = new StringBuilder(" ");
            int len = 1;
            for (String string : parameters) {
                str.append("\t|" + string);
                if(len++ % 20 == 0)
                    str.append("\n");
            }
            return str.toString();
        }

        //Get number of parameters
        public int getSize() {
            return parameters.size();
        }

        //Get array
        public List<String> getArray() {
            return this.parameters;
        }

        //Get ID of a set
        public int getId() {
            return this.getInt(0);
        }

        public String getString(int index) {
            return parameters.get(index);
        }

        public int getInt(int index) {
            return Integer.valueOf(parameters.get(index));
        }

        public boolean getBoolean(int index) {
            return Boolean.valueOf(parameters.get(index));
        }

        public float getFloat(int index) {
            return Float.valueOf(parameters.get(index));
        }
    }

這邊設定HabitsBean用於儲存，單獨將id進行抽取，直接儲存在Bean中。實際在list中，儲存user item ids，原因是在之後進行操作時，ID操作頻繁。

public class HabitsBean extends BasicBean {
    private int id ;

    //get the ID
    public int getId() {
        return id;
    }

    //set the ID
    public void setId(int id) {
        this.id = id;
    }

    public HabitsBean() {
        this(-1);
    }

    //default id is -1,it means the id hadn't been evaluated
    public HabitsBean(int id) {
        this.id = id;
    }

    //Override Object toString() method
    public String toString() {
        StringBuilder str = new StringBuilder("HabitBean " + this.id + " :");
        str.append(super.toString());
        return str.toString();
    }

}

將元組資料讀取之後，再將元組資料進行壓縮重組，轉化為方便與處理的資料格式。設定ReaderFormat進行處理，Demo如下：

/**
 * This class for reading training and test files.It can 
 * be suitable for Grouplens and other data sets.
 * @author wqd
 *
 */
public class ReaderFormat {
    List<BasicBean> lists;
    List<HabitsBean> formLists;

    public List<BasicBean> read (String filePath) throws IOException {
        @SuppressWarnings("resource")
        BufferedReader in = new BufferedReader(
                new FileReader(filePath));
        String s;
        BasicBean basicBean = null;
        lists = new ArrayList<BasicBean>();
        while((s = in.readLine()) != null) {
//          System.out.println(s);
            String[] params = s.split("\t");

//          for (String string : params) {
//              System.out.println(string);
//          }

            basicBean = new BasicBean(params);
            lists.add(basicBean);
        }
        return lists;
    }

    //combine user log like | userID | habitID | ...
    //to userID and | habitID1 | habitID2 | habitID3 | ...
    //sort the userID
    public List<HabitsBean> formateLogUser(String filePath) throws IOException {
        lists = this.read(filePath);
        formLists = new LinkedList<HabitsBean>();
        HabitsBean row = null;
        for (BasicBean basicBean : lists) {
            if(basicBean.) {
                row = new HabitsBean(1);
                row.setId(basicBean.getInt(0));
                row.add(basicBean.getString(1));
                formLists.add(row);
            } else {
                this.addBinarySerch(formLists, basicBean);
            }
        }
        return formLists;
    }

    //binary serch
    private void addBinarySerch(List<HabitsBean> lists, BasicBean bean) {
        int start = 0;
        int end = lists.size()-1;
        int pointer = (start + end + 1) / 2;
        HabitsBean row = lists.get(pointer);
        while(start <= end) {
            if(row.getId() == bean.getId()) {
                row.add(bean.getString(1));
                lists.set(pointer, row);
                return ;
            } else if(start == end) {
                break;
            }else if(row.getId() > bean.getId()) {

                end = pointer;
            } else if(row.getId() < bean.getId()) {
                start = pointer;
            }
            pointer = (start + end + 1) / 2;
            row = lists.get(pointer);
        }
        HabitsBean newBean = new HabitsBean(bean.getId());
        newBean.add(bean.getString(1));
        lists.add(newBean);
        return ;
    }


    // test
    public static void main(String[] args) {
        ReaderFormat readerFormat = new ReaderFormat();
        try {
            List<HabitsBean> lists = readerFormat.formateLogUser("E:/WorkSpace/Input/ml-100k/u1.base");
            for (HabitsBean habitsBean : lists) {
                System.out.println(habitsBean.toString());
            }
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
    }
}

推薦演算法

協同過濾演算法的核心思想是根據使用者間的相似度，來進行推薦。
N(u)，N(v)表示u，v使用者有過隱性反饋的集合，Jaccard公式

或者採用餘弦相似度

【推薦演算法】協同過濾演算法——基於使用者 Java實現

基本概念就不過多介紹了，相信能看明白的都瞭解。如果想了解相關推薦先做好知識儲備： 1.什麼事推薦演算法 2.什麼是基於鄰域的推薦演算法筆者選用的是GroupLens的MoviesLens資料傳送門GroupLens 資料集處理此處擷取資

【推薦系統】協同過濾

一、協同過濾：找到與某使用者有相同偏好的其它使用者，具體步驟： 1 收集使用者偏好（比如電影推薦時，某使用者對某電影的的打分，評論、轉發等） 2 找到相似的使用者或者物品 3 計算推薦基於使用者的協同過濾：計算使用者之間的相似度使用者A與使用者C很相似，

[機器學習]推薦系統之協同過濾演算法

在現今的推薦技術和演算法中，最被大家廣泛認可和採用的就是基於協同過濾的推薦方法。本文將帶你深入瞭解協同過濾的祕密。下面直接進入正題. 1. 什麼是推薦演算法推薦演算法最早在1992年就提出來了，但是火起來實際上是最近這些年的事情，因為網際網路的爆發，有了更大的資料量可以供我們使用，推薦演算法才有了很大的用武

【小白學推薦1】協同過濾零基礎到入門

**文章轉自公眾號【機器學習煉丹術】，關注回覆“煉丹”即可獲得海量免費學習資料哦！** **** 最近找工作的時候發現，機器學習演算法工程師往往和**推薦演算法** 相關聯，之前對推薦演算法並不瞭解，所以現在我也是零基礎入門一下推薦演算法。這篇文章是我個人的學習筆記。 [TOC] **協同過濾推薦演算

【LeetCode-演算法】63. 不同路徑 II（Java實現）

題目一個機器人位於一個 m x n 網格的左上角（起始點在下圖中標記為“Start” ）。機器人每次只能向下或者向右移動一步。機器人試圖達到網格的右下角（在下圖中標記為“Finish”）。現在考慮網格中有障礙物。那麼從左上角到右下角將會有多少條不同的路徑？

【排序演算法】希爾排序原理及Java實現

1、基本思想：希爾排序也成為“縮小增量排序”，其基本原理是，現將待排序的陣列元素分成多個子序列，使得每個子序列的元素個數相對較少，然後對各個子序列分別進行直接插入排序，待整個待排序列“基本有序”後，最後在對所有元素進行一次直接插入排序。因此，我們要採用跳躍分

Machine Learning第九講【推薦系統】--（一）基於內容的推薦系統

符號介紹：對於每一個使用者j，假設我們已經通過學習找到引數，則使用者j對電影i的評分預測值為：。對於上面的例子：

【資料結構】連結串列的原理及java實現

一：單向連結串列基本介紹連結串列是一種資料結構，和陣列同級。比如，Java中我們使用的ArrayList，其實現原理是陣列。而LinkedList的實現原理就是連結串列了。連結串列在進行迴圈遍歷時效率不高，但是插入和刪除時優勢明顯。下面對單向連結串列做一個介

【分治法】最接近點對問題——Java 實現

問題描述：給定平面上n個點，找其中的一對點，使得在n個點組成的所有點對中，該點對間的距離最小。注： a、嚴格地講，最接近點對可能多餘1對，為簡單起見，只找其中的1對作為問題的解。 b、一個簡單的演算法是——只要將每一個點與其他 n

【資料結構】之二叉樹的java實現

二叉樹的定義：二叉樹是樹形結構的一個重要型別。許多實際問題抽象出來的資料結構往往是二叉樹的形式，即使是一般的樹也能簡單地轉換為二叉樹，而且二叉樹的儲存結構及其演算法都較為簡單，因此二叉樹顯得特別重要。二叉樹(BinaryTree)是n(n≥0)個結點的有限集，它

【推薦精讀】從item-base到svd再到rbm，多種Collaborative Filtering(協同過濾演算法)從原理到實現

〇.說明本文的所有程式碼均可在 DML 找到，歡迎點星星。一.引入推薦系統（主要是CF）是我在參加百度的電影推薦演算法比賽的時候才臨時學的，雖然沒拿什麼獎，但是知識卻是到手了，一直想寫一篇關於推薦系統的文章

基於使用者的協同過濾演算法實現的商品推薦系統

基於使用者的協同過濾演算法實現的商品推薦系統專案介紹商品推薦是針對使用者面對海量的商品資訊而不知從何下手的一種解決方案，它可以根據使用者的喜好，年齡，點選量，購買量以及各種購買行為來為使用者推薦合適的商品。在本專案中採用的是基於使用者的協同過濾的推薦演算法來實現

基於使用者的協同過濾和基於物品的協同過濾推薦演算法圖解

在協同過濾中，有兩種主流方法：基於使用者的協同過濾，和基於物品的協同過濾。具體怎麼來闡述他們的原理呢，看個圖大家就明白了基於使用者的 CF 的基本思想相當簡單，基於使用者對物品的偏好找到相鄰鄰居使用者，然後將鄰居使用者喜歡的推薦給當前使用者。計算上，就是將一個使用者對所有物品

基於協同過濾演算法的推薦

基於協同過濾演算法的推薦（本實驗選用資料為真實電商脫敏資料，僅用於學習，請勿商用）資料探勘的一個經典案例就是尿布與啤酒的例子。尿布與啤酒看似毫不相關的兩種產品，但是當超市將兩種產品放到相鄰貨架銷售的時候，會大大提高兩者銷量。很多時候看似不相關的兩種產品，卻會存在這某種神祕的隱含關係，獲取這種關係將會

吳恩達機器學習（十四）推薦系統（基於梯度下降的協同過濾演算法）

目錄 0. 前言學習完吳恩達老師機器學習課程的推薦系統，簡單的做個筆記。文中部分描述屬於個人消化後的理解，僅供參考。如果這篇文章對你有一點小小的幫助，請給個關注喔~我會非常開心的~ 0. 前言在推薦系統中，主要有兩種方法，基於內容的推薦

基於譜聚類SM演算法的協同過濾推薦演算法研究——清華師兄畢業論文學習

一、個性化推薦演算法 1.相似度的比較兩個商品或者商品之間相似的的計算方法，量化屬性為非數值型資料的商品或者使用者之間的接近程度。通常我們計算使用者或者專案間相似度的主要方法有餘弦相似度（Cosime Similarity）、Jaccard係數和pearson相關(pearson Corr

Java推薦系統-基於使用者的最近鄰協同過濾演算法

基於使用者的最近鄰演算法（User-Based Neighbor Algorithms），是一種非概率性的協同過濾演算法，也是推薦系統中最最古老，最著名的演算法，我們稱那些興趣相似的使用者為鄰居，如果使用者n相似於使用者u，我們就說n是u的一個鄰居。起初演算法，對於未知目標的預測是根據該使用者的

基於協同過濾演算法構建推薦系統

一推薦系統介紹推薦系統是資訊過濾系統的一個子類，它根據使用者的偏好和行為，來向用戶呈現他(或她)可能感興趣的物品。推薦系統會嘗試去預測你對一個物品的喜好，以此向你推薦一個你很有可能會喜歡的物品。我們組設計的系統是一個購物系統，主要包括主頁，商品頁和推薦頁。完整專案效果

【推薦演算法】協同過濾演算法——基於使用者 Java實現

資料集處理

推薦演算法

【推薦演算法】協同過濾演算法——基於使用者 Java實現

【推薦系統】協同過濾

推薦系統中協同過濾演算法實現分析（重要兩個圖！！）

[機器學習]推薦系統之協同過濾演算法

【小白學推薦1】協同過濾零基礎到入門

【LeetCode-演算法】63. 不同路徑 II（Java實現）

【排序演算法】希爾排序原理及Java實現

Machine Learning第九講【推薦系統】--（一）基於內容的推薦系統

【資料結構】連結串列的原理及java實現

【分治法】最接近點對問題——Java 實現

【資料結構】之二叉樹的java實現

【推薦精讀】從item-base到svd再到rbm，多種Collaborative Filtering(協同過濾演算法)從原理到實現

基於使用者的協同過濾演算法實現的商品推薦系統

基於使用者的協同過濾和基於物品的協同過濾推薦演算法圖解

推薦系統（一）基於協同過濾演算法開發離線推薦

基於協同過濾演算法的推薦

吳恩達機器學習（十四）推薦系統（基於梯度下降的協同過濾演算法）

基於譜聚類SM演算法的協同過濾推薦演算法研究——清華師兄畢業論文學習

Java推薦系統-基於使用者的最近鄰協同過濾演算法

基於協同過濾演算法構建推薦系統