機器學習筆記（參考吳恩達機器學習視訊筆記）15_推薦系統

阿新 • • 發佈：2018-11-12

15 推薦系統

一個電影提供商，有5部電影和4個使用者。要求使用者為電影打分：

前三部為愛情片，後兩部為動作片。Alice、Bob更傾向於愛情片，Carol、Dave更傾向於動作片。沒有一個使用者給所有的電影打過分。希望構建一個演算法來預測他們每個人可能會給他們每個人可能會給他們沒看過的電影打多少分，並以此作為推薦依據。引入如下標記：

代表使用者數量

代表電影數量

如果使用者j給電影i評過分則=1

代表使用者j給電椅i的評分

代表使用者j評過分的電影總數

15.1 基於內容的推薦系統

基於內容的推薦系統中，推薦的東西需要一些資料，這些資料是有關這些東西的特徵。例如假設每部電影都有兩個特徵，如代表電影的浪漫程度，代表電影的動作程度。

則每部電影都有一個特徵向量，如是第一部電影的特徵向量為[0.9 0]。

基於這些特徵構建一個推薦系統演算法。採用線性迴歸模型，針對每個使用者都訓練一個線性迴歸模型。如是第一個使用者的模型引數。即：

針對單一使用者的代價函式可以表示為：

為了學習所有使用者，將所有使用者的代價函式求和：

15.2 基於協同過濾的推薦系統

基於內容的推薦系統，對於每部電影都有可用的特徵。這些特徵可以訓練出每個使用者的引數。相反地，如果擁有了使用者引數，可以學習得出電影的特徵。

當既沒有使用者引數，也沒有電影特徵時，協同過濾演算法可以同時學習兩者。

在協同過濾演算法中，通常不使用方差項，如果需要，可以自動學得。協同過濾演算法使用步驟如下：

初始為一些隨機小值。
使用梯度下降演算法最小化代價函式。
在訓練完演算法後，預測為使用者j給電影i的評分。

通過這個過程獲得的特徵矩陣包含了有關電影的重要資料，這些資料不總是人能讀懂的，但可以作為給使用者推薦電影的依據。

例如，一位使用者正在觀看電影，可以尋找另一部電影進行推薦，依據兩部電影的特徵向量之間的距離|| ||的大小。

15.3 協同過濾演算法

15.4 向量化：低秩矩陣分解

找到相關影片：

15.5 均值歸一化

機器學習筆記（參考吳恩達機器學習視訊筆記）16_決策樹

16 決策樹決策樹是一種監督學習演算法，以樹狀圖為基礎，其輸出結果為一系列簡單實用的規則。它就是一系列的if-then語句，既可以用於分類問題，也可以用於迴歸問題。構建決策樹之通常包括三個步驟： 1）特徵選擇 &n

機器學習筆記（參考吳恩達機器學習視訊筆記）15_推薦系統

15 推薦系統一個電影提供商，有5部電影和4個使用者。要求使用者為電影打分：前三部為愛情片，後兩部為動作片。Alice、Bob更傾向於愛情片，Carol、Dave更傾向於動作片。沒有一個使用者給所有的電影打過分。希望構建一個演算法來預測他們每個人可能會給他們每個人可能會給他們沒

機器學習筆記（參考吳恩達機器學習視訊筆記）14_異常檢測

14 異常檢測異常檢測（Anomaly detection）是機器學習演算法的一個常見應用。這種演算法的一個有趣之處在於：它雖然主要用於非監督學習問題，但從某些角度看，它又類似於一些監督學習問題。異常檢測主要用來識別欺騙。例如線上採集而來的有關使用者的資料，一個特徵向量中可能會包含如

機器學習筆記（參考吳恩達機器學習視訊筆記）13_降維

13 降維 13.1 動機一：資料壓縮假設兩個未知的特徵：是用釐米表示長度；是用英寸表示同一物體的長度。這是一種高度冗餘的表示。希望將這個二維的資料降至一維，即資料壓縮。 13.2 動機二：資料視覺化化降維可以使資料視覺化。關於許多不同國家的資料，每一個特徵向量都有50

機器學習筆記（參考吳恩達機器學習視訊筆記）12_聚類

12 聚類監督學習中，訓練集帶有標籤，目標是找到能夠區分正負樣本的決策邊界，需要根據標籤擬合一個假設函式。非監督學習中，需要將無標籤的訓練資料輸入到一個演算法，此演算法可以找到這些資料的內在結構。一個能夠根據資料的內在結構，將它們分成幾個不同的點集（或簇）的演算法，就被稱為聚類演算法。聚類

機器學習筆記（參考吳恩達機器學習視訊筆記）11_支援向量機

11 支援向量機 11.1 支援向量機的優化目標從邏輯迴歸開始展示我們如何一點一點修改來得到本質上的支援向量機。如圖，一個y=1的樣本，希望趨近於1，意味著當趨近於1時，應當遠大於0。一個y=0的樣本，希望趨近於0，意味著當趨近於0時，應當遠小於0。

機器學習筆記（參考吳恩達機器學習視訊筆記）10_機器學習系統的設計

10 機器學習系統的設計 10.1 構建學習演算法的方法以一個垃圾郵件分類器演算法為例。先要做的決定是如何選擇並表達特徵向量x, 可以選擇一個由 100 個最常出現在垃圾郵件中的詞所構成的列表，根據這些詞是否有在郵件中出現，來獲得我們的特徵向量（出現為 1，不出現為 0），尺寸為 10

機器學習筆記（參考吳恩達機器學習視訊筆記）09_應用機器學習的建議

9 應用機器學習的建議機器學習診斷法：是一種測試方法，通過執行這種測試，可以深入瞭解某種演算法到底是否有用。 9.1 評估假設函式通過評估假設函式來，來避免過擬合和欠擬合問題。模型通過訓練集得出引數後，對測試集運用該模型，有兩種方式計算誤差：對於線性迴歸模型，利用測

機器學習筆記（參考吳恩達機器學習視訊筆記）08_神經網路的學習

8 神經網路的學習 8.1 神經網路的代價函式神經網路的訓練樣本有m個，每個包含一組輸入x和一組輸出訊號y，L表示神經網路層數，表示每層的neuron個數（表示輸出層神經元個數），代表最後一層中處理單元的個數。將神經網路的分類定義為兩種情況：二類分類和多類分類。二類分類：=

機器學習筆記（參考吳恩達機器學習視訊筆記）07_神經網路介紹

7 神經網路介紹當特徵太多時，無論是線性迴歸還是邏輯迴歸模型計算的負荷會非常大。這時需要神經網路。神經網路是一種很古老的演算法，它最初產生的目的是製造能模擬大腦的機器。神經網路是計算量有些偏大的演算法。然而大概由於近些年計算機的執行速度變快，才足以真正執行起大規模的神經網路。類似於神

機器學習筆記（參考吳恩達機器學習視訊筆記）06_正則化

6 正則化 6.1 過擬合問題通過學習得到的假設可能能夠非常好地適應訓練集（代價函式可能幾乎為 0），但是可能會不能推廣到新的資料。如何處理過擬合問題： 1）丟棄一些不能幫助我們正確預測的特徵。可以是手工選擇保留哪些特徵，或者使用一些模型選擇的演算法來幫忙（例如 PCA）。 2

機器學習筆記（參考吳恩達機器學習視訊筆記）04_多變數線性迴歸

4 多變數線性迴歸 4.1 多維特徵代表特徵矩陣中第i行的第j個特徵，也就是第i個訓練例項的第j個特徵。支援多變數的假設函式h表示為：，其中，引入。此時模型中的引數是一個n+1維的向量，特徵矩陣X的維度是m*(n+1)。因此公式可以簡化為：。 4.2 多變數梯度下降在多

機器學習筆記（參考吳恩達機器學習視訊筆記）17_貝葉斯分類器

17 貝葉斯分類器貝葉斯分類是一種分類演算法的總稱，這種演算法均以貝葉斯定理為基礎，故統稱為貝葉斯分類。貝葉斯分類器的分類原理是通過某物件的先驗概率，利用貝葉斯公式計算出其後驗概率，即該物件屬於某一類的概率，選擇具有最大後驗概率的類作為該物件所屬的類。 17.1 貝葉斯

吳恩達機器學習 - 無監督學習——K-means演算法吳恩達機器學習 - 無監督學習——K-means演算法

原吳恩達機器學習 - 無監督學習——K-means演算法 2018年06月25日 12:02:37 離殤灬孤狼閱讀數：181

Coursera 深度學習吳恩達 deep learning.ai 筆記整理（3-2）——機器學習策略

新的 bsp 誤差 spa 歸納空間 font 處理整理一、誤差分析定義：有時我們希望算法能夠勝任人類能做的任務，但是當算法還沒達到人類所預期的性能時，人工檢查算法錯誤會讓你知道接下來做什麽，這也就是誤差分析檢查，發現會把夠狗當恒，是否需要做一個項目專門處理狗

吳恩達機器學習筆記（六） —— 支持向量機SVM

次數括號圖片最小我們支持向量機svm UNC 意思 strong 主要內容：一.損失函數二.決策邊界三.Kernel 四.使用SVM 一.損失函數二.決策邊界對於：當C非常大時，括號括起來的部分就接近於0，所以就變成了：

吳恩達機器學習筆記 —— 19 應用舉例：照片OCR（光學字符識別）

參考 https ocr 噪聲也說字符 www. 定位 cnblogs http://www.cnblogs.com/xing901022/p/9374258.html 本章講述的是一個復雜的機器學習系統，通過它可以看到機器學習的系統是如何組裝起來的；另外也說明了一

吳恩達機器學習課程筆記02——處理房價預測問題（梯度下降演算法詳解）

建議記住的實用符號符號含義 m 樣本數目 x 輸入變數 y 輸出變數/目標變數

吳恩達機器學習筆記（一），含作業及附加題答案連結

吳恩達機器學習筆記（一）標籤（空格分隔）：機器學習吳恩達機器學習筆記一一機器學習簡介機器學習的定義監督學習非監督學習

吳恩達機器學習學習筆記（四）（附作業程式碼註釋）

吳恩達機器學習學習筆記（四）標籤：機器學習吳恩達機器學習學習筆記四代價函式與反向傳播Costfunction and Backpropagation 一代價函式 1邏輯分類的評價函式

機器學習筆記（參考吳恩達機器學習視訊筆記）15_推薦系統

相關推薦