線性迴歸,邏輯迴歸,神經網路,SVM的總結

阿新 • • 發佈：2018-12-16

線性迴歸,邏輯迴歸,神經網路,SVM的總結

線性迴歸,邏輯迴歸,神經網路,SVM的總結

詳細的學習筆記.
markdown的公式編輯手冊.
迴歸的含義: 迴歸就是指根據之前的資料預測一個準確的輸出值.
分類的含義: 分類就是預測離散的輸出值, 比如男生為1, 女生為0(0/1離散輸出問題).
機器學習中往往會有一個假設(hypothesis), 本質上來講$h$代表學習演算法的解決方案或函式.
- $h$可以理解為是我們預先選定的規則或者函式的形式,我們需要不停地得到對應的引數.
- $h$是一個從$x$到$y$的函式對映.

單變數的線性迴歸(Linear Regression with One Variable)

單變數的表達方式(hypothesis function):

$$ h_{\theta(x)};=;\theta_{0}+\theta_{1}x $$
- 因為只含有一個特徵(即輸入變數), 因此這類問題叫作單變數線性迴歸問題.
模型所預測的值與訓練集中實際值之間的差距就是建模誤差(modeling error).
目標函式(代價函式Cost Function): 目標是選擇出可以使得建模誤差的平方和能夠最小的模型引數.
- 代價函式的數學公式的表達為:
  $$ J(\theta_{0},\theta_{1})=\frac{1}{2m}\sum_{i=1}^{m}(h_\theta(x^{(i)}-y^{(i)}))^{2} $$
- 這個公式的$\frac{1}{2m}$是為了求偏導好計算; 大致的意思就是求每個樣本的均方誤差.
- Goal: $\min \limits_{\theta_{0},\theta_{1}}J(\theta_{0},\theta_{1})$, 讓代價函式最小.
- 需要一個有效的演算法, 能夠自動地找出使代價函式$J$取最小值的引數$\theta_{0}$和$\theta_{1}$, 這個演算法就是梯度下降.

梯度下降(Gredient Descent)

梯度下降是一個用來求函式最小的優化演算法, 線上性迴歸的演算法中, 用它來求代價函式$J(\theta_{0},\theta_{1})$的最小值.

梯度下降背後的思想: 開始隨機選擇一個引數組合$(\theta_{0},\theta_{1},\ldots,\theta_{n})$, 計算出代價函式對應的函式值, 然後尋找一個能讓代價函式下降最多的引數組合; 持續這麼做直到找到一個區域性最小值(local minimum),因為沒有嘗試所有的引數組合, 所以不能確定得到的區域性最小值是否為全域性最小值(global minimum), 選擇不同的初始引數組合可能會找到不同的區域性最小值.
批量梯度下降(batch gradient descent)演算法的公式:
$$ \theta_{j}:=\theta_{j} - \alpha\frac{\partial}{\partial\theta_{j}}J(\theta_{0},\theta_{1})\qquad(for,j = 0,,and,;j = 1) $$
- 其中$\alpha$是學習率（learning rate），它決定了我們沿著能讓代價函式下降程度最大的方向向下邁出的步子有多大，在批量梯度下降中，我們每一次都同時讓所有的引數減去學習速率乘以代價函式的導數。
- 梯度下降的過程為:
  - 根據代價函式求出其偏導函式, 因為所謂的梯度就是一階偏導, 也就是沿引數該方向的變化率.
  - 算出梯度的大小值(把上一次的$\theta_{0}$和$\theta_{1}$代入偏導函式求解).
  - 迭代算出可能更好的引數值(就是用原來的$\theta$值減去偏導值乘以學習率的積).
  - 不斷更新$\theta_{0}$和$\theta_{1}$
- $\alpha$太大或太小會出現什麼情況:
  - 如果$\alpha$太小, 即學習速率太小, 需要迭代很多次才能達到區域性最優.
  - 如果$\alpha$太大, 梯度下降可能會越過最低點, 甚至無法收斂, 出現震盪或發散現象.
  - 即使學習率$\alpha$保持不變時, 梯度下降也可以收斂到區域性最優, 因為到最優點時偏導為零呀.
- 批量梯度下降是指在梯度下降的每一步中, 都用到了所有的訓練樣本, 在梯度下降中, 在計算微分求導時, 需要對所有$m$個訓練樣本求和.
- 有的梯度下降法不考慮整個訓練集, 而是每次關注訓練集中的一些小的子集.
梯度下降演算法, 可以用來最小化任何代價函式$J$, 不只是線性迴歸中的代價函式, 只要是凸函式應該都可以使用梯度下降演算法來求解區域性最優.
在資料量較大的情況下, 梯度下降法比正規方程(normal equations)要更適用一些.

多變數的線性迴歸(Linear Regression with Multiple Variables)

第$i$個訓練例項, 就是特徵矩陣中的第$i$行, 是一個向量(vector).
多變數的hypothesis function(假設函式)的數學表達為:$$h_{\theta}(x) = \theta_{0}x_{0}+\theta_{1}x_{1}+\theta_{2}x_{2}+\ldots+\theta_{n}x_{n}$$
- 此時模型有$n+1$維的特徵向量, 特徵矩陣的維度$m*(n+1)$.
- hypothesis function的向量的表示式為: $h_{\theta}(x) = \theta^{T}X$.
多變數的代價函式(cost function)為所有建模誤差的平方和, 數學表達為:
$$J(\theta_{0},\theta_{1},\ldots,\theta_{n})=\frac{1}{2m}\sum_{i=1}^{m}(h_{\theta}(x^{(i)}-y^{(i)}))^{2}$$
- 其中$h_{\theta}(x) = \theta_{0}x_{0}+\theta_{1}x_{1}+\theta_{2}x_{2}+\ldots+\theta_{n}x_{n}$.
目標函式還是要找出使得代價函式最小的一系列引數.
多變數線性迴歸的批量梯度下降演算法為:
$$Repeat{ \theta_{j}:=\theta_{j}-\alpha\frac{\partial}{\partial\theta_{j}}J(\theta_{0},\theta_{1},\ldots,\theta_{n})
}$$
- 求導計算為:
  $$Repeat{ \theta_{j}:=\theta_{j}-\alpha\frac{1}{m}\sum_{i=1}^{m}(h_{\theta}(x^{(i)})-y^{(i)})*x_{j}^{(i)}
  }$$
- python的程式碼實現為:
```
def computeCost(X, Y, theta):
    inner = np.power(((X * theta.T) - y), 2) # 內積
    return np.sum(inner) / (2 * len(X)) # len(X)為行數
```

線性迴歸,邏輯迴歸,神經網路,SVM的總結

目錄線性迴歸,邏輯迴歸,神經網路,SVM的總結線性迴歸,邏輯迴歸,神經網路,SVM的總結詳細的學習筆記. markdown的公式編輯手冊. 迴歸的含義: 迴歸就是指根據之前的資料預測一個準確的輸出值. 分類的含義: 分類就是預測離散的輸出值, 比如男生為1, 女生為0(

AI應用開發基礎傻瓜書系列4-用線性迴歸來理解神經網路的訓練過程

下面我們舉一個簡單的線性迴歸的例子來說明實際的反向傳播和梯度下降的過程。完全看懂此文後，會對理解後續的文章有很大的幫助。為什麼要用線性迴歸舉例呢？因為$y = wx+b$ （其中，y,w,x,b都是標量）這個函式的形式和神經網路中的$Y = WX + B$（其中，Y,W,X,B等都是矩陣）非常近似，

Deep Learning的學習實踐 2 -- 邏輯迴歸和人工神經網路

學習DeepLearning，必須要先學習邏輯迴歸模型（LR）和傳統的人工神經網路模型（ANN），這個是基礎。簡單說一下邏輯迴歸模型（LogisticRegression，這裡翻譯成邏輯迴歸可能不太準確，但是沿用目前大家常用的名稱），這個模型是非常實用的，在工業界的機器

線性迴歸, 邏輯迴歸和線性分類器

本文系轉載，原文地址：http://blog.csdn.net/weixin_35653315/article/details/54599771 線性迴歸, Linear Regression 邏輯迴歸, Logistic Regression 線性分類器, Linear Classifier 邏輯分

輕量化神經網路模型總結：SqueezeNet、Xception、MobileNet、ShuffleNet

總結今年來的幾個輕量化模型：SqueezeNet、Xception、MobileNet、ShuffleNet 下面給出時間軸： 2016.02 伯克利&斯坦福提出 SqueezeNet 2016.10 google提出 Xception 2017

卷積神經網路大總結

大家都清楚神經網路在上個世紀七八十年代是著實火過一回的，尤其是後向傳播BP演算法出來之後，但90年代後被SVM之類搶了風頭，再後來大家更熟悉的是SVM、AdaBoost、隨機森林、GBDT、LR、FTRL這些概念。究其原因，主要是神經網路很難解決訓練的問題，比如梯度消

logistic regression（LR）對數機率迴歸 / 邏輯迴歸公式推導

因為是傻瓜式教程，所以一定會非常詳細！一些概念link到了Wiki的相應解釋上。歡迎捉蟲~！二分類和迴歸的關係考慮x⇒y 表示的二分類或迴歸問題，其中x 是輸入，y 是輸出。 1. 在二分類中，y 的值取0或1，代表被分為正類或負類。在迴歸中，y 的取值為連續值。 2. 線上

機器學習之 Logistic 迴歸(邏輯迴歸)

目錄 Logistic迴歸部落格園地址：https://www.cnblogs.com/chenyoude/ git 地址：https://github.com/nickcyd/machine_learning 微信：a1171958281 Logistic 迴

神經網路大總結

1、感知神經網路構造方法： <span style="font-size:18px;">net=newp(PR,S,TF,LF)</span>PR：表示R*2矩陣，表示資料的大小範圍，minmax函式就可以 S：表示神經元個數，主要表示隱含層和輸

python實現信用卡欺詐檢測 logistic迴歸邏輯迴歸演算法

1.資料集下載：連結: https://pan.baidu.com/s/1zUxSxwiProvfmAAWjyYb4w 密碼: 6eai 程式碼下載：連結: https://pan.baidu.com/s/1KyVOEU3p-sfCQIauCXGWIA 密碼:

神經網路機器翻譯總結

神經網路機器翻譯(Neural Machine Translation, NMT)是最近幾年提出來的一種機器翻譯方法。相比於傳統的統計機器翻譯（SMT）而言，NMT能夠訓練一張能夠從一個序列對映到另一個序列的神經網路，輸出的可以是一個變長的序列，這在翻譯、對話和

6、神經網路學習總結

package com.jd; import java.io.BufferedReader; import java.io.FileReader; import java.util.ArrayList; import java.util.List; // 輸

Tensorflow學習筆記 (基礎-第一篇)------ 搭建神經網路，總結搭建八股

---- 內容 1、基本概念 2、神經網

【原】Andrew Ng斯坦福機器學習 Coursera—Programming Exercise 3 邏輯迴歸多分類和神經網路

作業說明 Exercise 3，Week 4，使用Octave實現手寫數字0-9的識別，採用兩種方式（1）邏輯迴歸多分類（2）三層神經網路多分類。對比結果。每張圖片20px * 20px，也就是一共400個特徵（因為Octave裡從1開始。所以將0對映為10）（1）邏輯迴歸多分類：實現 lrCost

Keras搭建第一個神經網路（線性迴歸）

Keras介紹： Keras 是一個相容 Theano 和 Tensorflow 的神經網路高階包, 用他來元件一個神經網路更加快速, 幾條語句就能搞定。而且廣泛的相容效能使 Keras 在 Windows 和 MacOS 或者 Linux 上執行無阻礙。 Keras安裝：首先確認

吳恩達《神經網路與深度學習》課程筆記歸納（二）-- 神經網路基礎之邏輯迴歸

上節課我們主要對深度學習（Deep Learning）的概念做了簡要的概述。我們先從房價預測的例子出發，建立了標準的神經網路（Neural Network）模型結構。然後從監督式學習入手，介紹了Standard NN，CNN和RNN三種不同的神經網路模型。接著介紹了兩種不

【深度學習基礎1】神經網路基礎--邏輯迴歸

本博文根據 coursera 吳恩達深度學習整理。作為理解神經網路的基礎。一、知識點深度學習本質上是對資料的一種擬合。使用非線性的函式集合作為模型，對樣本對進行損失最小的模擬。首先理解單個神經元的作用和原理，可以從

神經網路（二）：Softmax函式與多元邏輯迴歸

一、 Softmax函式與多元邏輯迴歸為了之後更深入地討論神經網路，本節將介紹在這個領域裡很重要的softmax函式，它常被用來定義神經網路的損失函式（針對分類問題）。根據機器學習的理論，二元邏輯迴歸的模型公式可以寫為如下的形式： (1)P(y=1)=11

機器學習——單層神經網路線性迴歸解釋解實現

線性迴歸機器學習——單層神經網路線性迴歸從零實現上篇部落格使用小批量隨機梯度下降法對loss函式進行優化，這篇部落格將從解釋解角度（即直接求解）對演算法進行優化。演算法實現 import matplotlib.pyplot as plt from mpl_t

機器學習演算法總結--線性迴歸和邏輯迴歸

1. 線性迴歸簡述在統計學中，線性迴歸（Linear Regression）是利用稱為線性迴歸方程的最小平方函式對一個或多個自變數和因變數之間關係進行建模的一種迴歸分析。這種函式是一個或多個稱為迴歸係數的模型引數的線性組合（自變數都是一次方）。只有一

線性迴歸,邏輯迴歸,神經網路,SVM的總結