梯度下降、隨機梯度下降、方差減小的梯度下降(matlab實現)

阿新 • • 發佈：2018-12-25

梯度下降程式碼：

function [ theta, J_history ] = GradinentDecent( X, y, theta, alpha, num_iter )
m = length(y);
J_history = zeros(20, 1);
i = 0;
temp = 0;
for iter = 1:num_iter
     temp = temp +1;
     theta = theta - alpha / m * X' * (X*theta - y);
     if temp>=100
         temp = 0;
         i = i + 1;
         J_history(i) = ComputeCost(X, y, theta);
     end
end
end

隨機梯度下降程式碼：

function [ theta,J_history ] = StochasticGD( X, y, theta, alpha, num_iter )
m = length(y);
J_history = zeros(20, 1);
temp = 0;
n = 0;
for iter = 1:num_iter
     temp = temp + 1;
     index = randi(m);
     theta = theta -alpha * (X(index, :) * theta - y(index)) * X(index, :)';
     if temp>=100
         temp = 0;
         n = n + 1;
         J_history(n) = ComputeCost(X, y, theta);
     end
end
end

方差減小的梯度下降(SVRG)：

function [ theta_old, J_history ] = SVRG( X, y, theta, alpha )
theta_old = theta;
n = length(y);
J_history = zeros(20,1);
m = 2 * n;
for i = 1:20
     theta_ = theta_old;
     Mu = 1/n * X' * (X*theta_ - y);
     theta_0 = theta_;
     for j = 1:m
         index = randi(n);
         GD_one = (X(index, :) * theta_0 - y(index)) * X(index, :)';
         GD_ = (X(index, :) * theta_ - y(index)) * X(index, :)';
         theta_t = theta_0 - alpha * (GD_one - GD_ + Mu);
         theta_0 = theta_t;
     end
     J_history(i) = ComputeCost(X, y, theta_t);
     theta_old = theta_t;
end
end

損失函式：

function J = ComputeCost( X, y, theta )
m = length(y);
J = sum((X*theta - y).^2) / (2*m);
end

主程式程式碼：

%% clean workspace
clc;
clear;
close all;
%% plot data
fprintf('plot data... \n');
X = load('ex2x.dat');
y = load('ex2y.dat');
m = length(y);
figure;
plot(X,y,'o');
%% gradient decent
fprintf('Runing gradient decent... \n');
X = [ones(m,1),X];
theta_SGD = zeros(2, 1);
theta_GD = zeros(2, 1);
theta_SVRG = zeros(2, 1);

Iteration = 2000;
alpha = 0.015;
alpha1 = 0.025;

[theta ,J]= StochasticGD(X, y, theta_SGD, alpha, Iteration);
[theta1 ,J1]= GradinentDecent(X, y, theta_GD, alpha, Iteration);
[theta2 ,J2]= SVRG(X, y, theta_SVRG, alpha1);

fprintf('SGD: %f %f\n',theta(1),theta(2));
fprintf('GD: %f %f\n',theta1(1),theta1(2));
fprintf('SVRG: %f %f\n',theta2(1),theta2(2));

hold on;
plot(X(:, 2), X*theta, 'r-');
plot(X(:, 2), X*theta1, 'g-');
plot(X(:, 2), X*theta2, 'b-');
legend('','SGD','GD','SVRG');

x_j = 1:1:20;
figure;
hold on;
plot(x_j, J, 'b-');
plot(x_j, J1, 'g-');
plot(x_j, J2, 'r-');
legend('SGD','GD','SVRG');
xlabel('epoch')
ylabel('loss')

實驗結果：

高斯分佈中均值，方差，協方差的計算及matlab實現

今天看論文的時候又看到了協方差矩陣這個破東西，以前看模式分類的時候就特困擾，沒想到現在還是搞不清楚，索性開始查協方差矩陣的資料，惡補之後決定馬上記錄下來，嘿嘿~本文我將用自認為循序漸進的方式談談協方差矩陣。統計學的基本概念學過概率統計的孩子都知道，統計裡最

梯度下降、隨機梯度下降、方差減小的梯度下降(matlab實現)

梯度下降程式碼： function [ theta, J_history ] = GradinentDecent( X, y, theta, alpha, num_iter ) m = length(y); J_history = zeros(20, 1); i = 0; temp = 0; for it

Json、數組方法、隨機函數、數組去重

輕量級支持實例 ima pre 數據交換格式 abc 使用 var 一、Json 1Json（JavaScript Object Notation, JS 對象標記) 是一種輕量級的數據交換格式。 2.Json語法規則在 JS 語言中，一切都是對象。因此，任何支持的類

演算法初級02——荷蘭國旗問題、隨機快速排序、堆排序、桶排序、相鄰兩數的最大差值問題、工程中的綜合排序演算法

主要討論：荷蘭國旗問題、隨機快速排序、堆排序、穩定性、比較器、桶排序、相鄰兩數的最大差值問題和簡單介紹工程中的綜合排序演算法題目一給定一個數組arr，和一個數num，請把小於等於num的數放在陣列的左邊，大於num的數放在陣列的右邊。要求額外空間複雜度O(1)，時間複雜度O(N)

javaSE (三十三）其他流（序列流、記憶體輸出流、隨機訪問流、物件操作流、資料輸入輸出流、列印流、標準輸入輸出流、properties）

1、序列流（SequenceInputStream ）：序列流主要的作用就是整合位元組輸入流，將很多的進口整合成一個這裡著重講一下多於兩個輸入流的整合：步驟：建立三個輸入流建立vector集合存入這些輸入流將這些輸入流變成列舉型別 Vector.e

演算法初級02——荷蘭國旗問題、隨機快速排序、堆排序

public static void heapSort(int[] arr) { if (arr == null || arr.length < 2) { return; } for (int i = 0; i <

python機器學習案例系列教程——整合學習（Bagging、Boosting、隨機森林RF、AdaBoost、GBDT、xgboost）

可以通過聚集多個分類器的預測結果提高分類器的分類準確率，這一方法稱為整合（Ensemble）學習或分類器組合（Classifier Combination），該方法由訓練資料構建一組基分類器（Base Classifier），然後通過對每個基分類器的預測進行

向量的期望值、均值向量和協方差矩陣

向量隨機變數X的數學期望也是一個向量，其各分量是原X的各個分量的數學期望。如果f(x)是d維隨機變數X的n維向量函式則其數學期望定義如下:

關於向量的期望值、均值向量和協方差矩陣

轉載：https://blog.csdn.net/dbj2009/article/details/48949871 向量隨機變數X的數學期望也是一個向量，其各分量是原X的各個分量的數學期望。如果f(x)是d維隨機變數X的n維向量函式

協方差矩陣與PCA+Matlab

協方差矩陣與特徵值及其特徵向量最近在利用協方差矩陣計算些東西，對結果有點混亂，所以打算整理一下這方面的東西。一協方差矩陣首先，關於協方差矩陣的公式都見得到這裡就不擺了。理解協方差矩陣是：協方差矩陣相對於協方差是能處理多維問題輸入協方差矩陣中的資料

random forest 隨機森林（高亮！用於分類） matlab實現

最近要用到隨機森林，於是乎對它的原理了解了一番，並做了一下演算法的實現。本次實現是用於分類問題的，如果是迴歸問題，分裂規則不一樣，我還沒有實現..... 下面的原理摘自別人的筆記，如果瞭解決策樹CART的構建規則ID3或者C4.5的話，這部分原理的內容應該還

梯度下降法的三種形式批量梯度下降法、隨機梯度下降以及小批量梯度下降法

梯度下降法的三種形式BGD、SGD以及MBGD 梯度下降法的三種形式BGD、SGD以及MBGD 閱讀目錄 1. 批量梯度下降法BGD 2. 隨機梯度下降法SGD 3. 小批量梯度下降法MBGD 4. 總結在應用機器學習演

梯度下降法的三種形式BGD（批量梯度下降）、SGD（隨機梯度下降）以及MBGD（小批量梯度下降）

在應用機器學習演算法時，我們通常採用梯度下降法來對採用的演算法進行訓練。其實，常用的梯度下降法還具體包含有三種不同的形式，它們也各自有著不同的優缺點。　　下面我們以線性迴歸演算法來對三種梯度下降法進行比較。　　一般線性迴歸函式的假設函式為：

批量梯度下降(BGD)、隨機梯度下降(SGD)以及小批量梯度下降(MBGD)的理解

梯度下降法作為機器學習中較常使用的優化演算法，其有著三種不同的形式：批量梯度下降（Batch Gradient Descent）、隨機梯度下降（Stochastic Gradient Descent）以及小批量梯度下降（Mini-Batch Gradient

【重磅】批量梯度下降、隨機梯度下降、小批量梯度下降

梯度下降有三種 1. 批量梯度下降（Batch Gradient Descent，BGD） 2. 隨機梯度下降（Gradient Descent，SGD） 3. 小批量梯度下降（Mini-Batch Gradient Descent，MBGD）不同點在於損失函式使用

梯度下降、隨機梯度下降、批量梯度下降

前言最近實驗集體學習機器學習，其中涉及到梯度下降及其變體，不是很清楚，看了好多資料和部落格。在這裡整理總結一下。如果哪裡寫得不對，請大家指正。一、批量梯度下降（BGD）梯度下降是機器學習中應用最廣泛的優化演算法，也是最常見的優化演算法。

梯度、梯度下降法、隨機梯度下降法

一、梯度gradient 在標量場f中的一點處存在一個向量G，該向量方向為f在該點處變化率最大的方向，其模也等於這個最大變化率的數值，則向量G稱為標量場f的梯度。在向量微積分中，標量場的梯度是一個向量場。標量場中某一點上的梯度指向標量場增長最快的方向，梯度的

三種梯度下降的方式：批量梯度下降、小批量梯度下降、隨機梯度下降

在機器學習領域中，梯度下降的方式有三種，分別是：批量梯度下降法BGD、隨機梯度下降法SGD、小批量梯度下降法MBGD，並且都有不同的優缺點。下面我們以線性迴歸演算法（也可以是別的演算法，只是損失函式（目標函式）不同而已，它們的導數的不同，做法是一模一樣的）為例子來對三種梯度下

梯度下降法、隨機梯度下降法、批量梯度下降法及牛頓法、擬牛頓法、共軛梯度法

引言李航老師在《統計學習方法》中將機器學習的三要素總結為：模型、策略和演算法。其大致含義如下：模型：其實就是機器學習訓練的過程中所要學習的條件概率分佈或者決策函式。策略：就是使用一種什麼樣的評價，度量模型訓練過程中的學習好壞的方法，同時根據這個方

深度學習之（十一）Deep learning中的優化方法：隨機梯度下降、受限的BFGS、共軛梯度法

　　三種常見優化演算法：SGD（隨機梯度下降），LBFGS（受限的BFGS），CG（共軛梯度法）。 1.SGD（隨機梯度下降）隨機梯度下降(Stochastic Gradient Descent, SGD)是隨機和優化相結合的產物，是一種很神奇的優化方法，屬於

梯度下降、隨機梯度下降、方差減小的梯度下降(matlab實現)

相關推薦