優化演算法（一）SGD演算法實現

阿新 • • 發佈：2019-01-02

SGD隨機梯度下降演算法，和最常用的GD相比，GD每一次迭代都是所有樣本都一起進行計算，而SGD是每一次迭代中每個樣本分別進行計算，梯度演算法的最終目標是減少cost值，訓練出最優的引數值，GD每一次迭代都讓所有樣本去優化引數，一次迭代進行一次優化，而SGD一次只讓一個樣本去優化引數。

貼一下程式碼：

#SGD（w初始化使用 2/sqrt（l-1））
def SGD_model(X,Y,layer_dims,iter_times,alphs):
    costs = []
    m = X.shape[1]
    n = X.shape[0]
    np.random.seed(3)
    parameters = initialize_parameters(layer_dims)
    for i in range(0,iter_times):
        for j in range(0,m):
            A,caches=forward_propagation(X[:,j].reshape(n,1),parameters)
            cost=cpmpute_cost(A,Y[:,j].reshape(1,1))
            grads=back_propagation(Y[:,j].reshape(1,1),caches,parameters)
            parameters=update_parameters(parameters,grads,alphs)
            costs.append(cost)
        if i%100 == 0:
            print(cost)
    return costs,parameters

測試一下：

n=train_data_finalX.shape[0]
layer_dims=[n,20,7,5,1]
costs,parameters=SGD_model(train_data_finalX,train_data_finalY,layer_dims,500,0.0003)
 
y_pred_train=predict(train_data_finalX,parameters)
print('train acc is ',np.mean(y_pred_train == train_data_finalY)*100,'%')    
 
y_pred_test=predict(test_data_finalX,parameters)
print('test acc is ',np.mean(y_pred_test == test_data_finalY)*100,'%')

#可以看到cost減低的是很快的，這裡打印出來的cost並不是每一次的cost值，只是挑著列印了幾個
#這個cost也不是所有樣本cost值加起來得到的，其實還是單個樣本的cost值
#過擬合現象還是很嚴重的

0.6967667264512503
0.3580429544797275
0.1366511629971142
0.013014664339787691
0.005059855441099931
train acc is  100.0 %
test acc is  84.0 %

特別要注意的是，可能會遇到cost值不降低，或者降低到一定值以後就不變了，這種情況預測值得到的可能都是0，可以試試這幾個解決辦法：

w引數初始化，不要選擇在random以後乘以0.01，如果啟用函式使用的是tanh函式，使用（1/sqrt（上一層單元數）），如果使用的是relu則試試（2/sqrt（上一層單元數）），引數初始化對結果有很大的影響力度。
學習因子設定的小一點
如果出現嚴重的過擬合現象，可以試試增加隱藏層，或者隱藏層單元數

優化演算法（一）SGD演算法實現

SGD隨機梯度下降演算法，和最常用的GD相比，GD每一次迭代都是所有樣本都一起進行計算，而SGD是每一次迭代中每個樣本分別進行計算，梯度演算法的最終目標是減少cost值，訓練出最優的引數值，GD每一次迭代都讓所有樣本去優化引數，一次迭代進行一次優化，而SGD一次只讓一個樣本去

演算法（一）：演算法簡介

演算法簡介 ● 什麼是演算法 ➢一系列的計算步驟，用來將輸入資料轉化成輸出結果 ● 演算法的意義 ➢用於解決特定的問題 ➢解決同一個問題的不同演算法的效率常常相差非常大，這種差距的影響往往比硬體和軟體方面的差距還要大 ● 比較常聽到的

演算法（一）排序演算法（桶排序、氣泡排序、快速排序）

第一次排序：首先，找一個"基準數"，比如5，然後，先從右到左，找到第一個小於基準數的數，4，再從左到右，找到第一個大於基準數的數，9將它們進行交換，5，1,4,26,2,9,5,7,52,21繼續從右到左，尋找小於基準數的數，從左到右，尋找大於基準數的數，並交換，直到兩個相遇，5,1,4,2,26,9,5,7

常用聚類演算法（一） DBSCAN演算法

1、DBSCAN簡介 DBSCAN（Density-Based Spatial Clustering of Applications with Noise，具有噪聲的基於密度的聚類方法）是一種基於密度的空間聚類演算法。該演算法將具有足夠密度的區域劃分為簇，並在具有噪聲的

重拾演算法（一）：演算法效率分析（空間複雜度和時間複雜度）

前言：演算法效率分析分為兩種：第一種是時間效率，第二種是空間效率。時間效率被稱為時間複雜度，而空間效率被稱作空間複雜度。時間複雜度主要衡量的是一個演算法的執行速度，而空間複雜度主要衡量一個演算法所需要的額外空間，在計算機發展的早期，計算機的儲存容量很小。所以對空間複雜

目標檢測演算法（一）——常見演算法比較

一、分類：幀間差分法、背景減除法和光流法。 (1)背景減除法通過統計前若千巾貞的變化情況,從而學習背景擾動的規律。此類演算法的缺點是由於通常需要緩衝若干幀頻來學習背景,因此往往需要消耗大量的記憶體,這使其使用範圍受到了限制。此外,對於大範圍的背景擾動,此類演算法的檢測

最短路徑演算法（一） Dijkstra演算法（貪心演算法）

Dijkstra演算法是由荷蘭電腦科學家狄克斯特拉（Dijkstra）於1959 年提出的，因此又叫狄克斯特拉演算法。是從一個頂點到其餘各頂點的最短路徑演算法，解決的是有向圖中最短路徑問題。其基本原理是：每次新擴充套件一個距離最短的點，更新與其相鄰的點的距離。當所有邊權都為正

Logistic迴歸之梯度上升優化演算法（一）

Logistic迴歸之梯度上升優化演算法一、Logistic迴歸首先我們需要了解什麼是Logistic迴歸。Logistic迴歸是一種分類演算法，一般用於二分類問題，例如預測明天是否下雨，當然也可以用於多分類問題。本文主要是討論二分類問題。二分類問題即輸出結果一般只有兩個情況，我們可以理

Python實現邏輯迴歸演算法（一）

本次用Python實現邏輯迴歸演算法，邏輯迴歸是應用非常廣泛的一個分類及其學習演算法，它將資料擬合到一個logit函式中，從而完成對事件發生的概率進行預測。本次學習筆記主要參考了《Python進行資料分析與挖掘實踐》和作者@寒小陽的部落格，地址如下：http://blog.c

資料探勘十大演算法（一）：決策樹演算法 python和sklearn實現

學完到第三章——決策樹，python程式碼實現的僅是ID3演算法，sklearn為優化過的C4.5，這裡做一個詳細的總結包括（原理、程式碼、視覺化、scikit-learn實現），皆為親自實踐後的感悟。以下進入正文。早前簡單瞭解了決策樹的原理，然後為了儘快使用便沒有深究直

MATLAB R2018a 全域性優化工具箱學習（一）遺傳演算法

Global Optimization Toolbox 在MATLAB R2018a 中發現了全域性優化的工具箱以及增加的資料和機器學習工具箱，對於求解全域性最優值很是方便。 MATLAB Global Optimization Toolbox 學習：全域性

matlab學習筆記（1）——粒子群優化演算法（PSO）的程式實現

本文內容參考matlab R2016a完全自學一本通。粒子群優化演算法（PSO）屬於進化演算法的一種，它從隨機解出發，通過迭代找到最優解。該演算法通過適應度來評價解的品質，並通過追隨當前搜尋到的最優值來尋找全域性最優。假設在一個D維的目標搜尋空間

基本粒子群優化演算法（PSO）的matlab實現

粒子群優化演算法是一種模擬鳥群社會行為的群體搜素演算法。它分為全域性最佳粒子優化和區域性最佳粒子優化，對於全域性最佳PSO，或者叫做gbest PSO，每個粒子的鄰域都是整個群，其演算法虛擬碼如下：建立並初始化一個n維的粒子群 repeat for 每個粒子i=

教你實現SVM演算法（一）

什麼是機器學習（Machine Learning）機器學習是研究計算機怎樣模擬或實現人類的學習行為，以獲取新的知識或技能，重新組織已有的知識結構使之不斷改善自身的效能。它是人工智慧的核心，是使計算機具有智慧的根本途徑，其應用遍及人工智慧的各個領域。機器學習的大致

手把手教你實現SVM演算法（一）

什麼是機器學習（Machine Learning）機器學習是研究計算機怎樣模擬或實現人類的學習行為，以獲取新的知識或技能，重新組織已有的知識結構使之不斷改善自身的效能。它是人工智慧的核心，是使計算機具有智慧的根本途徑，其應用遍及人工智慧的各個領域。機器學習

機器學習演算法（一）——關聯規則Apriori演算法及R語言實現方法

關聯規則演算法算是一種十分常用的機器學習演算法，無論是面試還是日後工作中都會經常出現，那麼本篇小博就記錄一下自己學習關聯規則經典演算法Apriori的筆記。 1、概述 Apriori演算法是用一種稱為逐層搜尋的迭代方法，從項集長度k=1開始，選出頻繁的k=1項集，根據先驗性

【原始碼】C++實現嚴蔚敏資料結構所有演算法（一）線性表-順序表

日常說明：首先博主也是菜鳥一枚，有錯誤歡迎大家指正。另外本部落格所有的程式碼博主編寫後均除錯通過。重要提醒！！！！博主使用的是VS2017，如果有低版本的小夥伴最好新建空專案將此程式碼複製上去。附加說明：最初的程式碼我沒有嚴格的按照專案規範來分離，希望

幾種常用的排序演算法（一）--python實現

1. 選擇排序，時間複雜度O（n^2），演算法不穩定。思路：（1）迴圈整個陣列 arr，選出最大的數，將它放在空陣列 new_arr 的第一個位置。（2）將剛

全排列及相關擴充套件演算法（一）——基礎的回溯遞迴實現全排列演算法

1.全排列的定義和公式：從n個數中選取m（m<=n）個數按照一定的順序進行排成一個列，叫作從n個元素中取m個元素的一個排列。由排列的定義，顯然不同的順序是一個不同的排列。從n個元素中取m個元素的所有排列的個數，稱為排列數。從n個元素取出n個元素的一個排列，稱為一個全

使用MATLAB模糊資料工具箱和simulink實現單交叉路口交通燈實時配時演算法（一）

作者的碎碎念博主的本職工作是一名白帽子，前段時間由於某些原因研究了一點數學建模，故將自己的一點心得整理成教程，一是自己備忘，二是方便後來者。你問我為什麼研究數學建模？因為我有一顆愛折騰的心，哈哈哈。寫在前面本文是一篇針對數學建模初學者的

優化演算法（一）SGD演算法實現

相關推薦