梯度下降算法(1) - Python實現

阿新 • • 發佈：2018-12-07

isp .fig 實現簡單極值 hide precision app 1.2 實現

算法介紹：
梯度下降算法是一種利用一次導數信息求取目標函數極值的方法，也是目前應用最為廣泛的局部優化算法之一。其具有實現簡單、容易遷移、收斂速度較快的特征。在求解過程中，從預設的種子點開始，根據梯度信息逐步叠代更新，使得種子點逐漸向目標函數的極小值點移動，最終到達目標函數的極小值點。
註意，沿梯度正向移動，將獲取目標函數局部極大值（梯度上升算法）；沿梯度反向移動，將獲取目標函數局部極小值（梯度下降算法）。
叠代公式：
設向量$\vec g_k$表示目標函數在種子點$\vec x_k$處的梯度（即一次導數）。此時，根據梯度信息的指導，可以使得種子點更加接近該向量方向的極值點（註意，目標函數真實的極值點是全方向的

）。
求取極小值，沿梯度反方向移動（即梯度下降）：
\begin{equation}\label{eq_1}
\vec x_{k+1} = \vec x_k - {\lambda}_k \vec s_k
\end{equation}
求取極大值，沿梯度正方向移動（即梯度上升）：
\begin{equation}\label{eq_2}
\vec x_{k+1} = \vec x_k + {\lambda}_k \vec s_k
\end{equation}
其中，$\vec s_k = \frac{\vec g_k}{\left| \vec g_k \right|}$代表歸一化梯度，${\lambda}_k$代表種子點沿梯度方向移動的步長幅度參數

。
很顯然，對幅度參數${\lambda}_k$的設置也屬於算法的一部分。最常見的有兩種方法：1）線性搜尋法；2）可調步長法。
線性搜尋法中，在種子點的梯度方向上搜尋到極值點附近的步長幅度參數${\lambda}_k$，然後移動種子點至該方向的極值點處。繼續計算種子點新的梯度方向，並在該方向上移動。直到種子點到達全方向的極值點處，叠代即可終止。
可調步長法中，通常先將${\lambda}_k$設為1。然後依據上面的叠代公式（式$\ref{eq_1}$或式$\ref{eq_2}$），預先計算下一步可能的$x_{k+1}$。如果$x_{k+1}$滿足接近極值點的要求，則將種子點由$x_k$移至$x_{k+1}$，並增加${\lambda}_k$值為原先的$1.2$倍；否則，不移動種子點，並將${\lambda}_k$值減小為原先的$0.5$倍。如此反復叠代計算，逐步移動種子點並改變${\lambda}_k$值至找到極值點為止。由於${\lambda}_k$值隨下一步的預計算情況逐步作出調整，因此筆者也將其稱為動態調整技術

。
從節省計算資源的角度考慮，以下筆者將采用動態調整技術完成對梯度下降算法的示例，僅供參考！

Python代碼實現：
技術分享圖片

 1 import matplotlib.pyplot as plt
 2 import numpy
 3 
 4 
 5 class GD(object):
 6 
 7     def __init__(self, seed=None, precision=1.E-6):
 8         self.seed = GD.get_seed(seed)                    # 梯度下降算法的種子點
 9         self.prec = precision                            # 梯度下降算法的計算精度
10 
11         self.path = list()                               # 記錄種子點的路徑及相應的目標函數值
12         self.solve()                                     # 求解主體
13         self.display()                                   # 數據可視化展示
14 
15     def solve(self):
16         x_curr = self.seed
17         val_curr = GD.func(*x_curr)
18         self.path.append((x_curr, val_curr))
19 
20         omega = 1
21         while omega > self.prec:
22             x_delta = omega * GD.get_grad(*x_curr)
23             x_next = x_curr - x_delta                    # 沿梯度反向叠代
24             val_next = GD.func(*x_next)
25             
26             if numpy.abs(val_next - val_curr) < self.prec:
27                 break
28 
29             if val_next < val_curr:
30                 x_curr = x_next
31                 val_curr = val_next
32                 omega *= 1.2
33                 self.path.append((x_curr, val_curr))
34             else:
35                 omega *= 0.5
36 
37     def display(self):
38         print(‘Iteration steps: {}‘.format(len(self.path)))
39         print(‘Seed: ({})‘.format(‘, ‘.join(str(item) for item in self.path[0][0])))
40         print(‘Solution: ({})‘.format(‘, ‘.join(str(item) for item in self.path[-1][0])))
41 
42         fig = plt.figure(figsize=(10, 4))
43 
44         ax1 = plt.subplot(1, 2, 1)
45         ax2 = plt.subplot(1, 2, 2)
46 
47         ax1.plot(numpy.array(range(len(self.path))) + 1, numpy.array(list(item[1] for item in self.path)), ‘k.‘)
48         ax1.plot(1, self.path[0][1], ‘go‘, label=‘starting point‘)
49         ax1.plot(len(self.path), self.path[-1][1], ‘r*‘, label=‘solution‘)
50         ax1.set(xlabel=‘$iterCnt$‘, ylabel=‘$iterVal$‘)
51         ax1.legend()
52 
53         x = numpy.linspace(-100, 100, 500)
54         y = numpy.linspace(-100, 100, 500)
55         x, y = numpy.meshgrid(x, y)
56         z = GD.func(x, y)
57         ax2.contour(x, y, z, levels=36)
58 
59         x2 = numpy.array(list(item[0][0] for item in self.path))
60         y2 = numpy.array(list(item[0][1] for item in self.path))
61         ax2.plot(x2, y2, ‘k--‘, linewidth=2)
62         ax2.plot(x2[0], y2[0], ‘go‘, label=‘starting point‘)
63         ax2.plot(x2[-1], y2[-1], ‘r*‘, label=‘solution‘)
64 
65         ax2.set(xlabel=‘$x$‘, ylabel=‘$y$‘)
66         ax2.legend()
67 
68         fig.tight_layout()
69         fig.savefig(‘test_plot.png‘, dpi=500)
70 
71         plt.show()
72         plt.close()
73 
74     # 內部種子生成函數
75     @staticmethod
76     def get_seed(seed):
77         if seed is not None:
78             return numpy.array(seed)
79         return numpy.random.uniform(-100, 100, 2)
80 
81     # 目標函數
82     @staticmethod
83     def func(x, y):
84         return 5 * x ** 2 + 2 * y ** 2 + 3 * x - 10 * y + 4
85 
86     # 目標函數的歸一化梯度
87     @staticmethod
88     def get_grad(x, y):
89         grad_ori = numpy.array([10 * x + 3, 4 * y - 10])
90         length = numpy.linalg.norm(grad_ori)
91         if length == 0:
92             return numpy.zeros(2)
93         return grad_ori / length
94 
95 
96 if __name__ == ‘__main__‘:
97     GD()

View Code

筆者所用示例函數為：
\begin{equation}
f(x, y) = 5x^2 + 2y^2 + 3x - 10y + 4
\end{equation}

結果展示：

梯度下降算法(1) - Python實現

isp .fig 實現簡單極值 hide precision app 1.2 實現算法介紹：梯度下降算法是一種利用一次導數信息求取目標函數極值的方法，也是目前應用最為廣泛的局部優化算法之一。其具有實現簡單、容易遷移、收斂速度較快的特征。在求解過程中，從預設的種子點開始

機器學習（一）梯度下降算法的實現及過程分析

回歸 vnc 分布 AC HA 向量 med mar size 機器學習（一）梯度下降算法因為算法最好能應用到實際問題中才會讓讀者感到它的真實的用處，因此首先我來描述一個實際問題（梯度下降算法用以幫助解決該問題）：給定一個指定的數據集，比如由若幹某一

Spark MLib：梯度下降算法實現

測試結果 println tolerance eat print bre AC sim var 聲明：本文參考《大數據：Spark mlib(三) GradientDescent梯度下降算法之Spark實現》 1. 什麽是梯度下降？梯度下降法（英語：Gradient

機器學習公開課筆記第九周之大數據梯度下降算法

機器學習 nbsp gradient min 三種依次再看獲得 mini 一，隨機梯度下降法(Stochastic Gradient Descent) 當訓練集很大且使用普通梯度下降法(Batch Gradient Descent)時，因為每一次$\theta$

感知機2 -- 隨機梯度下降算法

-- 面向 pre 樣本 .net 距離 utf 先後統計學習聲明： 1，本篇為個人對《2012.李航.統計學習方法.pdf》的學習總結。不得用作商用，歡迎轉載，但請註明出處（即：本帖地址）。 2，因為本人在學習初始時有非

【機器學習】對梯度下降算法的進一步理解

獨立 com 線性回歸執行 ont 執行過程 wid 簡單的技術單一變量的線性回歸讓我們依然以房屋為例，如果輸入的樣本特征是房子的尺寸，我們需要研究房屋尺寸和房屋價格之間的關系，假設我們的回歸模型訓練集如下其中我們用 m表示訓練集實例中的實例數量， x代表特

Fuzzy C Means 算法及其 Python 實現——寫得很清楚，見原文

少包均值平均值劃分 gin 及其 end 5% 指數 Fuzzy C Means 算法及其 Python 實現轉自：http://note4code.com/2015/04/14/fuzzy-c-means-%E7%AE%97%E6%B3%95%E5%8F%8A%E

八大排序算法的python實現（三）冒泡排序

解釋實現兩個 blog python odin int 通過順序代碼： #coding:utf-8 #author:徐蔔靈 #交換排序.冒泡排序 L = [1, 3, 2, 32, 5, 4] def Bubble_sort(L): for i in ra

2.4 梯度下降算法（非常重要，重點理解）

eve 最快 style 梯度下降更新叠代 img 平均值圖片已經知道了logistic回歸模型，也知道了損失函數損失函數是衡量單一訓練樣例的效果，還知道了成本函數成本函數用於衡量參數w和b的效果在全部訓練集上面的衡量下面開始討論如何使用梯度下降法來訓練或學習訓

常見排序算法之python實現

uic 位置 cti gte https 最大值 ice 插入排序快速　　本文介紹了幾種常用的排序算法，包含冒泡排序，選擇排序，插入排序，歸並排序，快速排序，堆排序，本文涉及的代碼可以在https://github.com/lianyingteng/Programmin

樸素貝葉斯算法的python實現 -- 機器學習實戰

cut ocl add set 分類器觀察 problem enc 兩個 1 import numpy as np 2 import re 3 4 #詞表到向量的轉換函數 5 def loadDataSet(): 6 postingLi

Kmeans聚類算法及其 Python實現

lap pytho pan 鏈接 nbsp ade 不知道 ans details python Kmeans聚類之後如何給數據貼上聚類的標簽？用了二分Kmeans 來聚類質心和聚類的簇都得到了，不知道如何給每一條數據貼上具體的標簽？這個鏈接下的代碼，可以作為參

梯度下降算法（gradient descent）

調整 none 算法方向導數分享圖片後繼常用也有計算簡述梯度下降法又被稱為最速下降法(Steepest descend method)，其理論基礎是梯度的概念。梯度與方向導數的關系為：梯度的方向與取得最大方向導數值的方向一致，而梯度的模就是函數在該點的方向導數

ng機器學習視頻筆記（二） ——梯度下降算法解釋以及求解θ

表示大於解釋圖片 bubuko eight 閾值自己極小值 ng機器學習視頻筆記（二） ——梯度下降算法解釋以及求解θ （轉載請附上本文鏈接——linhxx）一、解釋梯度算法梯度算法公式以及簡化的代價函數圖，如上圖所示。

監督學習：隨機梯度下降算法（sgd）和批梯度下降算法（bgd）

這就是影響個數執行類型 http 關系 col pla 線性回歸首先要明白什麽是回歸。回歸的目的是通過幾個已知數據來預測另一個數值型數據的目標值。假設特征和結果滿足線性關系，即滿足一個計算公式h(x)，這個公式的自變量就是已知的數據x，

常用排序算法的python實現和性能分析

pos 算法復雜度信息環比數組長度暫時並且直接排序 win 作者：waterxi 原文鏈接一年一度的換工作高峰又到了，HR大概每天都塞幾份簡歷過來，基本上一天安排兩個面試的話，當天就只能加班幹活了。趁著面試別人的機會，自己也把一些基礎算法和一些面試題整了一

經典排序算法及python實現

設計 python get 排序。技術排好序 sort RR 第一部分今天我們來談談幾種經典排序算法，然後用python來實現，最後通過數據來比較幾個算法時間選擇排序選擇排序（Selection sort）是一種簡單直觀的排序算法。它的工作原理是每一次從待排序的數

LeeCode初級算法的Python實現--數組

IT bre true 移動 number 數獨 AI git reverse LeeCode初級算法的Python實現--數組 # -*- coding: utf-8 -*- """ @Created on 2018/6/3 17:06 @author: Zhifeng

數據回歸分類預測的基本算法及python實現

sse 最小 die href cos xgboost 但是預測 split 數據回歸分類預測的基本算法及python實現關於數據的回歸和分類以及分析預測。討論分析幾種比較基礎的算法，也可以算作是比較簡單的機器學習算法。一． KNN算法鄰近算法，可以用

回歸分析特征選擇（包括Stepwise算法） python 實現

排序 moved lis ack adding += tick nump [1] # -*- coding: utf-8 -*-"""Created on Sat Aug 18 16:23:17 2018@author: acadsoc"""import scipyimpo

梯度下降算法(1) - Python實現

相關推薦