最優化演算法（二）：牛頓法

阿新 • • 發佈：2019-01-05

1.推導

牛頓法和擬牛頓法是求解無約束最優化問題的常用方法，它們比梯度下降收斂更快。考慮同樣的一個無約束最優化問題：

$min_{x\in R^{n}}f(x)$

其中f(x)具有二階連續偏導數的性質，如果k次迭代值為 $x^{(k)}$ ，則可進行二階泰勒展開：

$f(x)=f(x^{(k)})+g_{k}^{T}(x-x^{(k)})+1/2H(x^{(k)})(x-x^{(k)})^{2}$

上述公式裡面的值不解釋了，就是一階導和二階導（也稱海塞矩陣 $H(X)$ 在此點的值），函式有極值的必要條件就是在極值點處一階導數為0。牛頓法的每次迭代就是讓一階導為零，即滿足：

$f^{'}(x^{(k+1)})=0$

而上式根據泰勒一階導等於：

$f^{'}(x^{(k+1)})=g_{k}+H(x-x^{(k)})=0$

根據這一步就能得到迭代公式：

$x^{(k+1)}=x^{(k)}-H^{-1}_{k}g_{k}$

2.對比

為什麼牛頓法更快呢？我和網上其他的想的不太一樣，我認為是因為每次迭代，牛頓法都能找到當前的極小值，而不是單純找到當前下降最快的部分，直接走到當前能走的最低點，在下一次迭代中，換一個點繼續求解。

3.擬牛頓法

擬牛頓法就是對牛頓法的計算上加以簡化，因為牛頓法每次會求海塞矩陣的逆矩陣，比較麻煩，所以它會用一個近似矩陣 G（x）替代H（x）的逆矩陣，所以擬牛頓法不需要二階導數的資訊，有時比牛頓法更為有效。常用的擬牛頓實現方法有DFP和BFGS.。具體的推導有興趣可以見統計學習方法P220，這個演算法我用得不多，所以沒有細究。

最優化演算法（二）：牛頓法

1.推導牛頓法和擬牛頓法是求解無約束最優化問題的常用方法，它們比梯度下降收斂更快。考慮同樣的一個無約束最優化問題：

深入理解線性迴歸演算法（二）：正則項的詳細分析

前言當模型的複雜度達到一定程度時，則模型處於過擬合狀態，類似這種意思相信大家看到個很多次了，本文首先討論了怎麼去理解複雜度這一概念，然後回顧貝葉斯思想（原諒我有點囉嗦），並從貝葉斯的角度去理解正則項的含義以及正則項降低模型複雜度的方法，最後總結全文。 &nb

「日常訓練&知識學習」莫隊演算法（二）：樹上莫隊（Count on a tree II，SPOJ COT2）

題意與分析題意是這樣的，給定一顆節點有權值的樹，然後給若干個詢問，每次詢問讓你找出一條鏈上有多少個不同權值。寫這題之前要參看我的三個blog：CFR326D2E、CFR340D2E和HYSBZ-1086，然後再看這幾個Blog—— 參考A：https://blog.sengxian.com/algori

小朋友學經典演算法（14）：回溯法和八皇后問題

一、回溯法回溯法（探索與回溯法）是一種選優搜尋法，又稱為試探法，按選優條件向前搜尋，以達到目標。但當探索到某一步時，發現原先選擇並不優或達不到目標，就退回一步重新選擇，這種走不通就退回再走的技術為回溯法，而滿足回溯條件的某個狀態的點稱為“回溯點”。二、八皇后問題（一）問

移動推薦演算法（二）：基於簡單規則的預測

本文為轉載文章，來源為： https://blog.csdn.net/Snoopy_Yuan/article/details/72850601 一直在探索資料探勘、資料建模的案例，百度搜到這篇文章，收穫頗豐，轉載以作記錄。前言：移動推薦演算法是阿里天池賽2015年賽題之

演算法（二）：氣泡排序

氣泡排序（Bubble Sort）,是一種電腦科學領域的較簡單的排序演算法。它重複的走訪過要排列的數列，一次比較兩個元素，如果他們的順序錯誤就把他們交換過來，走訪數列的工作是重複的進行直到沒有有再需要交換，也就是說該數列已經排序完成。這個演算法的名字由來是因為越大的元素會

基礎演算法（二）：Kmeans聚類演算法的基本原理與應用

Kmeans聚類演算法的基本原理與應用內容說明：主要介紹Kmeans聚類演算法的數學原理，並使用matlab程式設計實現Kmeans的簡單應用，不對之處還望指正。一、Km

機器學習金典演算法（二）--梯度下降法（2）

機器學習金典演算法（二）–梯度下降法本人上篇博文梯度下降法（1）解釋了梯度下降法在機器學習中位置及思想，本文將繼續討論梯度下降法，梯度下降法存在的問題及改進思路，以及現有的幾種流行的變種梯度下降法。目錄

經典演算法（二）：選擇排序

昨天我們學習了經典中的經典，氣泡排序，今天我們來學習另一個經典演算法：選擇排序。一、演算法描述掃描所有的元素，得到最小（最大·）的元素，並將最小（最大）的元素與左邊第一個元素進行交換。再掃描除第一個位置以外的所有元素，得到最小（最大）元素，與左邊第二

經典演算法（2）：黃金分割法（Gold）

黃金分割法。0.618法。優選法。以0.618^n的速率縮減區間，尋找最值點。兩點說明。1. 當能明確目標函式是一個單峰函式的時候，2. 當知道目標函式的極值點在哪個區間範圍內的時候，此方法非常有效。昨天看招聘資訊，第一條就是，天文地理、物理數學等燒腦專業優先。+_+對於我們

圖相關演算法（二）：無向無權圖的廣度優先遍歷（BFS）-非遞迴版本

核心採用鄰接表作為圖資料的儲存結構對訪問過的節點進行記錄，文中採用HashSet實現採用佇列存放未訪問的子節點，不斷更新佇列 BFS採用佇列實現很簡單，採用遞迴反而更復雜了本文建立的圖結構如

Java常用的八種排序演算法與程式碼實現（二）：歸併排序法、快速排序法

注：這裡給出的程式碼方案都是通過遞迴完成的－－－歸併排序（Merge Sort）：　　分而治之，遞迴實現　　如果需要排序一個數組，我們先把陣列從中間分成前後兩部分，然後對前後兩部分進行分別排序，再將排好序的數組合並在一起，這樣整個陣列就有序了　　歸併排序是穩定的排序演算法，時間

目標檢測光流法（二）：opencv下的光流L-K演算法

後續將簡單介紹光流法的一些簡單實現包，包括opencv下的光流演算法與matlab下的光流演算法。該節主要介紹opencv下的光流實現。 Opencv的光流實現由好幾個方法可以（也就是說有好幾個函式可以用），每個函式當然也對應著不同的原理，那麼它的效果以及演算

算法系列之九：計算幾何與圖形學有關的幾種常用演算法（二）

3.6 用向量的叉積判斷直線段是否有交向量叉積計算的另一個常用用途是直線段求交。求交演算法是計算機圖形學的核心演算法，也是體現速度和穩定性的重要標誌，高效並且穩定的求交演算法是任何一個CAD軟體都必需要重點關注的。求交包含兩層概念，一個是判斷是否相交，另一個是

JVM高級特性與實踐（二）：對象存活判定算法（引用）與回收

添加引用計數器程序計數器正文 bmc 進入 block 結構內存關於垃圾回收器GC（Garbage Collection），多數人意味它是Java語言的伴生產物。事實上，GC的歷史遠比Java悠遠，於1960年誕生在MIT的Lisp是第一門真正使用內存動態分配和垃

PHP面試（二）：程序設計、框架基礎知識、算法與數據結構、高並發解決方案類

表設計工作原理結構單一入口 php 能力高並發解決方案數據表缺點一、程序設計 1、設計功能系統——數據表設計、數據表創建語句、連接數據庫的方式、編碼能力二、框架基礎知識 1、MVC框架基本原理——原理、常見框架、單一入口的工作原理、模板引擎的理解 2、常見框

[Swift]八大排序算法（二）：快速排序

addition 每次數據交換 uri 基本思想技術分享繼續 splay 休眠排序分為內部排序和外部排序。內部排序：是指待排序列完全存放在內存中所進行的排序過程，適合不太大的元素序列。外部排序：指的是大文件的排序，即待排序的記錄存儲在外存儲器上，待排序的文件

數值分析（二）：C++實現三對角線方程組的追趕法

這次來實現三對角線方程組的追趕法，追趕法的本質還是高斯消元法，而且是沒選主元的高斯消元法，只是因為Ax=b中係數矩陣A非常特殊，所以就可以採用相對特殊的方法來解方程組。同樣，按照常規的步驟，先分析什麼是追趕法，再給出追趕法的數學步驟，最後用C++實現這種演算法。（一）追趕法的功能和步驟明

資料結構（二）：演算法及其描述

一、演算法及其描述 1、什麼是演算法資料元素之間的關係有邏輯關係和物理關係，對應的操作有邏輯結構上的操作功能和具體儲存結構上的操作實現。把具體儲存結構上的操作實現方法稱為演算法。確切地說，演算法是對特定問題求解步驟的一種描述，它是指令的有限序列，其中每一

學習筆記（二）：使用K近鄰演算法檢測Web異常操作

使用全量比較，而不是最頻繁和最不頻繁的比較。 1.資料蒐集我們使用詞集的模型，將全部命令去重後形成一個大型向量空間，每個命令代表一個特徵，首先通過遍歷全部命令，生成對應詞集。 with open(filename) as f: fo

最優化演算法（二）：牛頓法

1.推導

2.對比

3.擬牛頓法

相關推薦