開啟深度學習/TensorFlow的前期準備工作和數學知識

阿新 • • 發佈：2018-12-11

一、安裝環境

我使用macbook僅是用來測試一些流程性問題，實際操作的話不建議使用MAC OS系統，MAC OS系統使用GPU不太方便（雖然網上有許多macbook外接GPU的教程，但總歸是很心疼的）。實際跑深度學習工程時，我會放在ubuntu伺服器上。

二、安裝TensorFlow

三、複習數學知識

應該是針對性地學習。主要分為原理類和調參類的數學知識。

Part1.線性代數

向量
矩陣
集合
標量
張量
範數
內積
向量正交
正交基
特徵值分解
奇異值分解
矩陣分解
總結:前面的都是基礎概念性的內容，後面的三個分解很重要，奇異值分解也屬於矩陣分解裡的一種，在很多應用中其實都會用到，譬如推薦系統，主題模型等。在一些其他的演算法思想裡其實也有用到，我們求特徵向量的時候，其實也是在做特徵值分解，主成分分析/因子分析其實都用到了矩陣分解。尤其是當資料量比較小的時候，可以先不上深度學習，先用簡單又基礎的方法試一下，看看效果怎麼樣，作為baseline，加大資料集後，再採取更深層次的演算法來做。

Part2.概率論

條件概率
聯合概率
全概率公式
逆概率
貝葉斯公式
貝葉斯定理
先驗概率
後驗概率
似然概率
最大似然估計法
最大後驗概率法
離散型隨機變數
連續型隨機變數
概率質量函式
概率密度函式
兩點分佈
二項分佈
泊松分佈
均勻分佈
指數分佈
正態分佈
數字特徵
數學期望
方差
協方差
總結:概率論的內容也非常重要，掌握好了才能理解我們在機器學習/深度學習裡經常出現的一些概念。它包含在我們演算法的很多方面，譬如，資料是否符合正態分佈/泊松分佈，什麼情況下可以用最大似然估計法等等，貝葉斯的定理除了運用在貝葉斯演算法中，還有沒有其他的演算法有運用到這個思想的，條件概率個聯合概率等，在後續的資訊理論出現的作用是什麼？都需要我們隊每個知識點好好掌握。重點掌握我加粗的知識點。

Part3.數理統計

樣本
總體
統計量
引數估計
假設檢驗
置信區間
區間估計
泛化能力
泛化誤差
欠擬合
過擬合
噪聲
偏差
總結:同樣，前面是基礎知識，後面的幾點更為關鍵。泛化能力和泛化誤差是我們衡量這個模型跑完了能否拿到實際場景中去應用的一個重要指標;欠擬合 or 過擬合也是我們在模型訓練的過程中需要注意和解決的兩點;偏差方差等也屬於評價指標，我們需要達到一個trade-off，所以如何平衡也是需要關注的。其實也可以這樣看，如果資料中出現了噪音，迭代次數過少（或者一些其他原因），導致模型欠擬合，那麼它的偏差大，方差小，如果過擬合，則偏差小，方差大，不管哪種情況，這個模型的泛化能力都不行，沒法拿到真實場景中去用，所以我們需要對其進行調整，這個時候我們就會關注到資料本身和模型調參上。資料本身如果有噪音和異常點應該如何找到並去除，模型跳槽應該如何避免欠擬合和過擬合，都是我們在掌握這些知識點時需要重點關注的點。

Part4.優化相關

目標函式
全域性最小值
區域性極小值
無約束優化
約束優化
拉格朗日函式
KKT條件與對偶函式
梯度下降法
一階導數
二階導數
牛頓法
泰勒展開
線性搜尋方法
置信域方法
啟發式演算法
總結:優化部分的內容也是非常重要的一環。當我們設定了目標函式後，就會採取各種優化演算法來去優化目標函式的值，使目標函式的值最小(/最大，一般是最小，根據具體情況而定)，如何使目標函式的值下降的最快，這時我們就引出了梯度下降，因為沿著負梯度下降的方向是函式值減小的最快方向，由此我們可以引出多種梯度下降的方法，包括批梯度，隨機梯度，mini-batch等等。當然，這是針對一階函式優化來說的，如果是二階函式，我們就會考慮到用牛頓法，什麼時候會出現二階函式呢？在xgboost裡針對目標函式的優化我們就會涉及到二階函式的優化。而在這些優化函式的計算中，都會涉及到泰勒展開，在SVM裡又會因為要求支援向量所以會引出拉格朗日乘子法和KKT條件，從一點去發散，我們可以發現很多知識點。所以在針對具體的演算法學習過程中再去掌握這些數學知識點，高效而且有用。在深度學習中涉及到的優化演算法相對就少一些，沒有機器學習裡的那麼多，但是這些基礎性的東西還是需要掌握的。

Part5.資訊理論

資訊熵
互資訊
資訊增益
KL 散度
最大熵原理
交叉熵和相對熵的對比
各種熵之間的關係
總結：資訊理論這一章非常重要，基本上每個知識點都是重點，因為很多情況下我們都會使用交叉熵作為損失函式，所以得弄明白它的原理和為什麼我們經常使用它做損失函式的原因。對於一些特殊的情況，可以做出哪些變型，也是在掌握了這些基礎上才會做的，所以大家要好好掌握。

開啟深度學習/TensorFlow的前期準備工作和數學知識

一、安裝環境我使用macbook僅是用來測試一些流程性問題，實際操作的話不建議使用MAC OS系統，MAC OS系統使用GPU不太方便（雖然網上有許多macbook外接GPU的教程，但總歸是很心疼的）。實際跑深度學習工程時，我會放在ubuntu伺服器上。二、安

深度學習機器視覺準備工作

1）下載安裝Anaconda 下載地址 https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-4.2.0-Windows-x86_64.exe（64位計算機目前電腦基本都是64位）大部分沒有什麼可

深度學習Tensorflow相關書籍推薦和PDF下載

1.機器學習入門經典《統計學習方法》pdf下載 2. 周志華的《機器學習》pdf下載 3. 《數學之美》吳軍博士著pdf下載 4.Tensorflow 實戰Google深度學習框架.pdf百度網盤下載連結5.《TensorFlow實戰》黃文堅高清完整PDF 百度網盤下載連結

【深度學習系列】用PaddlePaddle和Tensorflow實現經典CNN網絡GoogLeNet

mage eat oba card fin filter mod 一個 lec 　　前面講了LeNet、AlexNet和Vgg，這周來講講GoogLeNet。GoogLeNet是由google的Christian Szegedy等人在2014年的論文《Going Deepe

【深度學習系列】用PaddlePaddle和Tensorflow實現GoogLeNet InceptionV2/V3/V4

targe 所有 conn ride 出了 prev 縮減 tro 例如　　上一篇文章我們引出了GoogLeNet InceptionV1的網絡結構，這篇文章中我們會詳細講到Inception V2/V3/V4的發展歷程以及它們的網絡結構和亮點。 GoogLeNet I

lfs學習筆記（一）前期準備工作

一名linux愛好者,記錄構建Linux From Scratch的過程經部落格園-駿馬金龍前輩介紹，開始接觸學習lfs，用部落格記錄學習筆記，如有寫的不恰當的地方，望多多指正。筆記中只是記錄一些問題和書中表述不清晰的內容的處理辦法以及我的解決思路，僅做參考。要實際構建lfs請結合lfs官方的書籍操作

深度學習tensorflow實戰筆記（3）VGG-16訓練自己的資料並測試和儲存模型

前面的部落格介紹瞭如何把影象資料轉換成tfrecords格式並讀取，本篇部落格介紹如何用自己的tfrecords格式的資料訓練CNN模型，採用的模型是VGG-16。現有的教程都是在mnist或者cifar-10資料集上做的訓練，如何用自己的資料集進行訓練相關的資料比較

OpenGL學習筆記 1.前期準備工作 (freegult+GLTools配置及匯入)

行百里者半九十。為了激勵自己能夠不斷的學習圖形學，在此部落格中記錄自己學習OpenGL的過程與感悟。接下來的筆記全部基於OpenGL SuperBible5（藍寶書），這篇文章將會從最基礎的繪製Triangle開始。一.需要的標頭檔案以及靜態庫1.GLUTGLUT庫相當於是O

vue學習總結二：專案前期準備工作

當我們構建完專案之後不要急於開始寫程式碼，一些準備工作還是必須要先完成的，比如：因為我們是做的移動端單頁面的專案，會存在300ms的點選延遲問題，改怎麼解決？由於各遊覽器廠商對不同html標籤的樣式具有不同的初始化定義，因此我們要做到遊覽器相容性的話就必須要統一初始化一個樣式

深度學習TensorFlow如何使用多GPU並行模式？

深度學習 tensorflow TensorFlow可以用單個GPU，加速深度學習模型的訓練過程，但要利用更多的GPU或者機器，需要了解如何並行化地訓練深度學習模型。常用的並行化深度學習模型訓練方式有兩種：同步模式和異步模式。下面將介紹這兩種模式的工作方式及其優劣。如下圖，深度學習模型的訓練是一個叠代

吳恩達-深度學習-課程筆記-3: Python和向量化( Week 2 )

有時指數檢查都是效果很快 -1 tro str 1 向量化( Vectorization ) 在邏輯回歸中，以計算z為例，z = w的轉置和x進行內積運算再加上b，你可以用for循環來實現。但是在python中z可以調用numpy的方法，直接一句z = np.d

深度學習解決局部極值和梯度消失問題方法簡析（轉載）

復雜度現實概率傳播相同證明 dap 很難卷積神經網絡轉載：http://blog.sina.com.cn/s/blog_15f0112800102wojj.html 這篇文章關於對深度CNN中BP梯度消失的問題的做了不錯的解析，可以看一下：多層感知機解決

深度學習-tensorflow學習筆記(2)-MNIST手寫字體識別

image utf-8 詳情識別標簽 ins AI tor 第一個　　　　　　　　　　深度學習-tensorflow學習筆記(2)-MNIST手寫字體識別　　這是tf入門的第一個例子。minst應該是內置的數據集。　　前置知識在學習筆記(1)裏面講過了　　這裏直

Linux課程開啟前學習軟件準備及學習方法概述01

表示億圖 and href 標題課程 cto 記事本個人 Linux的內容知識很多，所以要求我們做大量的筆記，傳統的本地記事本，有諸多弊端，比如不小心記筆記的設備丟失。所以在此，給大家介紹一些學習Linux比較實用的筆記和博客註冊個人博客 1.博客園：www.cnb

深度學習基礎--卷積計算和池化計算公式

卷積計算和池化計算公式卷積卷積計算中，（）表示向下取整。輸入：n* c0* w0* h0 輸出：n* c1* w1* h1 其中，c1就是引數中的num_output，生成的特徵圖個數。 w1=(w0+2pad-kernel_size)/stride+1;

Linux系統下python學習筆記——前期準備

一、作業系統（Operation System,OS）作業系統的作用：1、直接操作硬體；2、把操作硬體的程式碼封裝成一個又一個的系統呼叫，供其他程式（軟體）呼叫，實現間接操作硬體。作業系統分類：

UDP千兆乙太網FPGA_verilog實現（四、程式碼前期準備-UDP和IP協議構建）

UDP：user Datagram protocol 使用者資料報協議無連線的傳輸層協議，提供面向事務的簡單不可靠資訊傳送服務，IETF RFC 768是UDP的正式規範。UDP在IP報文的協議號是17（0x11） UDP協議的主要作用是將網路資料流量壓縮成資料包的形式。一個典型的資料包就

開啟深度學習的潘多拉魔盒(模型視覺化)

開啟深度學習的潘多拉魔盒(模型視覺化) - v3.x 深度學習原理與實踐(開源圖書)-總目錄,建議收藏，告別碎片閱讀! 深度學習在各個領域攻城略地，在諸多領域秒殺傳統演算法，但是其運作細節一直是個黑盒。理論研究者特別是數學家無法完全解釋的事物。學術界、研究所和企業界

深度學習TensorFlow的基本理論

1、深度學習框架TensorFlow中都有哪些優化方法？ GradientDescentOptimizer 、AdagradOptimizer 、AdagradDAOptimizer 、MomentumOptimizer AdamOptimizer 、Ft

vue元件庫（一）：前期準備工作

前言　　將近期專案內自行開發一個vue元件，做個總結，記錄下自己的思維過程~~~ 正文　　接到這個任務後，還是要做些準備工作的。　　主要內容如下：　　1.優化下所在團隊前端開發流程伺服器搭建gitlab，採用git進行程式碼版本管理伺服器搭建npm私服（基於verdaccio

開啟深度學習/TensorFlow的前期準備工作和數學知識

一、安裝環境

二、安裝TensorFlow

三、複習數學知識

Part1.線性代數

Part2.概率論

Part3.數理統計

Part4.優化相關

Part5.資訊理論

相關推薦