吳恩達-深度學習-課程筆記-3: Python和向量化( Week 2 )

阿新 • • 發佈：2017-10-15

有時指數檢查都是效果很快 -1 tro str

1 向量化( Vectorization )

在邏輯回歸中，以計算z為例，z = w的轉置和x進行內積運算再加上b，你可以用for循環來實現。

但是在python中z可以調用numpy的方法，直接一句z = np.dot( w, x ) + b用向量化完成，而且你會發現這個非常快。

ng做了個實驗，求兩個100萬長的一維向量的內積，用向量化花了1.5毫秒，而用for循環計算花了400多毫秒。

所以平常記得用向量化，一定要避免使用for循環，你的代碼會快很多。

CPU和GPU都有並行化的指令，有時候叫SIMD( single instruction multiple data )。

如果你使用了這樣的內置函數，比如np.function，python的numpy能充分利用並行化去更快的計算。

2 更多向量化的例子( More Vectorization Examples )

平時要避免使用for循環，善用python的numpy庫中的內置函數。

比如矩陣A和向量v的內積，可以用np.dot。對一列向量v實施指數運算，可以用np.exp，還有各種np.log，np.abs，np.maxmum( v, 0)等等。

對於 v ** 2，1 / v這樣的操作也要考慮用np裏的函數。

技術分享

3 向量化邏輯回歸( Vectorizing Logistic Regression )

對於邏輯回歸的導數計算也應該使用向量化,完全不用for循環。圖中給出了向量化的過程。

Z的計算的向量化形式是np.dot( w.T, X) + b，其中b在這裏是一個實數，python在向量和實數相加時，會自動把實數變成一個相同維度的向量再相加。

其中w是n * 1的列向量，w.T是1 * n的列向量，X是n * m的矩陣，結果就是1 * m的向量，最後加上1 * m的b向量，得到1 * m的Z。最後通過sigmoid得到預測值A。

技術分享

同時還可以利用向量化計算m個數據的梯度，註意是同時計算。下圖左邊是for循環的實現，右邊是向量化的實現。

這裏dz是代價函數對z變量的導數，之前推導過等於預測值減去實際值a - y。

dw是代價函數對w的導數，db是代價函數對b的導數，如果不記得了可以翻看上一節課，邏輯回歸的內容。

雖然要盡量使用向量化，但是在進行多次梯度下降的叠代還是要用到for循環，這個不可避免。

技術分享

4 python中的廣播( python broadcasting)

當你用一個向量加上一個數的時候，python會自動把這個數變成向量再一一相加。

當你用一個m*n的矩陣加（減乘除）上1*n的向量時，python會自動把1*n的向量豎直復制變成m*n再相加。

當你用一個m*n的矩陣加上m*1的向量時，python會自動把m*1的向量水平復制變成m*n再相加。

這是實現神經網絡時主要用到的廣播，更詳細的可以查看numpy文檔搜索broadcasting。

對於numpy中的一些用法需要了解，可以幫助你更高效地用矩陣運算來提升程序效率，ng在本節還舉了求百分比的例子。

A.sum( axis = 0 )代表豎直求和，如果axis = 1就是水平求和。

技術分享

5 python / numpy中的向量說明( A note on python/numpy vectors )

numpy和廣播使我們可以用一行代碼完成很多運算。

但有時可能會引入非常細微的錯誤，非常奇怪的bug，如果你不熟悉所有的復雜的廣播運作方式。

比如你覺得一個行向量和列向量相加應該會報錯，但是並不會，而且也不是簡單的一一相加。

python這些奇怪的效果有其內在邏輯，如果不熟悉python，你可能會寫出奇怪的難以調試的bug。

ng的建議，在實現神經網絡的時候不要使用shape為(n,)這樣的變量，要用(n,1)。

比如a 的 shape是(5, ) ，當你計算np.dot( a, a.T)的時候得到的是一個實數，a和a的轉置，它們的shape都是(5, )。

如果a 的 shape是(5, 1)，你計算np.dot( a, a.T)的時候得到的就是一個5*5的矩陣。a的shape是( 5, 1)，而a.T的shape是( 1, 5 )。

a.shape = (5, )這是一個秩為1的數組，不是行向量也不是列向量。很多學生出現難以調試的bug都來自秩為1數組。

另外你在代碼中做了很多事情後可能不記得或者不確定a是怎樣的時候，用assert( a.shape == (5,1) )來檢查你的矩陣的維度。

如果你得到了(5,) 你可以把它reshape成(5, 1)或(1, 5)，reshape是很快的O(1)復雜度，所以放心大膽的用它，不用擔心。

技術分享

吳恩達-深度學習-課程筆記-3: Python和向量化( Week 2 )

有時指數檢查都是效果很快 -1 tro str 1 向量化( Vectorization ) 在邏輯回歸中，以計算z為例，z = w的轉置和x進行內積運算再加上b，你可以用for循環來實現。但是在python中z可以調用numpy的方法，直接一句z = np.d

吳恩達-深度學習-課程筆記-8: 超參數調試、Batch正則化和softmax( Week 3 )

erp 搜索給定 via 深度 mode any .com sim 1 調試處理( tuning process ) 如下圖所示，ng認為學習速率α是需要調試的最重要的超參數。其次重要的是momentum算法的β參數（一般設為0.9），隱藏單元數和mini-batch的

吳恩達-深度學習-課程筆記-6: 深度學習的實用層面( Week 1 )

data 絕對值 initial 均值化 http 梯度下降法 ati lod 表示 1 訓練/驗證/測試集( Train/Dev/test sets ) 構建神經網絡的時候有些參數需要選擇，比如層數，單元數，學習率，激活函數。這些參數可以通過在驗證集上的表現好壞來進行選擇

Elam的吳恩達深度學習課程筆記（一）

記憶力是真的差，看過的東西要是一直不用的話就會馬上忘記,於是乎有了寫部落格把學過的東西儲存下來，大概就是所謂的集鞏固，分享，後期查閱與一身的思想吧，下面開始正題深度學習概論什麼是神經網路什麼是神經網路呢，我們就以房價預測為例子來描述一個最簡單的神經網路模型。　　假設有6間

吳恩達深度學習課程筆記之卷積神經網路基本操作詳解

卷積層 CNN中卷積層的作用： CNN中的卷積層，在很多網路結構中會用conv來表示，也就是convolution的縮寫。卷積層在CNN中扮演著很重要的角色——特徵的抽象和提取，這也是CNN區別於傳統的ANN或SVM的重要不同。對於圖片而

優化演算法（吳恩達深度學習課程）-- 2018.11.02筆記

優化演算法（吳恩達深度學習課程） batch梯度下降使用batch梯度下降時，每次迭代你都需要遍歷整個訓練集，可以預期每次成本都會下降，所以如果成本函式

吳恩達深度學習課程deeplearning.ai課程作業：Class 4 Week 3 Car detection

吳恩達deeplearning.ai課程作業，自己寫的答案。補充說明： 1. 評論中總有人問為什麼直接複製這些notebook執行不了？請不要直接複製貼上，不可能執行通過的，這個只是notebook中我們要自己寫的那部分，要正確執行還需要其他py檔案，

學習筆記——吳恩達-機器學習課程-1.3 用神經網路進行監督學習

神經網路有時媒體炒作的很厲害，考慮到它們的使用效果，有些說法還是靠譜的，事實上到目前為止，幾乎所有的神經網路創造的經濟價值都基於其中一種機器學習，我們稱之為“監督學習”，那是什麼意思呢？我們來看一些例子，在監督學習中輸入x，習得一個函式

吳恩達深度學習課程deeplearning.ai課程作業：Class 1 Week 3 assignment3

吳恩達deeplearning.ai課程作業，自己寫的答案。補充說明： 1. 評論中總有人問為什麼直接複製這些notebook執行不了？請不要直接複製貼上，不可能執行通過的，這個只是notebook中我們要自己寫的那部分，要正確執行還需要其他py檔案，請

吳恩達深度學習課程deeplearning.ai課程作業：Class 2 Week 3 TensorFlow Tutorial

吳恩達機器學習課程筆記02——處理房價預測問題（梯度下降演算法詳解）

建議記住的實用符號符號含義 m 樣本數目 x 輸入變數 y 輸出變數/目標變數

吳恩達機器學習課程筆記章節二單變數線性迴歸

1、模型描述 Univariate（One variable）Linear Regression m=訓練樣本的數目，x's=輸入的變數/特徵，y's=輸出變數/目標變數 2、代價函式基本定義： 3、代價函式（一）回顧一下，前面一些定義：簡化的假設函式，theta0=0，得到假

吳恩達深度學習課程學習總結

本文章主要總結吳恩達DeepLearning課程中所提到的一些機器學習策略 1、啟用函式 Sigmoid函式 tanh函式 ReLU函式 2、權重初始化全零初始化的弊端：若權重初始化為0，則在訓練過程中，每個隱含層之間存在對稱性，即在訓練過程中，每個隱含層的求導等

吳恩達機器學習課程筆記——第二週

1. 多變數線性迴歸(Linear Regression with Multiple Variables) 也稱為多元線性迴歸，一元就是一個變數，多元就是多個變數，在這裡也可以叫做多個特徵 1.1 多維特徵(Multiple Features) 之前，

一些吳恩達深度學習教程筆記

下降法 1.梯度下降演算法 2.動量（Momentum）梯度下降法向著最小點的方向加速，與這個方向垂直方向減速 v=β∗v+(1−β)∗v=β∗v+(1−β)∗資料 t β越小，就越關注當前資料，也就是曲線的細節動量梯

吳恩達深度學習課程deeplearning.ai課程作業：Class 1 Week 4 assignment4_2

吳恩達深度學習課程第二課第一週第一次作業：用神經網路簡單預測結果

# coding: utf-8 # # Initialization # Welcome to the first assignment of "Improving Deep Neural Networks". # # Training your neural

http://www.52nlp.cn/tag/tensorflow Andrew Ng (吳恩達) 深度學習課程小結 tensorflow

Dear Learners, We hope that you are enjoying Structuring Machine Learning Projects and your experience in the Deep Learning Specialization so far!

吳恩達深度學習課程第一課第二週課程作業

學過吳恩達的Machine Learning課程，現在跟著學深度學習，本來是想付費的，奈何搞半天付款沒有成功，沒辦法只能下載資料集自己搞了。由於門外漢，安裝工具軟體加上完成作業花了一天時間，其實第二週的作業和機器學習課程基本是一樣的，沒有什麼太大難度，都是初級入

吳恩達深度學習課程2018開放 (Stanford CS230)

歡迎點選參觀我的 ——> 個人學習網站 Stanford 2018 春季 CS230 (深度學習)課程資料開放，授課老師是吳恩達。課程介紹從官網課程介紹，這次課程和去年的課程差別不算太大，仍然包括 CNNs, RNNs, LSTM, Ad

吳恩達-深度學習-課程筆記-3: Python和向量化( Week 2 )

相關推薦