《動手學深度學習（李沐）》筆記1

阿新 • • 發佈：2018-01-26

break pre square scatter mage sgd 筆記 init .com

實現一個簡單的線性回歸(mxnet)

from mxnet import ndarray as nd
from mxnet import autograd
import matplotlib.pyplot as plt
import random
num_input=2#變量數
num_examples=1000#1000個樣例
true_w=[2,-3.4]#真實的系數W
true_b=4.2#真實的偏倚b
X=nd.random_normal(shape=(num_examples,num_input))#隨機產生數據
y=true_w[0]*X[:,0]+true_w[1]*X[:,1]+true_b#得到y值
y 
+=0.01*nd.random_normal(shape=y.shape)#加噪聲
print(X[0],y[0])
plt.scatter(X[:,1].asnumpy(),y.asnumpy())#必須轉換為numpy才能繪圖
plt.show()
batch_size=10#batch大小

def data_iter():
    idx=list(range(num_examples))
    random.shuffle(idx)#打亂數組
    for i in range(0,num_examples,batch_size):#步長為10
        j=nd.array(idx[i:min(i+batch_size,num_examples)])
         
yield  nd.take(X,j),nd.take(y,j)

for data,label in data_iter():#從data_liter()中提取
    print(data,label)
    break

w=nd.random_normal(shape=(num_input,1))#初始化
b=nd.zeros((1,))#初始化
params=[w,b]#參數合一

for param in params:
    param.attach_grad()#給參數的梯度賦予空間
def net(X):#設置網絡
    return nd.dot(X,w)+b
def square_loss(yhat,y):#設置損失函數
     
return (yhat-y.reshape(yhat.shape))**2
def SGD(params,lr):#隨機梯度下降函數
    for param in params:#對每個參數使用隨機梯度下降
        param[:]=param-lr*param.grad#param.grad是自動求導的值

def real_fn(X):#真實的函數
    return 2*X[:,0]-3.4*X[:,1]+4.2
def plot(losses,X,sample_size=100):#繪圖
    xs=list(range(len(losses)))
    f=plt.figure()
    fg1=f.add_subplot(121)
    fg2=f.add_subplot(122)
    fg1.set_title(‘Loss during training‘)
    fg1.plot(xs,losses,‘r‘)
    fg2.set_title(‘Estimated vs real function‘)
    fg2.plot(X[:sample_size,1].asnumpy(),net(X[:sample_size,:]).asnumpy(),‘or‘,label=‘Estimated‘)
    fg2.plot(X[:sample_size,1].asnumpy(),real_fn(X[:sample_size,:]).asnumpy(),‘*g‘,label=‘Real‘)
    fg2.legend()
    plt.show()
epochs = 5
learning_rate = .001
niter = 0
losses = []
moving_loss = 0
smoothing_constant = .01

# 訓練
for e in range(epochs):#五次更新權重
    total_loss = 0

    for data, label in data_iter():
        with autograd.record():
            output = net(data)#預測值
            loss = square_loss(output, label)
        loss.backward()
        SGD(params, learning_rate)
        total_loss += nd.sum(loss).asscalar()#轉換為標量求和

        # 記錄每讀取一個數據點後，損失的移動平均值的變化；
        niter +=1
        curr_loss = nd.mean(loss).asscalar()
        moving_loss = (1 - smoothing_constant) * moving_loss + (smoothing_constant) * curr_loss

        # correct the bias from the moving averages
        est_loss = moving_loss/(1-(1-smoothing_constant)**niter)

結果：

技術分享圖片

線性回歸 — 使用Gluon

from mxnet import ndarray as nd
from mxnet import autograd
from mxnet import gluon

num_inputs=2
num_examples=1000
true_w=[2,-3.4]
true_b=4.2
X=nd.random_normal(shape=(num_examples,num_inputs))
y=true_w[0]*X[:,0]+true_w[1]*X[:,1]+true_b
y+=0.01*nd.random_normal(shape=y.shape)

#數據讀取
batch_size=10
dataset=gluon.data.ArrayDataset(X,y)
data_iter=gluon.data.DataLoader(dataset,batch_size,shuffle=True)

for data,label in data_iter:
    print(data,label)
    break

net=gluon.nn.Sequential()
net.add(gluon.nn.Dense(1))

net.initialize()
square_loss=gluon.loss.L2Loss()
trainer=gluon.Trainer(net.collect_params(),‘sgd‘,{‘learning_rate‘:0.1})

epoch=5
batch_size=10
for e in range(epoch):
    total_loss=0
    for data,label in data_iter:
        with autograd.record():
            output=net(data)
            loss=square_loss(output,label)
        loss.backward()
        trainer.step(batch_size)
        total_loss+=nd.sum(loss).asscalar()
    print("Epoch %d average loss:%f"%(e,total_loss/num_examples))

技術分享圖片

《動手學深度學習（李沐）》筆記1

break pre square scatter mage sgd 筆記 init .com 實現一個簡單的線性回歸(mxnet) from mxnet import ndarray as nd from mxnet import autograd import matp

李沐等人開源中文書《動手學深度學習》預覽版上線

機器之心報道，參與：李澤南、張倩。獲得這本實體書最好的方法就是成為貢獻者。近日，由 Aston Zhang、李沐等人所著圖書《動手學深度學習》放出了線上預覽版，以供讀者自由閱讀。這是一本面向在校學生、工程師和研究人員的互動式深度學習書籍。線上書地址：zh.diveintodeeplear

分享《動手學深度學習》高清PDF+視訊教程-李沐著

下載：https://pan.baidu.com/s/10EKdEe-vjp9i97xP1FWuGA 更多資料學習：http://blog.51cto.com/14087171 由 MXNet 創始人李沐大神、Aston Zhang 等人所著的互動式書籍《動手學深度學習》推出了線上預覽版，面向在校

分享《動手學深度學習》高清PDF+視頻教程-李沐著

通過整理 ofo 入門到上線大神說明深度學習同學下載：https://pan.baidu.com/s/10EKdEe-vjp9i97xP1FWuGA 更多資料學習：http://blog.51cto.com/14087171 由 MXNet 創始人李沐大神、A

分享《動手學深度學習(李沐等著)》PDF+源代碼+《神經網絡與深度學習(吳岸城)著》PDF

.com aid 源代碼 inf nbsp 技術 http bubuko pdf 下載：https://pan.baidu.com/s/11O2m_uxSWJGbkXHF2Zh94w 更多資料：https://pan.baidu.com/s/1g4hv05UZ_w92uh9

下載資源~李沐《動手學深度學習》亞馬遜首席科學家、美國卡內基梅隆大學計算機博士重磅

教程的目錄以及學習路線：目錄如下： PDF+程式碼+視訊下載方式 &

模型驅動的深度學習（ADMM-net）

for 高精高精度不同 height 梯度深度學習減少需求流程：模型族->算法族->深度網絡->深度學習模型族：模型中含有超參數，給予不同的參數對應不同的模型，就形成了模型族算法族：每一個模型對應一個完整算法，整個模型族對應了一個算法族將

深度學習（十二）wide&deep model

結合稀疏正則化深度學習 img div 網絡傳遞討論推薦系統在電商等平臺使用廣泛，這裏討論wide&deep推薦模型，初始是由google推出的，主要用於app的推薦。概念理解 Wide & Deep模型，旨在使得訓練得到的模型能夠同時獲得

深度學習（十一）RNN入門學習

RNN入門學習原文地址：http://blog.csdn.net/hjimce/article/details/49095371 作者：hjimce 一、相關理論 RNN(Recurrent Neural Networks)中文名又稱之為：迴圈神經網路（原來還有一個遞迴神經網路

深度學習（十九）基於空間金字塔池化的卷積神經網路物體檢測

原文地址：http://blog.csdn.net/hjimce/article/details/50187655 作者：hjimce 一、相關理論本篇博文主要講解大神何凱明2014年的paper：《Spatial Pyramid Pooling in Dee

機器學習與深度學習系列連載：第二部分深度學習（十六）迴圈神經網路 4（BiDirectional RNN， Highway network， Grid-LSTM）

深度學習（十六）迴圈神經網路 4（BiDirectional RNN， Highway network， Grid-LSTM） RNN處理時間序列資料的時候，不僅可以正序，也可以正序+逆序（雙向）。下面顯示的RNN模型，不僅僅是simple RNN，可以是LSTM，或者GRU 1 B

機器學習與深度學習系列連載：第二部分深度學習（十五）迴圈神經網路 3（Gated RNN - GRU）

迴圈神經網路 3（Gated RNN - GRU） LSTM 是1997年就提出來的模型，為了簡化LSTM的複雜度，在2014年 Cho et al. 提出了 Gated Recurrent Units (GRU)。接下來，我們在LSTM的基礎上，介紹一下GRU。主要思路是： •

機器學習與深度學習系列連載：第二部分深度學習（十四）迴圈神經網路 2（Gated RNN - LSTM ）

迴圈神經網路 2（Gated RNN - LSTM ） simple RNN 具有梯度消失或者梯度爆炸的特點，所以，在實際應用中，帶有門限的RNN模型變種（Gated RNN）起著至關重要的作用，下面我們來進行介紹： LSTM (Long Short-term Memory )

機器學習與深度學習系列連載：第二部分深度學習（十二）卷積神經網路 3 經典的模型（LeNet-5，AlexNet ，VGGNet，GoogLeNet，ResNet）

卷積神經網路 3 經典的模型經典的卷積神經網路模型是我們學習CNN的利器，不光是學習原理、架構、而且經典模型的超引數、引數，都是我們做遷移學習最好的源材料之一。 1. LeNet-5 [LeCun et al., 1998] 我們還是從CNN之父，LeCun大神在98年提出的模

機器學習與深度學習系列連載：第二部分深度學習（十一）卷積神經網路 2 Why CNN for Image？

卷積神經網路 2 Why CNN 為什麼處理圖片要用CNN？原因是：一個神經元無法看到整張圖片能夠聯絡到小的區域，並且引數更少圖片壓縮畫素不改變圖片內容 1. CNN 的特點卷積：一些卷積核遠遠小於圖片大小；同樣的pat

人工智慧深度學習（Deep learning）開源框架

Google開源了TensorFlow（GitHub），此舉在深度學習領域影響巨大，因為Google在人工智慧領域的研發成績斐然，有著雄厚的人才儲備，而且Google自己的Gmail和搜尋引擎都在使用自行研發的深度學習工具。 1、Caffe。源自加州伯克利分校的Caffe被廣泛應用，包括Pint

深度學習（期望坑）

題目描述小 A 最近在研究深度學習，他自己搭建了一個很牛逼的神經網路，現在他手頭一共有 n 組訓練資料，一開始他會給自己的神經網路設定一個 batch size，假設為 B (1≤ B≤ n) ，每次訓練他都會從手頭的 n 組訓練資料中抽取不同的 B 組資料，然後扔到神經網路去訓練。然而

《Gluon 動手學深度學習》顯示影象資料集Fashion-MNIST

%matplotlib inline import sys sys.path.append('..') import gluonbook as gb from mxnet.gluon import data as gdata import time mnist_train=gdata.vision

《Gluon 動手學深度學習問題：ModuleNotFoundError: No module named 'gluonbook' 》

# 如果沒有安裝 pandas，請反註釋下面一行。 # !pip install pandas %matplotlib inline import gluonbook as gb from mxnet import autograd, gluon, init, nd from mxnet.gl

《Gluon 動手學深度學習六》Softmax實現

線性迴歸適用於輸出為連續值的情景，對於輸出離散值的分類問題，需要使用分類模型，例如softmax，與線性迴歸不同的是softmax輸出單元從一個變為多個。和線性迴歸相同的是，softmax也是一個單層神經網路。和線性迴歸不同的是，softmax輸出層的個數等於類別個數。 softmax 每個輸出

《動手學深度學習（李沐）》筆記1

實現一個簡單的線性回歸(mxnet)

線性回歸 — 使用Gluon

相關推薦