Gluon 實現 dropout 丟棄法

阿新 • • 發佈：2018-11-30

多層感知機中：

hi 以 p 的概率被丟棄，以 1-p 的概率被拉伸，除以 1 - p

import mxnet as mx
import sys
import os
import time
import gluonbook as gb
from mxnet import autograd,init
from mxnet import nd,gluon
from mxnet.gluon import data as gdata,nn
from mxnet.gluon import loss as gloss


'''
# 模型引數
num_inputs, num_outputs, num_hiddens1, num_hiddens2 = 784,10,256,256

W1 = nd.random.normal(scale=0.01,shape=(num_inputs,num_hiddens1))
b1 = nd.zeros(num_hiddens1)

W2 = nd.random.normal(scale=0.01,shape=(num_hiddens1,num_hiddens2))
b2 = nd.zeros(num_hiddens2)

W3 = nd.random.normal(scale=0.01,shape=(num_hiddens2,num_outputs))
b3 = nd.zeros(num_outputs)

params = [W1,b1,W2,b2,W3,b3]

for param in params:
    param.attach_grad()

# 定義網路

 
'''
# 讀取資料
# fashionMNIST 28*28 轉為224*224
def load_data_fashion_mnist(batch_size, resize=None, root=os.path.join(
        '~', '.mxnet', 'datasets', 'fashion-mnist')):
    root = os.path.expanduser(root)  # 展開使用者路徑 '~'。
    transformer = []
    if resize:
        transformer += [gdata.vision.transforms.Resize(resize)]
    transformer  
+= [gdata.vision.transforms.ToTensor()]
    transformer = gdata.vision.transforms.Compose(transformer)
    mnist_train = gdata.vision.FashionMNIST(root=root, train=True)
    mnist_test = gdata.vision.FashionMNIST(root=root, train=False)
    num_workers = 0 if sys.platform.startswith('win32') else 
 4
    train_iter = gdata.DataLoader(
        mnist_train.transform_first(transformer), batch_size, shuffle=True,
        num_workers=num_workers)
    test_iter = gdata.DataLoader(
        mnist_test.transform_first(transformer), batch_size, shuffle=False,
        num_workers=num_workers)
    return train_iter, test_iter


# 定義網路
drop_prob1,drop_prob2 = 0.2,0.5
# Gluon版
net = nn.Sequential()
net.add(nn.Dense(256,activation="relu"),
        nn.Dropout(drop_prob1),
        nn.Dense(256,activation="relu"),
        nn.Dropout(drop_prob2),
        nn.Dense(10)
        )
net.initialize(init.Normal(sigma=0.01))



# 訓練模型

def accuracy(y_hat, y):
    return (y_hat.argmax(axis=1) == y.astype('float32')).mean().asscalar()
def evaluate_accuracy(data_iter, net):
    acc = 0
    for X, y in data_iter:
        acc += accuracy(net(X), y)
    return acc / len(data_iter)


def train(net, train_iter, test_iter, loss, num_epochs, batch_size,
              params=None, lr=None, trainer=None):
    for epoch in range(num_epochs):
        train_l_sum = 0
        train_acc_sum = 0
        for X, y in train_iter:
            with autograd.record():
                y_hat = net(X)
                l = loss(y_hat, y)
            l.backward()
            if trainer is None:
                gb.sgd(params, lr, batch_size)
            else:
                trainer.step(batch_size)  # 下一節將用到。
            train_l_sum += l.mean().asscalar()
            train_acc_sum += accuracy(y_hat, y)
        test_acc = evaluate_accuracy(test_iter, net)
        print('epoch %d, loss %.4f, train acc %.3f, test acc %.3f'
              % (epoch + 1, train_l_sum / len(train_iter),
                 train_acc_sum / len(train_iter), test_acc))


num_epochs = 5
lr = 0.5
batch_size = 256
loss = gloss.SoftmaxCrossEntropyLoss()
train_iter, test_iter = load_data_fashion_mnist(batch_size)

trainer = gluon.Trainer(net.collect_params(),'sgd',{'learning_rate':lr})
train(net,train_iter,test_iter,loss,num_epochs,batch_size,None,None,trainer)

Gluon 實現 dropout 丟棄法

多層感知機中： hi 以 p 的概率被丟棄，以 1-p 的概率被拉伸，除以 1 - p import mxnet as mx import sys import os import time import gluonbook as gb from mxnet impor

PYTHON實現DFS算法

python clas gray pytho logs urn turn white blog 1 class Vertice: 2 def __init__(self,index): 3 self.no = index 4 self.colo

opencl+opencv實現sobel算法

編譯 globals ifstream sel perf edi query oba from 這幾天在看opencl編程指南。照著書中的樣例實現了sobel算法： 1.結合opencv讀取圖像，保存到緩沖區中。 2.編寫和編譯內核。並保存顯示處理後的結果。內核： c

純SQL實現小算法（輔助決策）_ 計算商品評分、及時補貨

mysql分別把計算各自的 1、點擊量/點擊量均值 2、銷售量/銷售量均值兩者相加，可以得到一個簡單評分又有問題了，豬肉的評分不應該比五花肉多。因此我們要加入簡單的權重，譬如點擊量評分占30%。銷售量評分占70%select p_type,p_name, (p_view/view_avg)

用OpenCV實現Photoshop算法(三): 曲線調整

快的 nes copy eve pla 很快 view 特點色值 http://blog.csdn.net/c80486/article/details/52499919 系列文章：用OpenCV實現Photoshop算法(一): 圖像旋轉用OpenCV實現Photo

C實現頭插法和尾插法來構建單鏈表（不帶頭結點）

res rgb eof uci fun while data 尾插法輸入數據鏈表的構建事實上也就是不斷插入節點的過程。而節點的插入能夠分為頭插法和尾插法。頭插法就是在頭結點後插入該節點，始終把該節點作為第一個節點。尾插法就是在鏈表的最後一個節點處插入元

PHP利用二叉堆實現TopK-算法的方法詳解

相對 baidu 文本文件過時 border 數據 http pan set 前言在以往工作或者面試的時候常會碰到一個問題，如何實現海量TopN，就是在一個非常大的結果集裏面快速找到最大的前10或前100個數，同時要保證內存和速度的效率，我們可能第一個想法就是利用排序

靜態變量數組實現LRU算法

nsh unset 是我 ima rec ast 變量 index 去除 LRU算法的解釋詳情請見 https://baike.baidu.com/item/LRU/1269842 這裏百度百科給出的比較詳細，然後後面有一個例子說 LRU（least recently u

JS實現插入排序法和選擇排序法

排序算法 ble inner 基本算法出了 clas 一點暫時 while 　　試著寫了寫，但對輸出方式不太熟，所以註釋部分的沒能成功（我猜測是數據被覆蓋了，所以最後運行結果都是‘6‘），或許不能用innerHTML來進行輸出，暫時不管了，改天再研究研究JavaScri

算法-PHP實現八大算法

mage 技術分享按引用傳遞 font 算法 cti 元素交換兩個數 arr 八大算法原理詳解交換函數：註意要按引用傳遞，否則無法真正交換兩個數的值　　function exchange(&$a, &$b){ $temp =

PHP實現基本算法代碼

數據 ext lec key dem sse 數據結構無數據 sch <？ //-------------------- // 基本數據結構算法 //-------------------- //二分查找，要求數組已經排好序，首先，假設表中元素是按升序排列，將表中間

排序算法（四）堆排序的Python實現及算法詳解

python 堆排序一、前言如果需要Java版本的堆排序或者堆排序的基礎知識——樹的概念，請參看本人博文《排序算法（二）堆排序》關於選擇排序的問題選擇排序最大的問題，就是不能知道待排序數據是否已經有序，比較了所有數據也沒有在比較中確定數據的順序。堆排序對簡單選擇排序進行了改進。二、準備知識堆：它是一

Kotlin實現LeetCode算法題之String to Integer (atoi)

測試案例 width 說明 max 根據 art system ise tar 題目String to Integer (atoi)（難度Medium）大意是找出給定字串開頭部分的整型數值，忽略開頭的空格，註意符號，對超出Integer的數做取邊界值處理。

C語言實現快速排序法（分治法）

下一個 enter hang partition 等於就是 tor log markdown title: 快速排序法（quick sort） tags: 分治法（divide and conquer method） grammar_cjkRuby: true ---

使用gluon實現簡單的CNN

val att style rain bin enumerate shuf max lec export PATH="/home/hxj/anaconda3/bin:$path" source activate gluon jupyter notebook from __

使用gluon實現簡單的CNN（二）

bsp evaluate label exce ini rate ati sof name from mxnet import ndarray as nd from mxnet import gluon from mxnet import autograd from mx

gluon實現VGG

ann mea add rain ons ogr channel rop true from __future__ import print_function import mxnet as mx from mxnet import nd, autograd from m

java實現KMP算法

java kmp package net.yk.string; public class KMP { public static void main(String[] args) { String major = "abababcabcabcda"; String m

java實現排序算法：快排、冒泡排序、選擇排序、插入排序、歸並排序

結果快速 post ont pla emp string () tro 一、概述：本文主要介紹常見的幾種排序算法的原理以及java實現，包括：冒泡排序、選擇排序、插入排序、快速排序、歸並排序等。二、冒泡排序：（1）原理：　　1、從第一個數據開始，與第二個數據相比較，

Python實現KNN算法

都是 object array odin 決定文件是否存在 line Coding .get Python實現Knn算法　　關鍵詞：KNN、K-近鄰(KNN)算法、歐氏距離、曼哈頓距離　　 KNN是通過測量不同特征值之間的距離進行分類。它的的思路是：如果一個樣本在特征

Gluon 實現 dropout 丟棄法

相關推薦