記一次使用Tensorflow搭建神經網路模型經歷

阿新 • • 發佈：2019-01-01

隱去背景, 作者最近第一次用Tensorflow實現訓練了幾個模型, 其中遇到了一些錯誤, 把它記錄下來

前言

以下提到的所有程式碼, 都可以在github上面找到. 倉庫地址 https://github.com/spxcds/neural_network_code/
這個倉庫裡提到的幾段程式碼, 分別實現在從最簡單的lr, 到全連線神經網路, 再到卷積神經網路. 從最簡單的自己實現交叉熵損失函式, 計算L2正則化, 到後來直接呼叫庫函式, 由簡到難, 由淺入深, 截止目前為止, 只實現了MLR, MLP, LeNet-5, AlexNet, VGG-16等幾個演算法

網路結構

LeNet-5

AlexNet

程式碼實現

幾個重要的函式

卷積操作

def conv(self, input_tensor, name, kh, kw, dh, dw, n_output, padding='SAME'):
    n_input = input_tensor.get_shape()[-1].value

    kernel = tf.get_variable(
        name=name + 'kernel',
        shape=[kh, kw, n_input, n_output],
        dtype=tf.float32,
        initializer=tf.truncated_normal_initializer(stddev=0.05))
    bias = tf.get_variable(
        name=name + 'bias', shape=[n_output], dtype=tf.float32, initializer=tf.constant_initializer(0.0))

    c = tf.nn.conv2d(input_tensor, kernel, (1, dh, dw, 1), padding=padding) # SAME, VALID
    return tf.nn.relu(tf.nn.bias_add(c, bias), name=name)

全連線操作

def fc(self, input_tensor, name, n_output):
    n_input = input_tensor.get_shape()[-1].value
    weights = tf.get_variable(
        name=name + 'weights',
        shape=[n_input, n_output],
        dtype=tf.float32,
        initializer=tf.truncated_normal_initializer(stddev=0.05))
    tf.add_to_collection('losses', tf.nn.l2_loss(weights)) # l2_lambda * tf.add_n(tf.get_collection('losses'))
    bias = tf.get_variable(
        name=name + 'bias', shape=[n_output], dtype=tf.float32, initializer=tf.constant_initializer(0.0))

    return tf.nn.bias_add(tf.matmul(input_tensor, weights), bias)

交叉熵

cost_cross_entropy = tf.reduce_mean(-tf.reduce_sum(y * tf.log(tf.clip_by_value(p, 1e-10, 1.0)), axis=1))

畫圖

def plot(self, save_path):
    df = pd.DataFrame(self.train_history, columns=['iterations', 'train_acc', 'val_acc', 'train_loss', 'val_loss'])

    # loss曲線
    fig = plt.figure(figsize=(20, 10))
    ax = fig.add_subplot(121)
    ax.grid(True)
    ax.plot(df.iterations, df.train_loss, 'k', label='訓練集損失', linewidth=1.2, alpha=0.4)
    ax.plot(df.iterations, df.val_loss, 'k--', label='驗證集損失', linewidth=2)
    ax.legend(fontsize=16)
    ax.set_xlabel('Iterations', fontsize=16)
    ax.set_ylabel('Loss', fontsize=16)
    ax.set_xlim(np.min(df.iterations), np.max(df.iterations) + 0.1, auto=True)
    ax.tick_params(axis='both', which='major')
    ax.set_title('損失曲線', fontsize=22)

    # 混淆矩陣
    fig_matrix_confusion = plt.figure(figsize=(10, 10))
    ax = fig_matrix_confusion.add_subplot(111)
    confusion_matrix = self.get_confusion_matrix(mnist.test.images, mnist.test.labels)
    sns.heatmap(
        confusion_matrix,
        fmt='',
        cmap=plt.cm.Greys,
        square=True,
        cbar=False,
        ax=ax,
        annot=True,
        xticklabels=np.arange(10),
        yticklabels=np.arange(10),
        annot_kws={'fontsize': 20})
    ax.set_xlabel('Predicted', fontsize=16)
    ax.set_ylabel('True', fontsize=16)
    ax.tick_params(labelsize=14)
    ax.set_title('混淆矩陣', fontsize=22)
    plt.savefig(save_path + '_confusion_matrix')
    plt.close()

碰到的問題

網路loss幾乎不收斂
- 學習率設定的不對, 稍微調大一點學習率就可以了
- batch_size設定的太大
- 優化演算法選一個更高階的, 原先我使用的是tf.train.GradientDescentOptimizer優化演算法, 跑了幾千個batch才有效果, 換成tf.train.AdamOptimizer, 幾十個batch就開始收斂了
訓練一段時間後, 網路loss變為NaN
- 梯度爆炸, 使學習過程偏離了正常的學習軌跡, 這個時候調低學習率就可以了
- 計算交叉熵的時候, 出現了log(0)*0的;情況, 使用tf.clip_by_value(t=value,clip_value_min=1e-8,clip_value_min=1.0)避免這種情況
訓練集和驗證集accuracy維持在0.1左右不變, 可能正則化引數l2_lambda設定大了, 設成1e-4左右試一下
全連線層的最後一層輸出層就不要加relu了, 直接加一個softmax即可

未經允許禁止轉載 http://spxcds.com/2019/01/01/first_deep_learning/

記一次使用Tensorflow搭建神經網路模型經歷

隱去背景, 作者最近第一次用Tensorflow實現訓練了幾個模型, 其中遇到了一些錯誤, 把它記錄下來前言以下提到的所有程式碼, 都可以在github上面找到. 倉庫地址 https://github.com/spxcds/neural_network_code/ 這個倉庫裡提到的幾段程式碼, 分

學會使用tensorflow搭建神經網路

搭建神經網路基本流程定義新增神經層的函式 1.訓練的資料 2.定義節點準備接收資料 3.定義神經層：隱藏層和預測層 4.定義 loss 表示式 5.選擇 optimizer 使 loss 達到最小然後對所有變數進行初始化，通過 sess.run optimizer，迭代 1000

Tensorflow 搭建神經網路基本流程

cs224d-Day 6: 快速入門 Tensorflow 本文是學習這個視訊課程系列的筆記，課程連結是 youtube 上的，講的很好，淺顯易懂，入門首選，而且在github有程式碼，想看視訊的也可以去他的優酷裡的頻道找。 Tensorflow 官網神經網路是一種數學模型，

使用者畫像（2）使用keras框架搭建神經網路模型

import pickle import pandas as pd import tensorflow as tf import numpy as np import matplotlib.pyplot as plt from keras import back

TensorFlow搭建神經網路入門

深度學習解決的核心問題之一就是自動地將簡單的特徵組合成更加複雜的特徵，一旦解決了資料表達和特徵提取，很多人工智慧任務也就解決了90%。 TensorFlow計算框架可以很好地支援深度學習的各種演算法，但它的應用不限於深度學習。一、TensorFlow的主要依賴包

【連載】深度學習筆記8：利用Tensorflow搭建神經網路

在筆記7中，和大家一起入門了 Tensorflow 的基本語法，並舉了一些實際的例子進行了說明，終於告別了使用 numpy 手動搭建的日子。所以我們將繼續往下走，看看如何利用 Tensorflow 搭建神經網路模型。儘管對於初學者而言使用 Te

記一次VMware虛擬機器網路排錯

電腦的vmware虛擬機器在學校是可以用的（用的社團網線），搬到上海後，電腦連線的是無線網，開啟虛擬機器後出現問題。出現問題：虛擬機器配置一切正常，能ping 127.0.0.1和localhost，但ping不通www.baidu.com和114.114.114.1

記一次springboot啟動不起來的經歷

最新 lips 檢查 boot register cli down 一次 shu 在用eclipse+maven構建一個基本的springboot的web應用時在執行main方法（一個基本的springApplication類）出現Unregistering JMX-exp

記一次真實的網站被黑經歷

明顯 AR 也說用戶 -o HP 靜態 lis 圖片前言距離上次被DDOS×××已經有10天左右的時間，距離上上次已經記不起具體那一天了，每一次都這麽不了了只。然而近期一次相對持久的×××，我覺得有必要靜下心來，分享一下被黑的那段經歷。在敘述經歷之前，先簡單的介紹

記一次服務器被挖礦經歷與解決辦法

alt boot 告警 port 下載被黑 rep $2 nano 記一次服務器被挖礦經歷與解決辦法在最近的某一天裏面，中午的一個小息過後，突然手機的郵件和公眾號監控zabbix的告警多了起來。我拿起手機一看原來是某臺服務器上的CPU跑滿了，就開始登上去看一下是哪

記一次m3u8檔案轉mp4的經歷

首先在相應的網頁下載m3u8檔案，一直播的視訊格式就是這樣的。下載下來後你會發現裡面的格式如下圖所示：這裡面的ts檔案就是視訊的碎片檔案，但是這個是相對路徑，怎麼獲取到絕對路徑呢？以一直播為例，我下載m3u8的檔案地址為“http://alcdn.hls

記一次spring註解開啟失敗的經歷

1.專案中註解開啟事務配置　　如有多個org.springframework.jdbc.datasource.DataSourceTransactionManager時候，要制定bean名稱，例： @Transaction（“transactionManager”） 2.spring中註

記一次解決伺服器病毒qW3xT.2經歷

先是在伺服器出現警告，說可能是挖礦的病毒。剛開始沒當回事，當把這個病毒百度之後發現，很嚴重吶。好了，開始幹活。第一步：連結地址：https://blog.csdn.net/weixin_41228949/article/details/81501753 然鵝，沒有成功。。。。

記一次逆向追蹤請求ip的經歷

事發某日下午，部門使用的測試環境出現問題，所有整合測試case都執行失敗。查詢測試用伺服器發現是磁碟已滿，造成請求失敗。應急處理發現磁碟空間問題後，首先想到的是程式日誌過大，因為這臺機器上部署了部門的幾十個應用,以前也出現過日誌造成磁碟空間不足的問題。所

記一次tomcat BUG的踩坑經歷

tomcat Webapps專案二次載入最近在linux伺服器部署專案，由於是遷伺服器，所以直接把原來伺服器上的專案遷到新伺服器tomcat下的webapps目錄下並啟動，一切如我預想，順利執行。但是之後檢視後臺日誌，卻發現B端的一次請求，S端有兩次處理請求

記一次失敗的IM APP開發經歷

近期收到一個類似釘釘的IM軟體安卓端開發需求，自己想也沒想就同意了開發需求，需要一個月內實現通訊錄下載，點對點發訊息，圖片，表情，小視訊，離線檔案，群聊（同樣實現訊息，表情，小視訊，離線檔案）的開發，前期一直沒有重視起來，因為有凡信這樣的開源框架，到了對接的時候發

記一次檢視檔案被刪除的經歷

history | grep rm 發現沒有人最近做刪除，那麼就是程式刪除。檢視資料夾（logs）最近修改時間：ls -al logs 檢視系統磁碟資訊 df -h 發現系統的掛載目錄是：/dev/sdal 使用：debugfs open /dev/sda

記一次失敗的小米前端面試經歷

之前投了小米南京的前端開發崗，今天晚上有時間進行了一次視訊面試，嗯，感覺欠缺的東西太多了，好多都不會，下面記錄下一些面試的題目。 es6中的let和var的區別是什麼？用過bind函式嗎？作用是什麼？ call和apply的區別是什麼？有沒有想過call是怎

記一次面試（被騙）經歷

所有以培訓為目的的招生單位都是耍流氓。媽的第一次參加面試就遇到了一個流氓，在51job上投遞了一個C#的工作，過了幾天收到了一個叫做第九城市的遊戲開發公司的面試申請，剛接到電話時真的有點小興奮，為了面試還特意的將C#的基礎知識全部過了一遍，本來信心滿滿的，擠著可以瘦身的地鐵，在這個炎熱的

記一次用Java Stream Api的經歷

最近有個專案需要用到推薦系統，弄了個簡單的相似度推薦演算法。資料為：化簡為： public class Worker { /** * 使用者編號 */ private long userId; /** * 期

記一次使用Tensorflow搭建神經網路模型經歷

前言

網路結構

程式碼實現

畫圖

碰到的問題

相關推薦