（原）tensorflow中finetune某些層

阿新 • • 發佈：2017-09-29

master oba 參考 -a ads tro ids .html class

轉載請註明處處：

http://www.cnblogs.com/darkknightzh/p/7608709.html

參考網址：

https://kratzert.github.io/2017/02/24/finetuning-alexnet-with-tensorflow.html

https://github.com/kratzert/finetune_alexnet_with_tensorflow/blob/master/finetune.py#L109

https://github.com/davidsandberg/facenet

得到正常訓練時的train_op時，使用tf.trainable_variables()，想要finetune，使用下面這句話（參考網址1，其實網址1和2都是同一個人的。。。）：

fine_tune_var_list = [v for v in tf.trainable_variables() if v.name.split(‘/‘)[0] in train_layers]

或者

fine_tune_var_list = [i for i in tf.trainable_variables() if ‘fc1/weights‘ in i.name]

可以得到需要finetune的參數。如果不知道參數名字，可以先print出來：

for var in tf.trainable_variables():
    print(var)

然後找到需要finetune的層。也可以通過其他方法，只要能找到就行。。。

將fine_tune_var_list傳給train_op，之後正常訓練，便可以對網絡進行finetune了，如下（見參考網址2）：

with tf.name_scope("train"):
    # Get gradients of all trainable variables
    gradients = tf.gradients(loss, var_list)
    gradients = list(zip(gradients, var_list))

    # Create optimizer and apply gradient descent to the trainable variables 

    optimizer = tf.train.GradientDescentOptimizer(learning_rate)
    train_op = optimizer.apply_gradients(grads_and_vars=gradients)

當然，也可以使用自己其他的代碼。但是，我這邊直接使用上面代碼，保存模型時，後綴都是0，把train_op 那句改成train_op = optimizer.apply_gradients(grads_and_vars=gradients , global_step=global_step)就可以了。當然，我出現的問題，和自己的代碼有關系。

也可以用下面的代碼（從參考網址3中提取）：

opt = tf.train.GradientDescentOptimizer(learning_rate)
train_op = get_train_op(grad, opt, global_step, args.moving_average_decay, finetune_params)

其中，

def get_train_op(grads, opt, global_step, moving_average_decay, train_var):
        
    # Apply gradients.
    apply_gradient_op = opt.apply_gradients(grads, global_step=global_step)
  
    # Track the moving averages of trainable variables.
    variable_averages = tf.train.ExponentialMovingAverage(moving_average_decay, global_step)
    variables_averages_op = variable_averages.apply(train_var)
  
    with tf.control_dependencies([apply_gradient_op, variables_averages_op]):
        train_op = tf.no_op(name=‘train‘)
  
    return train_op

註意的是，參考網址2中的代碼，再對參數更新的時候，沒有使用滑動平均。上面的代碼，使用了滑動平均。

（原）tensorflow中finetune某些層

master oba 參考 -a ads tro ids .html class 轉載請註明處處： http://www.cnblogs.com/darkknightzh/p/7608709.html 參考網址： https://kratzert.github.io/

（原）tensorflow中使用指定的GPU及GPU視訊記憶體

轉載請註明出處：參考網址： 1 終端執行程式時設定使用的GPU 如果電腦有多個GPU，tensorflow預設全部使用。如果想只使用部分GPU，可以設定CUDA_VISIBLE_DEVICES。在呼叫python程式時，可以使用（見第一個參考網址Franck Dernoncourt的回覆）

（原）torch7中指定可見的GPU

編號設置 get href visible uda blog 電腦 arc 轉載請註明出處： http://www.cnblogs.com/darkknightzh/p/7418694.html 參考網址： https://gitter.im/torch/torch

迴圈神經網路系列（三）Tensorflow中MultiRNNCell

迴圈神經網路系列（一) Tensorflow中BasicRNNCell 迴圈神經網路系列（二）Tensorflow中dynamic_rnn 經過前面兩篇博文，我們介紹瞭如何定義一個RNN單元，以及用dynamic_rnn來對其在時間維度（橫軸）上展開。我們今天要介紹的就是如何疊加多層

迴圈神經網路系列（二）Tensorflow中dynamic_rnn

1.回顧上一篇博文(迴圈神經網路系列（一)Tensorflow中BasicRNNCell)中我們介紹了在Tensoflow中，每個RNN單元的實現，以及對應各個引數的含義。自那之後，我們就能通過Tensorflow實現一個單元的計算了。 import tensorflow as

迴圈神經網路系列（一）Tensorflow中BasicRNNCell

按道理看完RNN的原理之後，我們就應該來用某種框架來實現了。可偏偏在RNN的實現上，對於一個初學者來說Tensorflow的表達總是顯得那麼生澀難懂，比起CNN那確實是差了一點。比如裡面的引數就顯示不是那麼的友好。num_units到底指啥？原諒我最開始以為指的是RNN單元的個數。zer

（原）netbeans中新增anaconda3安裝的opencv

轉載請註明出處： https://www.cnblogs.com/darkknightzh/p/9974310.html 新裝了ubuntu16.04後，直接安裝了anaconda3，除錯c++程式時，要用到opencv，因而在anaconda中安裝了opencv，命令如下： conda inst

迴圈神經網路系列（七）Tensorflow中ConvLSTMCell

前面一文我們簡單得介紹了ConvLSTM得原理和應用場景，現在來看看在Tensorflow它具體是如何實現得。值得一說得是Tensorflow在實現這個演算法得時候並沒有使用peepholes，即下面的紅色部分，而是基於原始的LSTM網路結構改變的。不過在最後，我也會給出一個仿照

迴圈神經網路系列（五）Tensorflow中BasicLSTMCell

1.結論照慣例，先上結論，再說過程，不想看過程的可直接略過。從這個圖我們可以知道，一個LSTM cell中有4個引數，並且形狀都是一樣的shape=[output_size+n,output_size],其中n表示輸入張量的維度,output_size

TensorFlow筆記（1）——TensorFlow中的相關基本概念

前言 Tensorflow 是一個程式設計系統，使用圖（graph）來表示計算任務，圖（graph）中的節點稱之為 op (operation），一個 op 獲得 0 個或多個 Tensor，執行計算，產生 0 個或多個 Tensor。Tensor 看作是一個 n 維的陣列或列表。圖必須

（原）JavaScript高級程序設計(第3版)--學習筆記--02: 在HTML中使用JavaScritp--0006--<noscript>元素

span 不支持 scrip src 高級 2.4 高級程序設計 example 否則 2.4 <noscript>元素在<noscript>元素中的內容只有在下列情況下才會顯示出來： * 瀏覽器不支持腳本； * 瀏覽器致辭腳本，但腳本被禁用

（原）JavaScript高級程序設計(第3版)--學習筆記--02: 在HTML中使用JavaScritp--0007--總結

標簽高級程序設計情況下嵌入順序執行設置學習筆記混合執行順序小結在 JavaScript 插入到 HTML 頁面中要使用<script>元素。使用這個元素可以把 JavaScript 嵌入到 HTML 頁面中，讓腳本與標記混合在一起；也可以包含

1127 ZigZagging on a Tree （30 分）（利用後序中序求層序變形）

1127 ZigZagging on a Tree （30 分） Suppose that all the keys in a binary tree are distinct positive integers. A unique binary tree can be determined b

（原）faster rcnn的tensorflow程式碼的理解

轉載請註明出處：參考網址：論文：https://arxiv.org/abs/1506.01497 tf的第三方faster rcnn：https://github.com/endernewton/tf-faster-rcnn IOU：https://www.cnblogs.com/

（原） mysql 查詢表中最大時間和非空值的合集

有表查詢 time 最大 con 非空的時間注：time 為整個表最大現有資料要求結果時間最大並且有內容 sql語句select a.id ,a.con, max(b.time) from test a, test b whe

（筆記）Photoshop中圖層混合模式理解

轉載自： Photoshop的混合模式作為一個比較的中英文名稱和用處一直對不上號，每次都是Shift ＋＋/－一個個試，整理一下。（PS的教程那麼多醜的也那麼多，感覺要好好整理才能學到提升審美的東西。） 1. 介面（發現順序竟然是一一對應的。。。） (

（原）使用1080Ti顯卡時安裝ubuntu16.04.1及驅動的步驟

-i details ati bsp csdn apt-get pos code 主板轉載請註明出處： http://www.cnblogs.com/darkknightzh/p/6811328.html 參考網址： http://www.cnblogs.com/d

（七）Hibernate中使用JDBC

alt work 方法代碼 cep cti 一個 sdm admin 在hibernate中獲取connection數據庫連接有兩種方法：(操作數據庫常用這種方法) 1. session.doReturningWork 返回一個對象，適用於查詢方法 2. ses

（我是初學者）第一次項目開發（二）開發中遇到的問題和註意事項

持久層數據庫認識碼代碼操作出錯排序文檔項目這周正式開始做項目練習，這才發現實際去做的時候會遇到和出現很多的問題在這裏說一說我的體會，請指正首先，實體類 1、實體類中有哪些屬性，類型是什麽，並根據屬性建立sql的相應表格， 2、哪些屬性需要在寫在實體

（轉）OL2中設置鼠標的樣式

format csdn 移動初始 pbo led doc 代碼 detail http://blog.csdn.net/gisshixisheng/article/details/49496289 概述：在OL2中，鼠標默認是箭頭，地圖移動時，鼠標樣式是移動樣式；很

（原）tensorflow中finetune某些層

相關推薦