用SVD壓縮深度模型（DNN,CNN）的全連線層(fully-connected layer)

阿新 • • 發佈：2019-01-12

轉自：https://my.oschina.net/liusicong/blog/866364

轉載請註明出處，否則將依法追究版權

全連線層出現在DNN和 CNN中.很多論文[介紹瞭如何用SVD，VQ，Sparse code壓縮全連線層,這些方法不是端到端地訓練一個新模型,而是對訓練好的模型壓縮其全連線層的權重矩陣,在應用實現中則需要同時考慮對權重和偏移的處理. 實際上權重和偏移的維度不相同,處理方法是不同的.本文將系統性地介紹在應用實現中,如何利用下述方法壓縮權重矩陣,同時處理與之對應的偏移量,從而實現全連線層壓縮的整個過程.

首先深入研究兩個相鄰全連線層的運算原理,理解權重矩陣和偏移的關係.如下圖所示,第L層有m個神經元,第(L+1)層有n個神經元,因此相鄰兩個全連線層的權重矩陣是一個的2維矩陣.全連線層輸入與輸出的對映關係是 .即L層所有神經元與第(L+1)層的某個神經元的連線共享同一個偏移量,因此相鄰兩個全連線層的偏移量是一個1維向量,包含n個元素.

奇異值分解(SVD)壓縮演算法. 如下圖所示,基於SVD的全連線層壓縮方法就是引入一箇中間層L’,該中間層包含 c個神經元, .因此可以減少連線數和權重規模,權重矩陣規模從 mn減少到(m+n)c ,從而降低執行深度模型的計算和儲存需求.

DeepX運用了基於SVD的面向層的壓縮技術,處理訓練好的模型引數，以減少引數規模,減少模型執行推斷時的資源消耗,提高推斷速度.具體地,相鄰的兩個全連線層L和(L+1)分別有m和n個神經元,對相鄰兩層的權重矩陣執行SVD運算,即就是 .可以選擇最大的c個值來近似權重矩陣,如式(1)所示.
（1）

基於以上分析，就可以直接程式碼實現了

用SVD壓縮深度模型（DNN,CNN）的全連線層(fully-connected layer)

用SVD壓縮深度模型（DNN,CNN）的全連線層(fully-connected layer)

CNN（卷積層convolutional layer，激勵層activating layer，池化層pooling，全連線層fully connected）

CNN的全連線層已過時？全域性平均池化（GAP）瞭解一下

深度學習基礎--卷積--區域性連線層(Locally-Connected Layer)

對CNN網路全連線層的一些理解

CNN中全連線層是什麼樣的？

解釋一下全連線層&CNN中全連線層是什麼樣的

卷積神經網路(CNN)中全連線層(FC layer)的作用

模型驅動的深度學習（ADMM-net）

機器學習與深度學習系列連載：第二部分深度學習（十二）卷積神經網路 3 經典的模型（LeNet-5，AlexNet ，VGGNet，GoogLeNet，ResNet）

機器學習與深度學習系列連載：第二部分深度學習（十一）卷積神經網路 2 Why CNN for Image？

機器學習與深度學習系列連載：第一部分機器學習（五）生成概率模型（Generative Model）

caffe的python介面學習（6）：用訓練好的模型（caffemodel）來分類新的圖片

目標檢測經典模型（R-CNN、Fast R-CNN、Faster R-CNN）

深度學習中的注意力模型（2017版）

基於深度卷積神經網路（D-CNN）的影象去噪方法

深度學習（十八）基於R-CNN的物體檢測

深度學習課程之文字預處理、詞袋模型、word2vec、語言模型（1.9）

windows下用caffe載入二進位制模型（linux下訓練）的問題

手把手教你用R語言建立信用評分模型（完結篇）— —打分卡轉換

用SVD壓縮深度模型（DNN,CNN）的全連線層(fully-connected layer)

相關推薦