基於pytorch的改進的VDSR（基於FSRCNN的）

阿新 • • 發佈：2018-11-30

本博文為本人對FSRCNN+residual後的實驗的分析博文。不完全採用VDSR的程式碼，只對其中的residual部分做了參考。

之前的博文《學習筆記之——基於深度學習的影象超解析度重構》也介紹過VDSR，VDSR是基於SRCNN改進的，這裡做的是基於FSRCNN的VDSR。

VDSR的網路結構如下：

那麼本博文其實就是把這個網路結構中的SR部分由SRCNN改為FSRCNN

基於pytorch的VDSR連結（https://github.com/twtygqyy/pytorch-vdsr）

paper（https://arxiv.org/pdf/1511.04587.pdf）

下面給出修改後的程式碼：

python train.py -opt options/train/train_sr.json

#######################################################################################################3
#FSRCNN
class FSRCNN(nn.Module):
    def __init__(self, in_nc, out_nc, nf, nb, upscale=4, norm_type='batch', act_type='relu', \
            mode='NAC', res_scale=1, upsample_mode='upconv'):##play attention the upscales
        super(FSRCNN,self).__init__()
        #Feature extractionn
        self.conv1=nn.Conv2d(in_channels=in_nc,out_channels=nf,kernel_size=5,stride=1,padding=2)#nf=56.add padding ,make the data alignment
        self.prelu1=nn.PReLU()

        #Shrinking
        self.conv2=nn.Conv2d(in_channels=nf,out_channels=12,kernel_size=1,stride=1,padding=0)
        self.prelu2 = nn.PReLU()

        # Non-linear Mapping
        self.conv3=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
        self.prelu3 = nn.PReLU()
        self.conv4=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
        self.prelu4 = nn.PReLU()
        self.conv5=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
        self.prelu5 = nn.PReLU()
        self.conv6=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
        self.prelu6 = nn.PReLU()

        # Expanding
        self.conv7=nn.Conv2d(in_channels=12,out_channels=nf,kernel_size=1,stride=1,padding=0)
        self.prelu7 = nn.PReLU()

        # Deconvolution
        self.last_part= nn.ConvTranspose2d(in_channels=nf,out_channels=in_nc,kernel_size=9,stride=upscale, padding=4, output_padding=1)
        #for the residual
        self.DECO_part= nn.ConvTranspose2d(in_channels=in_nc,out_channels=in_nc,kernel_size=9,stride=upscale, padding=4, output_padding=1)



    def forward(self, x):#
         residual=self.DECO_part(x)###########
         out = self.prelu1(self.conv1(x))
         out = self.prelu2(self.conv2(out))
         out = self.prelu3(self.conv3(out))
         out = self.prelu4(self.conv4(out))
         out = self.prelu5(self.conv5(out))
         out = self.prelu6(self.conv6(out))
         out = self.prelu7(self.conv7(out))
         out = self.last_part(out)
         out = torch.add(out,residual)####################

         return out


##########################################################################################################

結果如下：

執行得特別得慢。。。。。

結果對比：

不採用反捲積，改為採用bicubic，程式碼修改如下：

#######################################################################################################3
#FSRCNN
class FSRCNN(nn.Module):
    def __init__(self, in_nc, out_nc, nf, nb, upscale=4, norm_type='batch', act_type='relu', \
            mode='NAC', res_scale=1, upsample_mode='upconv'):##play attention the upscales
        super(FSRCNN,self).__init__()
        #Feature extractionn
        self.conv1=nn.Conv2d(in_channels=in_nc,out_channels=nf,kernel_size=5,stride=1,padding=2)#nf=56.add padding ,make the data alignment
        self.prelu1=nn.PReLU()
 
        #Shrinking
        self.conv2=nn.Conv2d(in_channels=nf,out_channels=12,kernel_size=1,stride=1,padding=0)
        self.prelu2 = nn.PReLU()
 
        # Non-linear Mapping
        self.conv3=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
        self.prelu3 = nn.PReLU()
        self.conv4=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
        self.prelu4 = nn.PReLU()
        self.conv5=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
        self.prelu5 = nn.PReLU()
        self.conv6=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
        self.prelu6 = nn.PReLU()
 
        # Expanding
        self.conv7=nn.Conv2d(in_channels=12,out_channels=nf,kernel_size=1,stride=1,padding=0)
        self.prelu7 = nn.PReLU()
 
        # Deconvolution
        self.last_part= nn.ConvTranspose2d(in_channels=nf,out_channels=in_nc,kernel_size=9,stride=upscale, padding=4, output_padding=1)
 
 
    def forward(self, x):#
         
         residual=x
         m = nn.Upsample(scale_factor=2)
         residual=m(residual)
         #print(residual.size())
         #exit()

         out = self.prelu1(self.conv1(x))
         out = self.prelu2(self.conv2(out))
         out = self.prelu3(self.conv3(out))
         out = self.prelu4(self.conv4(out))
         out = self.prelu5(self.conv5(out))
         out = self.prelu6(self.conv6(out))
         out = self.prelu7(self.conv7(out))
         out = self.last_part(out)
         out=torch.add(out,residual)###################

         return out 
##########################################################################################################

網路沒有辦法收斂。。。。我也不知道什麼原因了。。。。。感覺就是採用了pytorch自帶的函式這樣插值就會這樣。。。。。那還是採用反捲積來實驗resudual把

再試試程式碼如下：

#######################################################################################################3
#FSRCNN
class FSRCNN(nn.Module):
    def __init__(self, in_nc, out_nc, nf, nb, upscale=4, norm_type='batch', act_type='relu', \
            mode='NAC', res_scale=1, upsample_mode='upconv'):##play attention the upscales
        super(FSRCNN,self).__init__()
        #Feature extractionn
        self.conv1=nn.Conv2d(in_channels=in_nc,out_channels=nf,kernel_size=5,stride=1,padding=2)#nf=56.add padding ,make the data alignment
        self.prelu1=nn.PReLU()
 
        #Shrinking
        self.conv2=nn.Conv2d(in_channels=nf,out_channels=12,kernel_size=1,stride=1,padding=0)
        self.prelu2 = nn.PReLU()
 
        # Non-linear Mapping
        self.conv3=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
        self.prelu3 = nn.PReLU()
        self.conv4=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
        self.prelu4 = nn.PReLU()
        self.conv5=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
        self.prelu5 = nn.PReLU()
        self.conv6=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
        self.prelu6 = nn.PReLU()
 
        # Expanding
        self.conv7=nn.Conv2d(in_channels=12,out_channels=nf,kernel_size=1,stride=1,padding=0)
        self.prelu7 = nn.PReLU()
 
        # Deconvolution
        self.last_part= nn.ConvTranspose2d(in_channels=nf,out_channels=in_nc,kernel_size=9,stride=upscale, padding=4, output_padding=1)

        #Upsmaple
        self.m=nn.UpsamplingBilinear2d(scale_factor=2)
 
 
    def forward(self, x):#
         
         residual_x=x
         residual=self.m(residual_x)
         #print(residual.size())
         #exit()
 
         out = self.prelu1(self.conv1(x))
         out = self.prelu2(self.conv2(out))
         out = self.prelu3(self.conv3(out))
         out = self.prelu4(self.conv4(out))
         out = self.prelu5(self.conv5(out))
         out = self.prelu6(self.conv6(out))
         out = self.prelu7(self.conv7(out))
         out = self.last_part(out)
         out=torch.add(out,residual)###################
 
         return out 
##########################################################################################################

結果也是一開始不收斂，但是慢慢得訓練就好多了，可惜最終得PSNR還是比較低

再換setting

#######################################################################################################3
#FSRCNN
class FSRCNN(nn.Module):
    def __init__(self, in_nc, out_nc, nf, nb, upscale=4, norm_type='batch', act_type='relu', \
            mode='NAC', res_scale=1, upsample_mode='upconv'):##play attention the upscales
        super(FSRCNN,self).__init__()
        #Feature extractionn
        self.conv1=nn.Conv2d(in_channels=in_nc,out_channels=nf,kernel_size=5,stride=1,padding=2)#nf=56.add padding ,make the data alignment
        self.prelu1=nn.PReLU()
 
        #Shrinking
        self.conv2=nn.Conv2d(in_channels=nf,out_channels=12,kernel_size=1,stride=1,padding=0)
        self.prelu2 = nn.PReLU()
 
        # Non-linear Mapping
        self.conv3=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
        self.prelu3 = nn.PReLU()
        self.conv4=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
        self.prelu4 = nn.PReLU()
        self.conv5=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
        self.prelu5 = nn.PReLU()
        self.conv6=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
        self.prelu6 = nn.PReLU()
 
        # Expanding
        self.conv7=nn.Conv2d(in_channels=12,out_channels=nf,kernel_size=1,stride=1,padding=0)
        self.prelu7 = nn.PReLU()
 
        # Deconvolution
        self.last_part= nn.ConvTranspose2d(in_channels=nf,out_channels=in_nc,kernel_size=9,stride=upscale, padding=4, output_padding=1)
 
        #Upsmaple
        self.m=nn.UpsamplingNearest2d(scale_factor=2)
 
 
    def forward(self, x):#
         
         residual_x=x
         residual=self.m(residual_x)
         #print(residual.size())
         #exit()
 
         out = self.prelu1(self.conv1(x))
         out = self.prelu2(self.conv2(out))
         out = self.prelu3(self.conv3(out))
         out = self.prelu4(self.conv4(out))
         out = self.prelu5(self.conv5(out))
         out = self.prelu6(self.conv6(out))
         out = self.prelu7(self.conv7(out))
         out = self.last_part(out)
         out=torch.add(out,residual)###################
 
         return out 
##########################################################################################################

這樣得結果看似學習率一開始設定太大了~~~那試試把學習率設定低一點看看

補充

can't convert CUDA tensor to numpy. Use Tensor.cpu() to copy the tensor to host memory first.

關於pytorch中的上取樣https://blog.csdn.net/g11d111/article/details/82855946

class torch.nn.UpsamplingBilinear2d(size=None, scale_factor=None)[source]

https://pytorch-cn.readthedocs.io/zh/latest/package_references/torch-nn/#class-torchnnupsamplingbilinear2dsizenone-scale_factornonesource

基於pytorch的改進的VDSR（基於FSRCNN的）

本博文為本人對FSRCNN+residual後的實驗的分析博文。不完全採用VDSR的程式碼，只對其中的residual部分做了參考。之前的博文《學習筆記之——基於深度學習的影象超解析度重構》也介紹過VDSR，VDSR是基於SRCNN改進的，這裡做的是基於FSRCNN的VDSR。

基於pytorch的ESRGAN（論文閱讀筆記+復現）

程式碼的框架——《https://github.com/xinntao/BasicSR》 ESRGAN論文《ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks》的連結——https://arxiv.org/pdf

學習筆記之——基於pytorch的SFTGAN（xintao程式碼學習，及資料處理部分的學習）

程式碼的框架仍然是——《https://github.com/xinntao/BasicSR》給出SFTGAN的論文《Recovering Realistic Texture in Image Super-resolution by Deep Spatial Feature Transfo

android與C# WebService基於ksoap通信（C#篇）

ldo art fadein length col scripts append hid ldoc 1.打開VS 2013新建項目>>ASP.NET空WEB應用程序(我用的是.net 4.0) 2.在剛建立的項目上加入新建項（Web

清華大學視頻課件：基於Linux的C++（自主模式）

清華大學視頻課件基於linux的c++基於Linux的C++（自主模式）課程簡介Linux操作系統開源的特性使得其獲得越來越重要的地位，而Linux系統編程也向C++程序設計者提出了更高的要求。本課程由C/C++語言的共性與特性出發，在深入學習程序設計語言的基礎上，進一步強調程序設計語言的適用性，並與Li

基於Apache POI匯出（百萬級）大資料量Excel的實現

POI匯出大資料量excel （注：專案原始碼及後續更新請點選） 1、ExcelUtils類： package Utils; import com.alibaba.fastjson.JSONArray; import com.alibaba.fastjson.JSONObje

MySQL 8.0.12 基於Windows 安裝教程（超級詳細）

MySQL 8.0.12 基於Windows 安裝教程（超級詳細）（一步一步來，裝不了你找我！）本教程僅適用Windows系統，如果你原本裝了沒裝上，一定要先刪除原本的資料庫，執行：mysqld --remove mysql，然後在看我的帖子！第一步：到MySQL官網下

資料結構實現 10.2：對映_基於AVL樹實現（C++版）

資料結構實現 10.2：對映_基於AVL樹實現（C++版） 1. 概念及基本框架 2. 基本操作程式實現 2.1 增加操作 2.2 刪除操作 2.3 修改操作 2.4 查詢操作 2.5 其他操作 3.

資料結構實現 6.4：優先佇列_基於連結串列實現（C++版）

資料結構實現 6.4：優先佇列_基於連結串列實現（C++版） 1. 概念及基本框架 2. 基本操作程式實現 2.1 入隊操作 2.2 出隊操作 2.3 查詢操作 2.4 其他操作 3. 演算法複雜度分析

資料結構實現 6.3：優先佇列_基於動態陣列實現（C++版）

資料結構實現 6.3：優先佇列_基於動態陣列實現（C++版） 1. 概念及基本框架 2. 基本操作程式實現 2.1 入隊操作 2.2 出隊操作 2.3 查詢操作 2.4 其他操作 3. 演算法複雜度分析

資料結構實現 6.1：二叉堆_基於動態陣列實現（C++版）

資料結構實現 6.1：二叉堆_基於動態陣列實現（C++版） 1. 概念及基本框架 1.1 滿二叉樹 1.2 完全二叉樹 2. 基本操作程式實現 2.1 增加操作 2.2 刪除操作 2.3 查詢操作

資料結構實現 5.2：對映_基於連結串列實現（C++版）

資料結構實現 5.2：對映_基於連結串列實現（C++版） 1. 概念及基本框架 2. 基本操作程式實現 2.1 增加操作 2.2 刪除操作 2.3 修改操作 2.4 查詢操作 2.5 其他操作 3. 演

資料結構實現 4.2：集合_基於連結串列實現（C++版）

資料結構實現 4.2：集合_基於連結串列實現（C++版） 1. 概念及基本框架 2. 基本操作程式實現 2.1 增加操作 2.2 刪除操作 2.3 查詢操作 2.4 其他操作 3. 演算法複雜度分析

2.3 如何得到真實的執行計劃《基於Oracle的優化（學習筆記）》

if( hash_values.count > 0 ) then for i in hash_values.first .. hash_values.last loop dbms_output.put_line('----------------------------

2.5 Oracle裡常見執行計劃《基於Oracle的優化（學習筆記）》

與表訪問相關的執行計劃全表掃描的關鍵字是：TABLE ACESS FULL ROWID掃描的關鍵字：TABLE ACESS BY USER ROWID 或 TABLE ACESS BY INDEX ROWID 與B樹相關的執行計劃索引唯一掃描：INDEX UN

自動文摘（Automatic document summarization）方法綜述（三）——基於次模函式（submodular function）最大化的方法

自動文摘（Automatic document summarization）方法綜述的第一篇文章（一）總結了基於中心的（Centroid-based）方法和基於圖的（graph-based）方法，第二篇文章（二）總結了基於最優化的（optimization-ba

5.2 Oracle裡收集與檢視統計資訊的方法《基於Oracle的優化（學習筆記）》

收集統計資訊有兩種方法：一是通過analyze命令，一是通過dbms_stats包使用analyze收集統計資訊的方法刪除索引的統計資訊 analyze index index_name delete statistics; 以估算的模式，取樣的比例15%

菜鳥自學selenium+python基於web的自動化（功能自動化）

本人是自動化測試初學者，真正的菜鳥一隻。實際入坑測試接近2年（截止發文之前）。對自動化測試沒有太深入的瞭解，寫這些只是做個鋪墊，因為能看這篇文章的基本都是小白或者菜鳥。說到這裡，不再繼續侃，直接上菜。為什麼學自動化，because make so much money！那

5.6全域性統計資訊《基於Oracle的優化（學習筆記）》

Oracle裡面的全域性統計資訊（global statistics)是直接衝物件本身這一級收集統計資訊，而不是從下一級物件“推導”或“彙總”出來的統計資訊。當適用DBMS_STATS包的儲存過程收集統計資訊時，引數granularity用於指定全域性統計資訊的收集策

6.4常見的Hint《基於Oracle的優化（學習筆記）》

與優化器相關的Hint /*+ ALL_ROWS */ 它的含義是啟用CBO /*+ FIRST_ROWS(n) */ 優化器啟用CBO，而且依據返回頭n條的記錄的響應時間來決定SQL的執行計劃。注意，first_rows(n)與first_rows_n並

基於pytorch的改進的VDSR（基於FSRCNN的）

補充

class torch.nn.UpsamplingBilinear2d(size=None, scale_factor=None)[source]

相關推薦