反捲積與反捲積核的初始化問題

阿新 • • 發佈：2018-11-06

導論：

https://blog.csdn.net/qq_30638831/article/details/81532892

https://cv-tricks.com/image-segmentation/transpose-convolution-in-tensorflow/

https://zhuanlan.zhihu.com/p/38964806

tf.nn.conv2d_transpose（

conv, 卷積後的結果，假設為（16,375,250,64）

權重的初始化，使用線性插值，請參考後面， [3,3,3,64] [kernel,kernel,輸出特徵個數，輸入特徵個數]，

輸出的初始化， [16,750,500,3] [batch,height,width,chanel] chanel必須與輸出特徵個數相等

strides=[1,2,2,1],padding='SAME'

）

conts = tf.nn.conv2d_transpose(pool,kernel2,output_shape,strides=[1,2,2,1],padding='SAME')

插值的目的: 把影象更精確的語義分割與得到原畫素

差值等大小的filter:


from math import ceil
import numpy as np

import tensorflow as tf


def __get_deconv_filter(f_shape):
    """
    Compute bilinear filter and return it
    """
    filt_width = f_shape[0]  #計算kernel的寬
    filt_height = f_shape[1] #計算kernel的長
    half_width = ceil(filt_width /2.0)
    center = (2 * half_width - 1 - half_width % 2) / (2.0 * half_width) # 計算某點的權值  對這個點進行插值
    bilinear = np.zeros([filt_width, filt_height])
    for x in range(filt_width):
        for y in range(filt_height):
            value = (1 - abs(x / half_width - center)) * (1 - abs(y / half_width - center))
            bilinear[x, y] = value
    weights = np.zeros(f_shape)
    for i in range(f_shape[2]):
        weights[:, :, i, i] = bilinear
        print(weights[:, :, i, i])



    init = tf.constant_initializer(value=weights,
                                   dtype=tf.float32)
    return tf.get_variable(name="up_filter", initializer=init,
                           shape=weights.shape)
a = __get_deconv_filter([3, 3, 3, 3])

差值翻倍的kernel:

def get_kernel_size(factor):
    """
    Find the kernel size given the desired factor of upsampling.
    """
    #獲取kernel的大小
    return 2 * factor - factor % 2


def upsample_filt(size):
    """
    Make a 2D bilinear kernel suitable for upsampling of the given (h, w) size.
    """
    factor = (size + 1) // 2
    if size % 2 == 1:
        center = factor - 1
    else:
        center = factor - 0.5
    og = np.ogrid[:size, :size]
    return (1 - abs(og[0] - center) / factor) * \
           (1 - abs(og[1] - center) / factor)





def bilinear_upsample_weights(factor, number_of_classes):
    """
    Create weights matrix for transposed convolution with bilinear filter
    initialization.
    """

    filter_size = get_kernel_size(factor)

    weights = np.zeros((filter_size,
                        filter_size,
                        3,
                        4), dtype=np.float32)

    upsample_kernel = upsample_filt(filter_size)

    for i in range(3):
        weights[:, :, i, i] = upsample_kernel

    return weights


print(bilinear_upsample_weights(2,21).shape)

import tensorflow as tf
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt

from math import ceil

'''
    一張圖片的反捲積
'''

im = Image.open('timg.jpg')
images = np.asarray(im)
print(images.shape)

images = np.reshape(images,[1,750,500,3])

img = tf.Variable(images,dtype=tf.float32)
# kernel = tf.get_variable(name='a',shape=[3, 3, 3, 3], dtype=tf.float32,
#                                   initializer=tf.contrib.layers.xavier_initializer())

# 卷積核
kernel = tf.get_variable(name='a',shape=[3, 3, 3, 64], dtype=tf.float32,
                                  initializer=tf.contrib.layers.xavier_initializer())



def __get_deconv_filter(f_shape):
    """
    Compute bilinear filter and return it
    """
    filt_width = f_shape[0]  #計算kernel的寬
    filt_height = f_shape[1] #計算kernel的長
    half_width = ceil(filt_width /2.0)
    center = (2 * half_width - 1 - half_width % 2) / (2.0 * half_width) # 計算某點的權值  對這個點進行插值
    bilinear = np.zeros([filt_width, filt_height])
    for x in range(filt_width):
        for y in range(filt_height):
            value = (1 - abs(x / half_width - center)) * (1 - abs(y / half_width - center))
            bilinear[x, y] = value
    weights = np.zeros(f_shape)
    for i in range(f_shape[2]):
        weights[:, :, i, i] = bilinear
        print(weights[:, :, i, i])



    init = tf.constant_initializer(value=weights,
                                   dtype=tf.float32)
    return  init



# 反捲積核
kernel2 = tf.get_variable(name='a1',shape=[3, 3, 3, 64], dtype=tf.float32,
                                  initializer=__get_deconv_filter([3,3,3,64]))

#tf.nn.conv2d(input=input_op, filter=weights, strides=[1, dh, dw, 1], padding="SAME")

# 卷積
conv1 = tf.nn.conv2d(input=img, filter=kernel,strides=[1, 1, 1, 1], padding="SAME")
# print(conv1)
# 池化
pool = tf.nn.max_pool(conv1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding="SAME")

shape_ = pool.get_shape().as_list()
print(shape_) #[1, 375, 250, 64]
output_shape = [shape_[0], shape_[1] * 2, shape_[2] * 2, 3]

print('pool:',pool.get_shape())
# 反捲積操作
conts = tf.nn.conv2d_transpose(pool,kernel2,output_shape,strides=[1,2,2,1],padding='SAME')

# print(conv1.get_shape())

a = tf.transpose(conts, [0, 3, 1, 2])

b = tf.transpose(tf.squeeze(a) , [1,2,0])

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())

    # conv1_convert = sess.run(tf.transpose(conts, [0, 3, 1, 2]))



    # fig6, ax6 = plt.subplots(nrows=3, ncols=8, figsize=(8, 8))
    # plt.title('Pool2 32x7x7')
    # for i in range(8):
    #     for j in range(8):
    #         ax6[i][j].imshow(conv1_convert[0][(i + 1) * j])

    # plt.show()

    plt.imshow(sess.run(b))

    plt.show()

反捲積與反捲積核的初始化問題

導論： https://blog.csdn.net/qq_30638831/article/details/81532892 https://cv-tricks.com/image-segmentation/transpose-convolution-in-tensor

空洞卷積與反捲積

空洞卷積（dilated conv），也稱擴張卷積。空洞卷積可以在kernel有效增大感受野的同時不增加模型引數或者計算量。在影象需要全域性資訊或者語音文字需要較長的sequence資訊依賴的問題中，都能較好的應用空洞卷積。在影象分割，語音合成WaveNet，機器翻譯ByteNet中都有

卷積與反捲積步長（stride）與重疊（overlap）及 output 的大小

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

卷積神經網路CNN（1）——影象卷積與反捲積（後卷積，轉置卷積）

1.前言傳統的CNN網路只能給出影象的LABLE，但是在很多情況下需要對識別的物體進行分割實現end to end，然後FCN出現了，給物體分割提供了一個非常重要的解決思路，其核心就是卷積與反捲積，所以這裡就詳細解釋卷積與反捲積。對於1維的卷積，公式（離散

深度學習中的卷積與反捲積

卷積與反捲積操作在影象分類、影象分割、影象生成、邊緣檢測等領域都有很重要的作用。為了講明白這兩種操作，特別是反捲積操作，本文將依照神經網路中的編碼器——>解碼器——>卷積——>反捲積的思路來一步步介紹。編碼器與解碼器神經網路本質

深度學習---影象卷積與反捲積（最完美的解釋）

動態圖1.前言傳統的CNN網路只能給出影象的LABLE，但是在很多情況下需要對識別的物體進行分割實現end to end，然後FCN出現了，給物體分割提供了一個非常重要的解決思路，其核心就是卷積與反捲積，所以這裡就詳細解釋卷積與反捲積。對於1維的卷積，公式（離散

卷積與反捲積詳解

下面是暑期報告PPT的一個截圖展示，是對於卷積與反捲積的具體理解，標題如下：首先先從一維的離散形式出發，可以類比於訊號處理中的德爾塔函式。這裡說明的是訊號系統的線性不變形，即經過作用函式以後，線性不變，位移不變。把線性不變性質與位移不變性質（又可以理解

卷積與反捲積的理解

在文章: Fully Convolutional Networks for Semantic Segmentation 網址:https://arxiv.org/abs/1411.4038 中有下面的一段話: 3.3. Upsampling is bac

Matlab卷積與反傅立葉變換的問題

為什麼兩個二維的矩陣的卷積結果卻不等於他們傅立葉變換後乘積的傅立葉逆變換呢？理論上是相等的，用一維矩陣驗證是相等的啊困惑？望高手賜教！謝謝！使用“時域卷積與頻域相乘等效為傅立葉變換對”的結論需要注意兩個條件：1）卷積為圓周卷積，而不是線性卷積；2）頻域相乘為點乘。matlab中的conv以及conv2函式都是

一維訊號卷積與影象卷積的區別

基礎概念：　　卷積神經網路（CNN）：屬於人工神經網路的一種，它的權值共享的網路結構顯著降低了模型的複雜度，減少了權值的數量。卷積神經網路不像傳統的識別演算法一樣，需要對資料進行特徵提取和資料重建，可以直接將圖片作為網路的輸入，自動提取特徵，並且對圖形的變形等具有高度不變形。在語音分析和影象識

【 MATLAB 】z 變換中的卷積與解卷積

關於卷積的博文，之前也寫過幾篇：今天在z變換的應用場景中再寫一篇，另外加上另外一個知識點解卷積deconv。 z變換的卷積性質為：例題1：設求： cl

matlab驗證線性卷積與圓周卷積的關係

數字訊號處理實驗一.線性卷積和圓周卷積的關係 1.線性卷積　　　設X1為N1點的有限長序列，X2為N2點的有限長序列（0 < n < N2）　　　則兩序

線性卷積與圓周卷積

1.圓周卷積（circular convolution）圓周卷積，也叫迴圈卷積，兩個長度為N的有限場序列x(n)x(n)和h(n)h(n)的迴圈卷積定義為即迴圈卷積相當於週期延拓後的序列x˜(n)x~(n)和h˜(n)h~(n)做週期卷積後再取主

Tensorflow不定長卷積與解卷積

Tensorflow不定長卷積與解卷積在用CNN處理某些影象或時序輸入時，需要考慮輸入長度不固定的情況。例如在做場景文字識別時，輸入的影象是已經被檢測出來的長方形的包含文字的影象，這些 “檢測框” 的長度不一。一般有兩種做法，第一種從資料下手，將輸入 padding 或 resiz

卷積與圓周卷積

matlab中fft函式是對序列做DFT，第二個引數是取樣點的數量，當預設時，預設為輸入訊號序列的長度；當大於訊號序列的長度時候，對輸入序列後面補零計算，頻域訊號的解析度因此而變細，但是這時候的解析度是偽解析度。設定訊號序列s1，length（s1） = 9 s1

影象處理中的valid卷積與same卷積

#valid卷積在full卷積的卷積過程中，會遇到$K_{flip}$靠近I的邊界（K矩陣與I矩陣），就會有部分延申到I之外，這時候忽略邊界，只考慮I*完全*覆蓋$K_{flip}$內的值情況,這個的過程就是valid卷積。一個高為H1，寬為W1的矩陣I與高為H2,寬為W2的矩陣K,在H1大於等於H2，W1

Chapter5_初始化與清理_數組初始化與可變參數列表

object 包裝可視化使用 first ble 對象 log 方式一、數組初始化　　數組是相同類型的，用一個標識符名稱封裝到一起的一個對象序列或基本類型數據序列。編譯器是不允許指定數組的長度的，當使用語句int[] a時，擁有的只是一個符號名，即一個數組的引用，並

Quartz與Spring整合—— SchedulerFactoryBean的初始化分析

前言 Quartz是一個開源的定時排程框架，支援叢集部署。我們可以通過其Java API來使用它，或者通過Spring來配置與管理，也可以結合使用兩種方式。本文重點分析Quartz2.2.3與Spring4.3.0.RELEASE整合時的初始化過程。SchedulerFact

java靜態資料與非靜態資料的初始化

靜態資料列印結果當StaticInitialization執行的時候，首先會載入static Table table = new Table();static Cupboard cupboard = new Cupboard();當執行new Table()的時候，他就

JAVA final 、super 關鍵字以及繼承關係中父類與子類例項變數初始化的理解

1，final 修飾符修飾變數、方法、類時有什麼作用？ ①final 修飾變數：該變數被賦初值後，不能對它重新賦值 ②final 修飾方法：此方法不能重寫，即父類中某方法被final修飾，在子類中將不能定義一個與父類final 方法同名且有相同方法識別符號(引數個數也相同

反捲積與反捲積核的初始化問題

相關推薦