機器學習：利用卷積神經網路實現影象風格遷移 (一)

阿新 • • 發佈：2019-01-04

相信很多人都對之前大名鼎鼎的 Prisma 早有耳聞，Prisma 能夠將一張普通的影象轉換成各種藝術風格的影象，今天，我們將要介紹一下Prisma 這款軟體背後的演算法原理。就是發表於 2016 CVPR 一篇文章，

“ Image Style Transfer Using Convolutional Neural Networks”

演算法的流程圖主要如下：

這裡寫圖片描述

總得來說，就是利用一個訓練好的卷積神經網路 VGG-19，這個網路在ImageNet 上已經訓練過了。

給定一張風格影象 a 和一張普通影象 p，風格影象經過VGG-19 的時候在每個卷積層會得到很多 feature maps, 這些feature maps 組成一個集合 A

，同樣的，普通影象 p 通過 VGG-19 的時候也會得到很多 feature maps，這些feature maps 組成一個集合 P，然後生成一張隨機噪聲影象 x, 隨機噪聲影象 x 通過VGG-19 的時候也會生成很多feature maps，這些 feature maps 構成集合 G 和 F 分別對應集合 A 和 P, 最終的優化函式是希望調整 x 讓隨機噪聲影象 x 最後看起來既保持普通影象 p 的內容, 又有一定的風格影象 a 的風格。

content representation

在建立目標函式之前，我們需要先給出一些定義: 在CNN 中, 假設某一 layer 含有 N

l 個 filters, 那麼將會生成 Nl 個 feature maps，每個 feature map 的維度為 Ml , Ml 是 feature map 的高與寬的乘積。所以每一層 feature maps 的集合可以表示為 Fl∈RNl×Ml , Flij 表示第 i個 filter在 position j 上的 activation。

所以，我們可以給出 content 的 cost function:

Lcontent(p,x,l)=12∑ij(Flij−Plij)

style representation

為了建立風格的representation，我們先利用 Gram matrix 去表示每一層各個 feature maps 之間的關係，G

l∈RNl×Nl , Glij 是 feature maps i,j 的內積：

Glij=∑kFlikFljk

利用 Gram matrix，我們可以建立每一層的關於 style 的 cost :

El=14N2lM2l∑i,j(Glij−Alij)2

結合所有層，可以得到總的cost

Lstyle(a,x)=∑l=0LwlEl

最後將 content 和 style 的 cost 相結合，最終可以得到:

Ltotal(p,a,x)=αLcontent(p,x)+βLstyle(a,x)

α,β 表示權值，在建立 Lcontent 的時候，用到了 VGG-19 的 conv4_2 層，而在建立 Lstyle 的時候，用到了VGG-19 的 conv1_1, conv2_1, conv3_1, conv4_1 以及 conv5_1。

下一篇部落格裡，我們將介紹基於 TensorFlow 的程式碼實現。

機器學習：利用卷積神經網路實現影象風格遷移 (一)

content representation

style representation

機器學習：利用卷積神經網路實現影象風格遷移 (一)

深度學習入門——利用卷積神經網路實現MNIST手寫數字識別

Tensorflow學習教程------利用卷積神經網路對mnist資料集進行分類_利用訓練好的模型進行分類

深度學習入門——利用卷積神經網路訓練CIFAR—10資料集

機器學習演算法篇--卷積神經網路基礎（Convolutional Neural Network）

機器學習總結之卷積神經網路一些點

寫給程式設計師的機器學習入門 (八) - 卷積神經網路 (CNN) - 圖片分類和驗證碼識別

Tensorflow學習筆記(五)——卷積神經網路實現

【深度學習系列】卷積神經網路CNN原理詳解(一)——基本原理

Tensorflow2.0——利用卷積神經網路實現簡單的驗證碼識別

基於卷積神經網路實現圖片風格的遷移 3

基於卷積神經網路實現圖片風格的遷移 2

基於卷積神經網路實現圖片風格的遷移 1

深度學習：tensorflow入門：卷積神經網路實現MNIST手寫字型識別

【深度學習】8：CNN卷積神經網路與sklearn資料集實現數字識別

tensorflow 學習專欄（六）：使用卷積神經網路（CNN）在mnist資料集上實現分類

【深度學習】5：CNN卷積神經網路原理、識別MNIST資料集

深度學習：卷積神經網路與影象識別基本概念

論文學習-系統評估卷積神經網路各項超引數設計的影響-Systematic evaluation of CNN advances on the ImageNet

【基於tensorflow的學習】經典卷積神經網路、模型的儲存和讀取

機器學習：利用卷積神經網路實現影象風格遷移 (一)

content representation

style representation

相關推薦