3D【5】人臉重建:Learning the Multilinear Structure of Visual Data閱讀筆記

阿新 • • 發佈：2019-02-11

該論文主要內容是使用張量分解來表徵一個3D人臉，如下公式：
這裡寫圖片描述

其中 $B_{(1)}$ 是通過大量資料學習出來的，而 $A^{(m)}$ 則是重構出 $X$ 的係數， $⊙$ 是克羅內克積。

克羅內克積：一個3×1的向量和一個4×1的向量進行克羅內克積，會得到12×1的向量。具體的可參考wiki。

每個 $A^{(m)}$ 可以表示不同的大分類，比如光照，表情等。論文中的一個例子：
這裡寫圖片描述
$L, E, C$ 分別表示光照，表情和身份。

通過優化下面的損失函式，可以學習出B和 $A^{(m)}$ 。
這裡寫圖片描述

但由於上式中有B和 $A^{(m)}$ 都雪要求解，會比較困難。論文使用了迭代最小二乘法，先固定 $A^{(m)}$

A^{(m)}

求B，然後固定B求

A^{(m)}

：

詳細的求解過程可參考論文。

最近要用CNN來直接預測出mesh，而用CNN預測mesh的最大問題是網路的輸出。看過的論文，一般是用兩種方法：1、預測3DMM的係數；2、將mesh立方體化變成一個200×200×200（不一定是這個維度）。但這兩個方法都有各自的不足，方法一：嚴重依賴PCA；方法二：生成的頂點格式不固定。剛好看到有一篇論文是利用該論文的思想，所以就閱讀一下該論文。

經過大致的閱讀後（沒有詳細看B和 $A^{(m)}$ 求解過程），用CNN預測 $A^{(m)}$ ，與用CNN預測3DMM的係數效果估計差不多。先記錄一下，可能以後會嘗試。

3D【5】人臉重建:Learning the Multilinear Structure of Visual Data閱讀筆記

該論文主要內容是使用張量分解來表徵一個3D人臉，如下公式：其中B(1)B(1) 是通過大量資料學習出來的，而A(m)A(m) 則是重構出 XX 的係數，⊙⊙ 是克羅內克積。克羅內克積：一個3×1的向量和一個4×1的向量進行克羅內克積，會得到12×1

3D【4】人臉重建:Large Pose 3D Face Reconstruction from a Single Image via Direct Volumetric

該論文主要是用CNN直接重建3D人臉，而不是預測3DMM模型的引數，網路結構是漏斗網路（ HG）。論文提出了三種方案，第一種是直接從圖片重建，第二種是加入了人臉特徵點，第三種是多工（重建+人臉特徵點預測）。效果最好的是第二種方法。值得注意的是，該論文不是直

3D【9】人臉重建:Joint3D Face Reconstruction and Dense Alignment with Position Map Regression

該論文同時預測人臉特徵點和3D mesh的頂點座標x，y，z。人臉特徵點沒什麼好說的，現在已經有很多成功的案例了。主要關注該論文是如何預測頂點座標的。其實大概想想，就能夠大致確定直接預測頂點座標是有不少困難的。首先是，你不能把所有的頂點拉成一個向量，用全連線層預

3D【3】人臉重建:Image Based 3D Face Reconstruction: A Survey閱讀筆記

該論文是09年的一篇3D人臉重建綜述文章。目前的大部分3D人臉重建系統受限於3d掃描裝置的一些不足： 1、在掃描過程中要求一定的光線條件 2、無法從多個物體同時獲取3D資料 3、沒有反射的區域無法獲得正確資料（如頭髮） 4、無法實時 5、如果是鐳射

【15】ES6 for Humans: The Latest Standard of JavaScript: ES2015 and Beyond

amazon idt keywords order line padding star ise spa 【15】ES6 for Humans共148頁：目前看到：已經全部閱讀。亞馬遜地址：魔芋：總結：我先看的是阮一峰的在線書籍。這本書的內容很多都與之重復的。居然賣￥463

The Multilinear Structure of ReLU Networks

線性 display near 內部所有 lin 結果 truct -a 兩種非常常見的非線性單元：rectified linear units (ReLUs) 和 leaky ReLUs 我們選取binary hinge loss進行二分類對於多分類

【5】JVM-垃圾收集器

garbage 垃圾收集器發展 access 表示新生代動態導致 ren 通過學習了解到現在商用的JVM中的垃圾收集采用的是分代收集算法，即針對不同年代采用不同的收集算法。在JVM中，GC主要作用於堆內存中，堆內存又被劃分為新生代和老年代，由於新生代對象絕大多數是朝

Android自己定義組件系列【5】——進階實踐（2）

col fonts tle 適配 pack tom ica void log 上一篇《Android自己定義組件系列【5】——進階實踐（1）》中對任老師的《可下拉的PinnedHeaderExpandableListView的實現》前一部分進行了實現，這一篇我們來看看Ex

【5】基本字符串壓縮

stringbu 字符串 n) nbsp ret map ++ clas ipp 【題目】利用字符重復出現的次數，編寫一個方法，實現基本的字符串壓縮功能。比如，字符串“aabcccccaaa”經壓縮會變成“a2b1c5a3”。若壓縮後的字符串沒有變短，則返回原先的字符串

感悟【5】

基本上項目組人在機會朋友圈都是那不 nbsp 說了開微博呢，一方面是記錄自己的學習歷程，另一方面呢是可以說自己想說的話，自己的感受，這些話很想發在朋友圈，但是怕給別人帶去負面影響所以在朋友圈一般都不會發一些傷感的話，一個人在這個行業沒有人帶，都靠自己學習，

【5】標題上的小logo

-- span pan shortcut color font nbsp 圖片 logo <link rel="shortcut icon" href="logo圖片的路徑"> shortcut --- 捷徑，近路 icon --- 圖標【5】標題上的小lo

【BZOJ】1537: [POI2005]Aut- The Bus

spl read zoj return 觀察 cst isp algo ins 【算法】DP+線段樹求區間max（二維偏序）【題解】狀態轉移方程：f[i]=max(f[j]+v[i]),x[j]<x[i]&&y[j]<y[i]。觀察j的條件

線性代數-矩陣-【5】矩陣化簡 C和C++實現

tar tput c++ spec 但是 exc c++語言 emp opened 點擊這裏可以跳轉至【1】矩陣匯總：http://www.cnblogs.com/HongYi-Liang/p/7287369.html 【2】矩陣生成：http://www.cnblog

【5】GDI+ 生成驗證碼

splay 小應用 eric gen 前景 num 微軟 param graphic 這裏我們做一個小應用，就是繪制一個如下圖所示的驗證碼圖片。並且點擊驗證碼的時候會自動切換。實現思路如下：通過Random生成隨機數或字符及驗證碼通過驗證碼內容長度生成指定大小的圖

【DATE2017】Double MAC: Doubling the Performance of Convolutional Neural Networks on Modern FPGAs

-1 資源 font 文章討論要點兩個需要分享這篇文章介紹了如何利用FPGA內部單個DSP來實現SIMD乘法，從而提高DSP利用率，緩解計算資源不足的問題，是一個比較實用的trick。要點：利用單個DSP並行實現兩次乘法：A*C、B*C；文中只討論了A、

Fiddler抓包【5】_Fiddler過濾

cts type request 抓包 .cn font show all ces nds 1、User Fiters啟用 2、Action Action：Run Filterset now是否運行，Load Filterset加載，Save Filterset保存；

【bzoj1592】[Usaco2008 Feb]Making the Grade 路面修整

i+1 style 相同 algorithm 由於 color tdi out return FJ打算好好修一下農場中某條凹凸不平的土路。按奶牛們的要求，修好後的路面高度應當單調上升或單調下降，也就是說，高度上升與高度下降的路段不能同時出現在修好的路中。整條路被分成了N

爬蟲入門【5】PyQuery簡介

其他 attr before lxml 移除位置方式 fin .org PyQuery 目前最新的版本是1.3，基於最新版本進行介紹。主要根據PyQuery的官方文檔進行了更新。 from pyquery import PyQuery as pq from lxml

【MySQL】java.sql.SQLException: The server time zone value

wan rac transacti timezone prop 解決 cep enc pass 錯誤：Could not open JDBC Connection for transaction; nested exception is java.sql.SQLExcept

【CF757G】Can Bash Save the Day? 可持久化點分樹

find ons lin 問題 node printf sin 預處理 family 【CF757G】Can Bash Save the Day? 題意：給你一棵n個點的樹和一個排列${p_i}$，邊有邊權。有q個操作： 1 l r x：詢問$\sum\limits_{

3D【5】人臉重建:Learning the Multilinear Structure of Visual Data閱讀筆記

相關推薦