1. 程式人生 > >CVPR2018論文筆記(二)PPFNet_Part2

CVPR2018論文筆記(二)PPFNet_Part2

這周主要學習了兩部分內容,分別是論文中圖2的內容和本文對PointNet的介紹。

一、Figure 2.PPFNET

[注]圖片源於論文
圖片源於論文
Figure 2.PPFNET, our inference network, consists of multiple PointNets, each responsible for a local patch. To capture the global context across all local patches, we use a max-pooling aggregation and fusing the output back into the local description. This way we are able to produce stronger and more discriminative local representations.


圖2。PPFNET,我們的推理網路,包括多個PointNet,每個PointNet負責一個區域性補丁(斑塊)。為了在所有區域性補丁中捕獲全域性背景,我們使用一個最大池化操作聚合並將輸出融合回區域性描述中。通過這種方式,我們能夠產生更強和更具判別性的區域性表示。
這張圖重點介紹了什麼是PPFNet,利用一張現場採集的室內點雲圖片,其由多個patch description-Fr組成。整個網路包含多個PointNet,為了通過local patch來捕獲全域性背景,作者採用最大池化操作,並將其輸出融合到各個區域性描述中去,最終獲得更強、更具判別性的區域性表示。
注:加粗部分均為專有名詞。
【max-pooling】
圖片源於網路

https://www.cnblogs.com/yuanshuo98/articles/8898952.html圖片來源。
【MLP】MLP(Multi-Layer Perceptron),即多層感知器,是一種前向結構的人工神經網路,對映一組輸入向量到一組輸出向量。(概念來自baidu百科詞條)

二、PointNet簡介:

PointNet [30] is an inspiring pioneer addressing the issue of consuming point clouds within a network architecture. It is composed of stacking independent MLPs anchored on points up until the last layers where a high dimensional descriptor is synthesized. This descriptor is weak and used in max-pooling in order to aggregate to a global information, which is then fed into task specific losses. Use of the max-pooling function makes the network inconsiderate of the input ordering and that way extends notions of deep learning to point sets. It showed potential on tasks like 3D model classification and segmentation. Yet, local features of PointNet are only suitable for the tasks it targets and are not generic. Moreover, the spatial transformer layer employed can bring only marginal improvement over the basic architectures. It is one aspect of PPFNet to successfully cure these drawbacks for the task of 3D matching. Note, in our work, we use the vanilla version of PointNet.


PointNet[30]是一個鼓舞人心的開拓者解決了獲取包含網路結構的點雲資訊的問題。它由層疊獨立的MLP組成,錨定在點的上方,直到合成高維描述符的最後一層。這個描述符很脆弱,被用於max-pooling中,以便聚合一個全域性資訊,這個描述符接著被饋送到任務的特定損失中。使用max-pooling函式使得網路不考慮輸入順序,並且這種方式將深度學習的概念擴充套件到點集中。它顯示了在三維模型分類和分割等任務中的潛力。然而,PointNet的區域性特徵僅適用於它所指定的任務而不是通用的。此外,所採用的空間變壓器層只能帶來基本架構上的邊緣改善。PPFNET的一個方面是成功地解決了3D匹配任務的這些缺點。注意,在我們的工作中,我們使用了普通版本的PointNet。
簡要介紹了什麼是PointNet,這部分內容尚未完全理解。後續還需更深入瞭解相關知識。