Pytorch實現PointNet中的點雲分類網路。

阿新 • • 發佈：2018-11-21

下面是PointNet論文中分類模型的結構：

但是對於模型的細節，PointNet論文中並沒有詳細的解釋，尤其是T-Net，可以參考PointNet的supplemental部分。如果找不到，可以留言找我要。

話不多說，下面是程式碼，基本上完全還原了論文中的PointNet分類模型。

第一部分：資料處理模組

import h5py
import torch
from torch.utils.data import Dataset
from torch.utils.data import DataLoader
main_path="E:/DataSets/shapenet_part_seg_hdf5_data/hdf5_data/"
train_txt_path=main_path+"train_hdf5_file_list.txt"
valid_txt_path=main_path+"val_hdf5_file_list.txt"

def get_data(train=True):
    data_txt_path =train_txt_path if train else valid_txt_path

    with open(data_txt_path, "r") as f:
        txt = f.read()
    clouds_li = []
    labels_li = []
    for file_name in txt.split():
        h5 = h5py.File(main_path + file_name)
        pts = h5["data"].value
        lbl = h5["label"].value
        clouds_li.append(torch.Tensor(pts))
        labels_li.append(torch.Tensor(lbl))
    clouds = torch.cat(clouds_li)
    labels = torch.cat(labels_li)
    return clouds,labels.long().squeeze()

class PointDataSet(Dataset):
    def __init__(self,train=True):

        clouds, labels = get_data(train=train)

        self.x_data=clouds
        self.y_data=labels

        self.lenth=clouds.size(0)
    def __getitem__(self, index):
        return self.x_data[index],self.y_data[index]
    def __len__(self):
        return self.lenth

def get_dataLoader(train=True):
    point_data_set=PointDataSet(train=train)
    data_loader=DataLoader(dataset=point_data_set,batch_size=16,shuffle=train)
    return data_loader

第二部分：模型及其訓練

import torch
import torch.nn as nn
import getData
import datetime
class PointNet(nn.Module):
    def __init__(self,point_num):

        super(PointNet, self).__init__()

        self.inputTransform=nn.Sequential(
            nn.Conv2d(1,64,(1,3)),
            nn.BatchNorm2d(64),
            nn.ReLU(inplace=True),

            nn.Conv2d(64, 128,1),
            nn.BatchNorm2d(128),
            nn.ReLU(inplace=True),

            nn.Conv2d(128, 1024,1),
            nn.BatchNorm2d(1024),
            nn.ReLU(inplace=True),

            nn.MaxPool2d((point_num,1)),
        )
        self.inputFC = nn.Sequential(
            nn.Linear(1024,512),
            nn.ReLU(inplace=True),
            nn.Linear(512, 256),
            nn.ReLU(inplace=True),
            nn.Linear(256,9),
        )
        self.mlp1=nn.Sequential(
            nn.Conv2d(1,64,(1,3)),
            nn.BatchNorm2d(64),
            nn.ReLU(inplace=True),

            nn.Conv2d(64,64,1),
            nn.BatchNorm2d(64),
            nn.ReLU(inplace=True),
        )
        self.featureTransform = nn.Sequential(
            nn.Conv2d(64, 64,1),
            nn.BatchNorm2d(64),
            nn.ReLU(inplace=True),

            nn.Conv2d(64, 128,1),
            nn.BatchNorm2d(128),
            nn.ReLU(inplace=True),

            nn.Conv2d(128, 1024,1),
            nn.BatchNorm2d(1024),
            nn.ReLU(inplace=True),

            nn.MaxPool2d((point_num, 1)),
        )
        self.featureFC=nn.Sequential(
            nn.Linear(1024, 512),
            nn.ReLU(inplace=True),
            nn.Linear(512, 256),
            nn.ReLU(inplace=True),
            nn.Linear(256, 64*64),
        )
        self.mlp2=nn.Sequential(
            nn.Conv2d(64,64,1),
            nn.BatchNorm2d(64),
            nn.ReLU(inplace=True),

            nn.Conv2d(64,128,1),
            nn.BatchNorm2d(128),
            nn.ReLU(inplace=True),

            nn.Conv2d(128, 1024, 1),
            nn.BatchNorm2d(1024),
            nn.ReLU(inplace=True),
        )
        self.fc=nn.Sequential(
            nn.Linear(1024,512),
            nn.ReLU(inplace=True),
            nn.Linear(512,256),
            nn.ReLU(inplace=True),
            #nn.Dropout(p=0.7,inplace=True),對於ShapeNet資料集來說,用dropout反而準確率會降低
            nn.Linear(256,16),
            nn.Softmax(dim=1),
        )
        self.inputFC[4].weight.data=torch.zeros(3*3,256)
        self.inputFC[4].bias.data=torch.eye(3).view(-1)
    def forward(self, x):               #[B, N, XYZ]
        '''
            B:batch_size
            N:point_num
            K:k_classes
            XYZ:input_features
        '''
        batch_size=x.size(0)#batchsize大小
        x=x.unsqueeze(1)                #[B, 1, N, XYZ]

        t_net=self.inputTransform(x)    #[B, 1024, 1,1]
        t_net=t_net.squeeze()           #[B, 1024]
        t_net=self.inputFC(t_net)       #[B, 3*3]
        t_net=t_net.view(batch_size,3,3)#[B, 3, 3]

        x=x.squeeze()                   #[B, N, XYZ]

        x=torch.stack([x_item.mm(t_item) for x_item,t_item in zip(x,t_net)])#[B, N, XYZ]# 因為mm只能二維矩陣之間，故逐個乘再拼起來

        x=x.unsqueeze(1)                #[B, 1, N, XYZ]

        x=self.mlp1(x)                  #[B, 64, N, 1]

        t_net=self.featureTransform(x)  #[B, 1024, 1, 1]
        t_net=t_net.squeeze()           #[B, 1024]
        t_net=self.featureFC(t_net)     #[B, 64*64]
        t_net=t_net.view(batch_size,64,64)#[B, 64, 64]

        x=x.squeeze().permute(0,2,1)    #[B, N, 64]

        x=torch.stack([x_item.mm(t_item)for x_item,t_item in zip(x,t_net)])#[B, N, 64]

        x=x.permute(0,2,1).unsqueeze(-1)#[B, 64, N, 1]

        x=self.mlp2(x)                  #[B, N, 64]

        x,_=torch.max(x,2)              #[B, 1024, 1]

        x=self.fc(x.squeeze())          #[B, K]
        return x

EPOCHES=100
POINT_NUM=2048

train_loader=getData.get_dataLoader(train=True)
test_loader=getData.get_dataLoader(train=False)

net=PointNet(POINT_NUM).cuda()

optimizer=torch.optim.Adam(net.parameters(),weight_decay=0.001)
loss_function=nn.CrossEntropyLoss()

for epoch in range(EPOCHES):
    time_start=datetime.datetime.now()
    net.train()
    for cloud,label in train_loader:
        cloud,label=cloud.cuda(),label.cuda()
        out = net(cloud)
        loss=loss_function(out,label)

        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
    total=0
    net.eval()
    for cloud,label in test_loader:
        cloud,label=cloud.cuda(),label.cuda()
        out=net(cloud)
        _,pre=torch.max(out,1)
        correct=(pre==label).sum()
        total+=correct.item()
    time_end=datetime.datetime.now()
    time_span_str=str((time_end-time_start).seconds)
    print(str(epoch+1)+"迭代期準確率："+ str(total/len(test_loader.dataset))+"耗時"+time_span_str+"S")

#python的強大之處
#acc=sum([(torch.max(net(cloud.cuda()),1)[1]==label.cuda()).sum() for cloud,label in test_loader]).item()/len(test_loader.dataset)

就是上面的配置，對於所使用的ShapeNet資料集，準確度可以達到百分之93以上。如發現什麼問題bug，請留言。

Pytorch實現PointNet中的點雲分類網路。

下面是PointNet論文中分類模型的結構：但是對於模型的細節，PointNet論文中並沒有詳細的解釋，尤其是T-Net，可以參考PointNet的supplemental部分。如果找不到，可以留言找我要。話不多說，下面是程式碼，基本上完全還原了論文中的PointNet分類模型

用PyTorch實現一個卷積神經網路進行影象分類

1. 回顧在進入這一篇部落格的內容之前，我們先確保已經成功安裝好PyTorch，可以參考我之前的一篇部落格“Ubuntu12.04下PyTorch詳細安裝記錄”： http://blog.csdn.net/wblgers1234/article/details/729020161接下來，我們用設計一個簡單

PyTorch實現簡單的圖神經網路

基於PyTorch框架實現圖卷積神經網路專案原始碼參考本人Github. 依賴庫 DGL 0.1.3 PyTorch 0.4.1 networkX 2.2 利用DGL構建圖 # -*- coding: utf-8 -*- """ @Dat

Pytorch實現基於卷積神經網路的面部表情識別(詳細步驟)

文章目錄　　一、專案背景　　二、資料處理　　　　1、標籤與特徵分離　　　　2、資料視覺化　　　　3、訓練集和測試集　　三、模型搭建　　四、模型訓練　　五、完整程式碼一、專案背景資料集cnn_train.csv包含人類面部表情的圖片的label和feature。在這裡，面部表情識別相當於一個分類問題，共有7個

用pytorch實現多層感知機（MLP)（全連線神經網路FC）分類MNIST手寫數字體的識別

1.匯入必備的包 1 import torch 2 import numpy as np 3 from torchvision.datasets import mnist 4 from torch import nn 5 from torch.autograd import Variable 6

java 中使用logback日誌，並實現日誌按天分類壓縮儲存。

以maven專案作為構建工具為例，首先引入使用logback需要的3個依賴，需要注意使用logback是需要引入slf4j-api的，因為logback是基於slf4j的  <dependency> <groupId>ch.qo

java實現快速排序一種常規的，一種是左程雲的方式。

java實現快速排序：一：先來一個常規快排：這個方式就是我們的基準值一直在兩個邊界徘徊，要麼在less的較大邊界，要麼是在more的小邊界，其實就是在居中位置徘徊。 package chapter1; //來一個快排,常規快排 public class QuickSort {

pytorch實現神經網路

import torch import torch.nn as nn import torch.nn.functional as F import inspect import torch.optim as optim ''' 自動求導機制：對一個標量用backward() 會反向計算在計算圖中

CNN分類網路架構演進：從LeNet到Densnet解析及其keras實現

文章轉自：http://www.cnblogs.com/skyfsm/p/8451834.html 卷積神經網路可謂是現在深度學習領域中大紅大紫的網路框架，尤其在計算機視覺領域更是一枝獨秀。CNN從90年代的LeNet開始，21世紀初沉寂了10年，直到12年AlexNet開始又再煥發第二春，從Z

基於Pytorch實現網路視覺化（CS231n assignment3）

這篇部落格主要是對CS231n assignment3中的網路視覺化部分進行整理。我使用的是Pytorch框架完成的整個練習，但是和Tensorflow框架相比只是實現有些不一樣而已，數學原理還是一致的。 &nbs

基於Pytorch的cifar10分類網路模型

Pytorch作為新興的深度學習框架，目前的使用率正在逐步上升。相比TensorFlow，Pytorch的上手難度更低，同時Pytorch支援對圖的動態定義，並且能夠方便的將網路中的tensor格式資料與numpy格式資料進行轉換，使得其對某些特

keras實現多種分類網路的實現

Keras應該是最簡單的一種深度學習框架了,入門非常的簡單. 簡單記錄一下keras實現多種分類網路:如AlexNet、Vgg、ResNet 採用kaggle貓狗大戰的資料作為資料集. 由於AlexNet採用的是LRN標準化,Keras沒有內建函式實現,這裡用batchNormali

TensorFlow之神經網路簡單實現MNIST資料集分類

import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist=input_data.read_data_sets("MNIST_data",one_hot=True) ba

TensorFlow之卷積神經網路(CNN)實現MNIST資料集分類

import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist=input_data.read_data_sets('MNIST_data',one_hot=True) #每

神經網路中反向傳播演算法(backpropagation)的pytorch實現，pytorch教程中的程式碼解讀以及其他一些疑問與解答

pytorch的官網上有一段教程，是使用python的numpy工具實現一個簡單的神經網路的bp演算法。下面先貼上自己的程式碼： import numpy as np N,D_in,H,D_out = 4,10,8,5 x = np.random.randn(N,D_i

keras實現基於vgg16的貓-狗二分類網路

import keras from keras.models import Sequential from keras.layers import Dense,MaxPooling2D,Input,Flatten,Convolution2D,Dropout from kera

使用deepfashion實現自己的第一個分類網路

這個過程主要分為三個步驟：資料預處理資料處理就是把資料按照一定的格式寫出來，以便網路自己去讀取資料 1準備原始資料我的cloth資料一共是四個類別，每個類別有衣服47張，一用是188張圖片，這些大小不一的原始圖片轉換成我們訓練需要的shape。原始資料放在同一個資料夾下面： 2 程式設計實現製

用pytorch實現GAN——mnist（含有全部註釋和網路思想）

#coding=utf-8 import torch.autograd import torch.nn as nn from torch.autograd import Variable from torchvision import transforms from torchvision impo

用pytorch實現預訓練網路的finetune

繼續熟悉pytorch，發現的確比TensorFlow好用，在官網finetune教程的基礎上進行了大幅修改，主要是熟悉了pytorch自帶的Dataset和DataLoader類。 # -*- coding: utf-8 -*- import os, torch, g

利用pytorch實現GAN(生成對抗網路)-MNIST影象-cs231n-assignment3

Generative Adversarial Networks（生成對抗網路） In 2014, Goodfellow et al. presented a method for training generative models called Ge

Pytorch實現PointNet中的點雲分類網路。

相關推薦