MTCNN 人臉檢測論文解讀，及tensorflow程式碼實現

MTCNN簡介

《Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks》論文解讀。
相比於R-CNN系列通用檢測方法，本文更加針對人臉檢測這一專門的任務，速度和精度都有足夠的提升。R-CNN，Fast R-CNN，FasterR-CNN這一系列的方法不是一篇部落格能講清楚的，有興趣可以找相關論文閱讀。類似於TCDCN，本文提出了一種Multi-task的人臉檢測框架，將人臉檢測和人臉特徵點檢測同時進行。論文使用3個CNN級聯的方式，和Viola-Jones類似，實現了coarse-to-fine的演算法結構。

MTCNN主要包括三個部分,PNet,RNet,ONet
其中PNet在訓練階段的輸入尺寸為12*12,RNet的輸入尺寸為24*24, ONet的輸入尺寸為48*48.　 PNet網路引數最小，ceffemodel僅有28.2KB, 所以速度最快.RNet的網路引數次之，caffemodel大小為407.9KB, ONet的caffemodel大小為1.6M,三個網絡合起來不到2M.

訓練階段

訓練資料生成

該演算法訓練資料來源於wider和celeba兩個公開的資料庫，wider提供人臉檢測資料，在大圖上標註了人臉框groundtruth的座標資訊，celeba提供了5個landmark點的資料。根據參與任務的不同，將訓練資料分為四類：人臉正樣本（positives）、非人臉負樣本（negatives）、部分臉（partfaces）、關鍵點（landmark）。positives、negatives、partfaces由隨機取的框與groundtruth的overlap區域比例的大小決定，大於0.65為positives，小於0.3為negatives，0.4到0.65之間為partfaces。positives和negatives參與到分類任務，positives和partfaces參與到迴歸任務，landmark資料參與到關鍵點回歸任務。關鍵點回歸僅在第三個net中實用，此時landmark資料的人臉框位置可由前兩個net的模型檢測得到，或是由landmark的座標位置擬合出來。在每個batchSize中的樣本比例如下，positives：negatives：partfaces：landmark = 1 ： 3 ： 1 ： 2。到此為止，資料的來源組成我們都交代完畢，但是如何生成訓練資料呢，這也是很多MTCNN的擁簇者希望能開源訓練程式碼。本文以caffe為例，採用hdf5資料格式，先由指令碼隨機在wider上擷取positives、negatives、partfaces，注意要覆蓋到不同尺度的，負樣本的量級達到2000w左右（該文作者透露）。之所以採用hdf5的資料格式，是考慮到能夠方便的實現多label，以前兩個net為例，筆者採用的label為7為，分別是 f1 c1 f2 dx1 dy1 dx2 dy2，f1和f2是標記位，f1標記該樣本是否參與分類，f2標記該樣本是否參與迴歸，f1和f2後面緊跟的是真實的label資訊，c1是樣本類別，dx dy是偏移量。與此對應的是，筆者自己實現了帶標誌位的softmax和euclidean loss

正負樣本，部分樣本提取：

從Wider_face隨機選出邊框，然後和標註資料計算IOU，如果大於0.65，則為正樣本，大於0.4小於0.65為部分樣本，小於0.4為負樣本．
計算邊框偏移．對於邊框，(x1,y1)為左上角座標，(x2,y2)為右下角座標，新剪裁的邊框座標為(xn1,yn1),(xn2,yn2),width,height．則offset_x1 = (x1 - xn1)/width,同上，計算另三個點的座標偏移．
對於正樣本，部分樣本均有邊框資訊，而對於負樣本不需要邊框資訊

關鍵點樣本提取

從celeba中提取，可以根據標註的邊框，在滿足正樣本的要求下，隨機裁剪出圖片，然後調整關鍵點的座標．

# 
生成positive,negative,part樣本

import sys
sys.path.append('D:\\Anaconda2\\libs')    # 在windows系統上，匯入python庫目錄
import numpy as np
import cv2
import os
import numpy.random as npr
from utils import IoU

# stdsize：隨機crop的視窗大小，positive,negative,part樣本都對應此大小
stdsize = 48    
anno_file = "E:/face_alignment/data/CelebA/Anno/mtcnn_train_label_2.txt"
im_dir = "E:/face_alignment/data/CelebA/Img/img_celeba.7z/img_celeba/"
pos_save_dir = str(stdsize) + "/positive"
part_save_dir = str(stdsize) + "/part"
neg_save_dir = str(stdsize) + '/negative'
save_dir = "./" + str(stdsize)

# 生成資料夾函式
def mkr(dr):
    if not os.path.exists(dr):
        os.mkdir(dr)

mkr(save_dir)
mkr(pos_save_dir)
mkr(part_save_dir)
mkr(neg_save_dir)

# 開啟儲存pos,neg,part檔名、標籤的txt檔案，這三個是生成檔案
f1 = open(os.path.join(save_dir, 'pos_' + str(stdsize) + '.txt'), 'w')
f2 = open(os.path.join(save_dir, 'neg_' + str(stdsize) + '.txt'), 'w')
f3 = open(os.path.join(save_dir, 'part_' + str(stdsize) + '.txt'), 'w')
# 開啟原始圖片標註txt檔案
with open(anno_file, 'r') as f:
    annotations = f.readlines()
num = len(annotations)
print "%d pics in total" % num
p_idx = 0 # positive
n_idx = 0 # negative
d_idx = 0 # part
idx = 0
box_idx = 0

# 原始圖片根據標註的bbox，生成negative,posotive,part圖片，標註形式也做相應變化
for annotation in annotations:    #逐行讀取，按作者的方式，每行為一個原圖
    annotation = annotation.strip().split(' ')    #對讀取的每一行，按空格進行切片
    im_path = annotation[0]    # 第1個為圖片名
    bbox = map(float, annotation[1:-10]) #第2個~~倒數第11個為bbox
    # pts = map(float, annotation[5:])
    pts = map(float, annotation[-10:])  #倒數第10個~~倒數第1個為landmark
	# 對bbox進行reshape，4個一列
    boxes = np.array(bbox, dtype=np.float32).reshape(-1, 4) 
    im_path = im_dir + im_path  #圖片地址拼接
    img = cv2.imread(im_path)  #讀取圖片
    idx += 1
    if idx % 100 == 0:
        print idx, "images done"

    height, width, channel = img.shape

    neg_num = 0
	# 生成nagative，每個原圖生成100個negative sample
    while neg_num < 100:
	    # size表示neg樣本大小，在40和min(width, height)/2之間隨機取一個整數
        size = npr.randint(40, min(width, height) / 2)
		# neg的左上角座標(x1,y1)，在0和(width - size)之間隨機取一個整數
        nx = npr.randint(0, width - size)
        ny = npr.randint(0, height - size)
        # 隨機生成的bbox位置(x1,y1),(x2,y2)
        crop_box = np.array([nx, ny, nx + size, ny + size])

		# 計算隨機生成的bbox和原圖中所有標註bboxs的交併比
        Iou = IoU(crop_box, boxes)

		# 在原圖中crop對應的區域圖片，作為negative sample
        cropped_im = img[ny : ny + size, nx : nx + size, :]
		# 對crop的影象進行resize，大小為stdsize*stdsize
        resized_im = cv2.resize(cropped_im, (stdsize, stdsize), interpolation=cv2.INTER_LINEAR)

		# 如果crop_box與所有boxes的Iou都小於0.3，那麼認為它是nagative sample
        if np.max(Iou) < 0.3:
            # Iou with all gts must below 0.3
			# 儲存圖片的地址和圖片名
            save_file = os.path.join(neg_save_dir, "%s.jpg"%n_idx)
			# 往neg_48.txt檔案中寫入該negative樣本的圖片地址和名字，分類標籤
            f2.write(str(stdsize)+"/negative/%s"%n_idx + ' 0\n')
			# 儲存該負樣本圖片
            cv2.imwrite(save_file, resized_im)
            n_idx += 1
            neg_num += 1

    backupPts = pts[:]  # 該列表用於landmark      
    for box in boxes:  #逐行讀取，每次迴圈處理一個box
        # box (x_left, y_top, x_right, y_bottom)
        x1, y1, x2, y2 = box
        w = x2 - x1 + 1
        h = y2 - y1 + 1

        # 忽略小臉
        # in case the ground truth boxes of small faces are not accurate
        if max(w, h) < 12 or x1 < 0 or y1 < 0:
            continue

        # 生成 positive examples and part faces
		# 每個box隨機生成50個box，Iou>=0.65的作為positive examples，0.4<=Iou<0.65的作為part faces，其他忽略
        for i in range(50):
            pts = backupPts[:]
			# size表示隨機生成樣本的大小，在int(min(w, h) * 0.8) 和 np.ceil(1.25 * max(w, h)) 之間
            size = npr.randint(int(min(w, h) * 0.8), np.ceil(1.25 * max(w, h)))

            # delta 表示相對於標註box center的偏移量
            delta_x = npr.randint(-w * 0.2, w * 0.2)
            delta_y = npr.randint(-h * 0.2, h * 0.2)

			# nx,ny表示偏移後的box座標位置
            nx1 = max(x1 + w / 2 + delta_x - size / 2, 0)
            ny1 = max(y1 + h / 2 + delta_y - size / 2, 0)
            nx2 = nx1 + size
            ny2 = ny1 + size

			# 去掉超出原圖的box
            if nx2 > width or ny2 > height:
                continue
            crop_box = np.array([nx1, ny1, nx2, ny2])
			
            #bbox偏移量的計算，由 x1 = nx1 + float(size)*offset_x1 推導而來，可以參考bounding box regression部落格 
            offset_x1 = (x1 - nx1) / float(size)
            offset_y1 = (y1 - ny1) / float(size)
            offset_x2 = (x2 - nx1) / float(size)
            offset_y2 = (y2 - ny1) / float(size)

			# landmark偏移量的計算，即landmark相對於隨機生成bbox的歸一化相對位置。
            for k in range(len(pts) / 2):
                pts[k*2] = (pts[k*2] - nx1) / float(size);
                pts[k*2+1] = (pts[k*2+1] - ny1) / float(size);

            cropped_im = img[int(ny1) : int(ny2), int(nx1) : int(nx2), :]
            resized_im = cv2.resize(cropped_im, (stdsize, stdsize), interpolation=cv2.INTER_LINEAR)

			# 將box reshape為一行
            box_ = box.reshape(1, -1)
			# Iou>=0.65的作為positive examples
            if IoU(crop_box, box_) >= 0.65:
                save_file = os.path.join(pos_save_dir, "%s.jpg"%p_idx)
				# 將圖片路徑，類別，偏移量寫入到positive_48.txt檔案中
                f1.write(str(stdsize)+"/positive/%s"%p_idx + ' 1 %f %f %f %f'%(offset_x1, offset_y1, offset_x2, offset_y2))
				
				# 將landmark寫入到positive_48.txt檔案中
                for k in range(len(pts)):
                    f1.write(" %f" % pts[k])
                f1.write("\n")
                cv2.imwrite(save_file, resized_im)
                p_idx += 1
				
			# 0.4<=Iou<0.65的作為part faces
            elif IoU(crop_box, box_) >= 0.4:
                save_file = os.path.join(part_save_dir, "%s.jpg"%d_idx)
                f3.write(str(stdsize)+"/part/%s"%d_idx + ' -1 %f %f %f %f'%(offset_x1, offset_y1, offset_x2, offset_y2))

                for k in range(len(pts)):
                    f3.write(" %f" % pts[k])
                f3.write("\n")
                cv2.imwrite(save_file, resized_im)
                d_idx += 1

        box_idx += 1
        print "%s images done, pos: %s part: %s neg: %s"%(idx, p_idx, d_idx, n_idx)

f1.close()
f2.close()
f3.close()

網路結構

三個net的網路結構如上圖所示，注意pnet是全卷積的結構，不包含fc層。筆者在訓練pnet和rnet的時候，並沒有加入landmark迴歸的任務，分類和人臉框迴歸的loss_weight之比為1：0.5，onet加入landmark迴歸，分類、人臉框迴歸和關鍵點回歸的loss_weight之比為1：0.5：0.5。

訓練主要包括三個任務

人臉分類任務：利用正樣本和負樣本進行訓練
人臉邊框迴歸任務：利用正樣本和部分樣本進行訓練
關鍵點檢測任務：利用關鍵點樣本進行訓練

代價函式

loss修改由於訓練過程中需要同時計算３個loss,但是對於不同的任務，每個任務需要的loss不同．所有在整理資料中，對於每個圖片進行了15個label的標註資訊

第1列：為正負樣本標誌，１正樣本,0負樣本,2部分樣本,3關鍵點資訊
第2-5列：為邊框偏移，為float型別，對於無邊框資訊的資料，全部置為-1
第6-15列：為關鍵點偏移，為floagt型別，對於無邊框資訊的資料，全部置為-1

修改softmax_loss_layer.cpp　增加判斷，只對於1,0計算loss值修改euclidean_loss_layer.cpp　增加判斷，對於置為-1的不進行loss計算困難樣本選擇論文中作者對與人臉分類任務，採用了線上困難樣本選擇，實現過程如下：修改softmax_loss_layer.cpp，根據計算出的loss值，進行排序，只對於前70%對應的資料，進行反向傳播．

預測階段

TIP:預測可輸入任意大小的圖片（因為P_net是全卷積網路）

Proposal Network (P-Net)：在構建影象金字塔的基礎上，利用fully convolutional network來進行檢測，同時利用boundingbox regression 和 NMS來進行修正。（注意：這裡的全卷積網路與R-CNN裡面帶反捲積的網路是不一樣的，這裡只是指只有卷積層，可以接受任意尺寸的輸入，靠網路stride來自動完成滑窗）

Refine Network (R-Net)：該網路結構還是通過邊界框迴歸和NMS來去掉那些false-positive區域。

只是由於該網路結構和P-Net網路結構有差異，多了一個全連線層，所以會取得更好的抑制false-positive的作用。

Output Network (O-Net)：該層比R-Net層又多了一層卷基層，所以處理的結果會更加精細。作用和R-Net層作用一樣。但是該層對人臉區域進行了更多的監督，同時還會輸出5個地標（landmark）。

IOU概念：

def IoU(box, boxes):
    """Compute IoU between detect box and gt boxes

    Parameters:
    ----------
    box: numpy array , shape (5, ): x1, y1, x2, y2, score
        input box
    boxes: numpy array, shape (n, 4): x1, y1, x2, y2
        input ground truth boxes

    Returns:
    -------
    ovr: numpy.array, shape (n, )
        IoU
    """
    box_area = (box[2] - box[0] + 1) * (box[3] - box[1] + 1)
    area = (boxes[:, 2] - boxes[:, 0] + 1) * (boxes[:, 3] - boxes[:, 1] + 1)
    xx1 = np.maximum(box[0], boxes[:, 0])
    yy1 = np.maximum(box[1], boxes[:, 1])
    xx2 = np.minimum(box[2], boxes[:, 2])
    yy2 = np.minimum(box[3], boxes[:, 3])

    # compute the width and height of the bounding box
    w = np.maximum(0, xx2 - xx1 + 1)
    h = np.maximum(0, yy2 - yy1 + 1)

    inter = w * h
    ovr = inter / (box_area + area - inter)
    return ovr

非極大值抑制(NMS)概念：
RCNN會從一張圖片中找出n個可能是物體的矩形框，然後為每個矩形框為做類別分類概率：

就像上面的圖片一樣，定位一個車輛，最後演算法就找出了一堆的方框，我們需要判別哪些矩形框是沒用的。非極大值抑制的方法是：先假設有6個矩形框，根據分類器的類別分類概率做排序，假設從小到大屬於車輛的概率分別為A、B、C、D、E、F。

從最大概率矩形框F開始，分別判斷A~E與F的重疊度IOU是否大於某個設定的閾值;
假設B、D與F的重疊度超過閾值，那麼就扔掉B、D；並標記第一個矩形框F，是我們保留下來的。
從剩下的矩形框A、C、E中，選擇概率最大的E，然後判斷E與A、C的重疊度，重疊度大於一定的閾值，那麼就扔掉；並標記E是我們保留下來的第二個矩形框。

就這樣一直重複，找到所有被保留下來的矩形框。非極大值抑制（NMS）顧名思義就是抑制不是極大值的元素，搜尋區域性的極大值。這個區域性代表的是一個鄰域，鄰域有兩個引數可變，一是鄰域的維數，二是鄰域的大小。這裡不討論通用的NMS演算法，而是用於在目標檢測中用於提取分數最高的視窗的。例如在行人檢測中，滑動視窗經提取特徵，經分類器分類識別後，每個視窗都會得到一個分數。但是滑動視窗會導致很多視窗與其他視窗存在包含或者大部分交叉的情況。這時就需要用到NMS來選取那些鄰域裡分數最高（是行人的概率最大），並且抑制那些分數低的視窗。

def py_nms(dets, thresh, mode="Union"):
    """
    greedily select boxes with high confidence
    keep boxes overlap <= thresh
    rule out overlap > thresh
    :param dets: [[x1, y1, x2, y2 score]]
    :param thresh: retain overlap <= thresh
    :return: indexes to keep
    """
    x1 = dets[:, 0]
    y1 = dets[:, 1]
    x2 = dets[:, 2]
    y2 = dets[:, 3]
    scores = dets[:, 4]

    areas = (x2 - x1 + 1) * (y2 - y1 + 1)
    order = scores.argsort()[::-1]

    keep = []
    while order.size > 0:
        i = order[0]
        keep.append(i)
        xx1 = np.maximum(x1[i], x1[order[1:]])
        yy1 = np.maximum(y1[i], y1[order[1:]])
        xx2 = np.minimum(x2[i], x2[order[1:]])
        yy2 = np.minimum(y2[i], y2[order[1:]])

        w = np.maximum(0.0, xx2 - xx1 + 1)
        h = np.maximum(0.0, yy2 - yy1 + 1)
        inter = w * h
        if mode == "Union":
            ovr = inter / (areas[i] + areas[order[1:]] - inter)
        elif mode == "Minimum":
            ovr = inter / np.minimum(areas[i], areas[order[1:]])
        #keep
        inds = np.where(ovr <= thresh)[0]
        order = order[inds + 1]

    return keep

預測實現程式碼

class MtcnnDetector(object):


    def __init__(self,
                 detectors,
                 min_face_size=25,
                 stride=2,
                 threshold=[0.6, 0.7, 0.7],
                 scale_factor=0.79,
                 #scale_factor=0.709,#change
                 slide_window=False):

        self.pnet_detector = detectors[0]
        self.rnet_detector = detectors[1]
        self.onet_detector = detectors[2]
        self.min_face_size = min_face_size
        self.stride = stride
        self.thresh = threshold
        self.scale_factor = scale_factor
        self.slide_window = slide_window

    def convert_to_square(self, bbox):
        """
            convert bbox to square
        Parameters:
        ----------
            bbox: numpy array , shape n x 5
                input bbox
        Returns:
 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    MTCNN 人臉檢測論文解讀，及tensorflow程式碼實現
      

MTCNN簡介
《Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks》論文解讀。
相比於R-CNN系列通用檢測方法，本文更加針對人臉檢測這一專門的任務，速度和精度都有足夠的提升。R-CNN， 

  
 

    

    
    深度學習之卷積神經網路CNN及tensorflow程式碼實現示例詳細介紹
      
一、CNN的引入
在人工的全連線神經網路中，每相鄰兩層之間的每個神經元之間都是有邊相連的。當輸入層的特徵維度變得很高時，這時全連線網路需要訓練的引數就會增大很多，計算速度就會變得很慢，例如一張黑白的
28×28
 的手寫數字圖片，輸入層的神經元就有784個，如下圖所示： 






 

  
 

    

    
    深度學習之卷積神經網路CNN及tensorflow程式碼實現示例
      
                

一、CNN的引入

在人工的全連線神經網路中，每相鄰兩層之間的每個神經元之間都是有邊相連的。當輸入層的特徵維度變得很高時，這時全連線網路需要訓練的引數就會增大很多，計算速度就會變得很慢，例如一張黑白的 28×28 的手寫數字圖片，輸入層的神經元就有784個，如下圖 

  
 

    

    
    MTCNN人臉檢測  附完整C++代碼
      若有   文件   nta   return   版本   list   warnings   rtt   task   人臉檢測 識別一直是圖像算法領域一個主流話題。
前年 SeetaFace 開源了人臉識別引擎，一度成為熱門話題。
雖然後來SeetaFace 又放出來 2.0版本，但是，我說但是。。。
沒 

  
 

    

    
    人臉檢測真的不難，50行Python程式碼就能實現人臉檢測
       
 
  
 現在的人臉識別技術已經得到了非常廣泛的應用，支付領域、身份驗證、美顏相機裡都有它的應用。用iPhone的同學們應該對下面的功能比較熟悉 
  
 iPhone的照片中有一個“人物”的功能，能夠將照片裡的人臉識別出來並分類，背後的原理也是人臉識別技術。 
 這篇文章主要介紹怎樣用Python實現 

  
 

    

    
    Mtcnn人臉檢測實踐（一）
      
							
							
							放寒假了，閒來無事就開始搗鼓人臉識別了。這次看了一篇2016年的論文，算是比較新的了。論文提到一種名為“基於多工級聯卷積神經網路進行人臉檢測和對齊”的演算法，英文名 Joint Face Detection and Alignment using Multi-t 

  
 

    

    
    deeplabcv2 的 Atrous Convolution(帶孔卷機核)，感受野，及tensorflow實現crf的一點理解。
      
                
首先是因為做影象分割，所以使用deeplab。思想基本和fcn一樣。先卷機提取特徵，然後闊尺寸至原影象大小。
普通fcn先把影象padding至很大（據說是邊緣補100個0），然後一層層下來，pool （stride＝2）或者是卷機（ stride＝2）5次，影象縮小了32 

  
 

    

    
    人臉檢測真的不難，50行Python代碼就能實現人臉檢測
      sim   apt-get   front   bz2   基於   51cto   美顏   caf   port   Python現在非常火，語法簡單而且功能強大，很多同學都想學Python！所以小的給各位看官們準備了高價值Python學習視頻教程，都放在了文章結尾，歡迎前來領取！
*註意：全文代碼可以滑 

  
 

    

    
    專案實戰 - 原理講解<-> Keras框架搭建Mtcnn人臉檢測平臺
      Mtcnn它是2016年中國科學院深圳研究院提出的用於人臉檢測任務的多工神經網路模型，該模型主要採用了三個級聯的網路，採用候選框加分類器的思想，進行快速高效的人臉檢測。這三個級聯的網路分別是快速生成候選視窗的P-Net、進行高精度候選視窗過濾選擇的R-Net和生成最終邊界框與人臉關鍵點的O-Net。和很多處理 

  
 

    

    
    輪廓檢測論文解讀 | 整體巢狀邊緣檢測HED | CVPR | 2015
      ---
# 主題列表：juejin, github, smartblue, cyanosis, channing-cyan, fancy, hydrogen, condensed-night-purple, greenwillow, v-green, vue-pro, healer-readable
# 貢獻 

  
 

    

    
    輪廓檢測論文解讀 | Richer Convolutional Features for Edge Detection | CVPR | 2017
      有什麼問題可以加作者微信討論，cyx645016617 上千人的粉絲群已經成立，氛圍超好。為大家提供一個遇到問題有可能得到答案的平臺。

## 0 概述
- 論文名稱：“Richer Convolutional Features for Edge Detection”
- 論文連結：https://opena 

  
 

    

    
    用LSTM做時間序列預測的思路,tensorflow程式碼實現及傳入資料格式
       
 
 首先推薦一個對LSTM一些類函式進行說明的部落格: 函式說明 
 我的目標是用LSTM進行某種水果價格的預測,一開始我的做法是,將一種水果前n天的價格作為變數傳入,即這樣傳入的DataFrame格式是有n+1列,結果訓練出來的效果不盡人意,完全比不上之前我用ARIMA時間序列去擬合價格曲線 

  
 

    

    
    利用霍夫變換做直線檢測的原理及OpenCV程式碼實現
      
                

說白了，以直線檢測為例，霍夫變換實際上就是把使每個畫素座標點經過變換都變成都直線特質有貢獻的統一度量(這種度量以我目前的理解與笛卡爾(極坐系)並無區別，即極半徑和極角)，並對轉換後的度量進行累計(可以理解為投票)，當一個波峰出現時候，說明有直線存在。如果要了解更詳細的，大 

  
 

    

    
    迷宮求解  呼叫棧，及遞迴實現
      
							
							
							迷宮求解 
1. 首先要有一張迷宮地圖，地圖由兩部分組成：

（1）一是迷宮中各處的位置座標，

（2）二是迷宮各位置處的狀態資訊，即該處是牆還是路


1）迷宮地圖是6*6的，即二維陣列是6行6列的。（2）在迷宮中用0表示牆，用1表示路 
    給定一個地圖 

  
 

    

    
    利用Canny邊緣檢測運算元進行邊緣檢測的原理及OpenCV程式碼實現
      
                Canny運算元是John Canny在1986年發表的論文中首次提出的邊緣檢測運算元，該運算元檢測效能比較好，應用廣泛。

Canny運算元進行邊緣檢測的原理和步驟如下：

⑴消除噪聲。邊緣檢測的演算法主要是基於影象強度的一階和二階微分操作，但導數通常對噪聲很敏感，邊緣檢測 

  
 

    

    
    VS檢測記憶體洩漏，定位洩漏程式碼位置方法
      
                1、什麼是記憶體洩漏？

記憶體洩漏指的是在程式裡動態申請的記憶體在使用完後，沒有進行釋放，導致這部分記憶體沒有被系統回收，久而久之，可能導致程式記憶體不斷增大，系統記憶體不足……引發一系列災難性後果；（關於程式申請記憶體分配方式，詳見：記憶體分配方式）

2、零容忍

排除 

  
 

    

    
    頁面排程演算法 FIFO，LRU，OPT，及C++程式碼
      
							
							
							頁面排程演算法 FIFO，LRU，OPT

介紹了三種頁面排程演算法，給出了C++程式碼



1.FIFO

先來先去演算法這個非常好理解，給出分析圖 
 
可以看出，缺頁次數為8次，缺頁中斷率為8/12=66.7%，依次置換的頁面為：1,2,5,3,4

C 

  
 

    

    
    影象特徵檢測描述(一):SIFT、SURF、ORB、HOG、LBP特徵的原理概述及OpenCV程式碼實現
      
                什麼叫特徵檢測？就是檢測影象中目標的特徵唄，所謂特徵，不管你怎麼旋轉目標，離目標遠近，它的特徵都應不變才對，這兩個特性稱為叫旋轉不變性和尺度不變性。當然還有其它特徵，如光照不一樣，也不應該變化嘛，只是旋轉不變性和尺度不變性是最基本的兩個要求。

對特徵的描述有很多種方法和運算 

  
 

    

    
    [論文解讀] 阿里DIEN整體程式碼結構
      # [論文解讀] 阿里DIEN整體程式碼結構

[toc]

## 0x00 摘要

DIEN是阿里深度興趣進化網路(Deep Interest Evolution Network)的縮寫。

本文將分析DIEN原始碼整體思路。因為DIEN是在DIN基礎上演化，所以程式碼有大部分重複。

本文采用的是 htt 

  
 

    

    
    python打造特別火的一個小遊戲，16行程式碼實現3D撞球小遊戲！
       
 
 以下是製作上面炫酷動畫所需的全部程式碼： 
   
  
   
   
   
 我們需要三組剛體（當您在Blender的物件上開啟一個剛體的屬性時，Blender將模擬與其它剛體的碰撞）： 
 1.平面 
 第2行程式碼建立了一個簡單的平面，立方體將放置在

MTCNN 人臉檢測論文解讀，及tensorflow程式碼實現

MTCNN簡介

訓練階段

訓練資料生成

網路結構

代價函式

預測階段

MTCNN 人臉檢測論文解讀，及tensorflow程式碼實現

深度學習之卷積神經網路CNN及tensorflow程式碼實現示例詳細介紹

深度學習之卷積神經網路CNN及tensorflow程式碼實現示例

MTCNN人臉檢測附完整C++代碼

人臉檢測真的不難，50行Python程式碼就能實現人臉檢測

Mtcnn人臉檢測實踐（一）

deeplabcv2 的 Atrous Convolution(帶孔卷機核)，感受野，及tensorflow實現crf的一點理解。

人臉檢測真的不難，50行Python代碼就能實現人臉檢測

專案實戰 - 原理講解<-> Keras框架搭建Mtcnn人臉檢測平臺

輪廓檢測論文解讀 | 整體巢狀邊緣檢測HED | CVPR | 2015

輪廓檢測論文解讀 | Richer Convolutional Features for Edge Detection | CVPR | 2017

用LSTM做時間序列預測的思路,tensorflow程式碼實現及傳入資料格式

利用霍夫變換做直線檢測的原理及OpenCV程式碼實現

迷宮求解呼叫棧，及遞迴實現

利用Canny邊緣檢測運算元進行邊緣檢測的原理及OpenCV程式碼實現

VS檢測記憶體洩漏，定位洩漏程式碼位置方法

頁面排程演算法 FIFO，LRU，OPT，及C++程式碼

影象特徵檢測描述(一):SIFT、SURF、ORB、HOG、LBP特徵的原理概述及OpenCV程式碼實現

[論文解讀] 阿里DIEN整體程式碼結構

python打造特別火的一個小遊戲，16行程式碼實現3D撞球小遊戲！