DL學習筆記【11】caffe引數調節-loss層

阿新 • • 發佈：2019-01-26

轉自：http://www.cnblogs.com/lutingting/p/5240688.html

在caffe中，網路的結構由prototxt檔案中給出，由一些列的Layer（層）組成，常用的層如：資料載入層、卷積操作層、pooling層、非線性變換層、內積運算層、歸一化層、損失計算層等；本篇主要介紹loss層

1. loss層總述

下面首先給出全loss層的結構設定的一個小例子（定義在.prototxt檔案中）

layer {
  name: "loss"
  type: "SoftmaxWithLoss"  //loss fucntion的型別
  bottom: "pred"  // 
loss fucntion的輸入資料blob，即網路的預測值lable
  bottom: "label"  //loss function的另外一個輸入資料blob，即資料集的真實label
  top: "loss" //loss的輸出blob，即分類器的loss 值
}

2. loss function型別

粗略地講，loss function是用來衡量估計值和真實值之間的誤差情況的；在caffe中，包含了常用的loss function，目前主要有以下幾種：

【Loss drives learning by comparing an output to a target and assigning cost to minimize. The loss itself is computed by the forward pass and the gradient w.r.t. to the loss is computed by the backward pass.】

（1）softmax：影象多類分類問題中主要就是用它

Layer type: SoftmaxWithLoss

（2）Sum-of-Squares / Euclidean：主要用線上性迴歸中

Layer type: EuclideanLoss

（3）Hinge / Margin：主要用在SVM分類器中

Layer type: HingeLoss

（4）Sigmoid Cross-Entropy

Layer type: SigmoidCrossEntropyLoss

（5）Infogain

Layer type: InfogainLoss

DL學習筆記【11】caffe引數調節-loss層

轉自：http://www.cnblogs.com/lutingting/p/5240688.html 在caffe中，網路的結構由prototxt檔案中給出，由一些列的Layer（層）組成，常用的層如：資料載入層、卷積操作層、pooling層、非線性變換層、內積運算

DL學習筆記【5】caffe引數調節-solver檔案

solver檔案： # 定義網路結構的檔案 net: "deblurring_train_test.prototxt" # test_iter 測試集向前傳遞多少次 # batch size * test_iter = 測試集圖片數 test_iter: 100 # 每

DL學習筆記【21】ubuntu16 使用經驗彙總 + torch7 + iTorch

使用經驗！！！如果想要用gpu程式設計，一定要先裝cuda，再去想別的！！！詳情請見： http://blog.csdn.net/sun7_she/article/details/68946966 -----------------------------------

DL學習筆記【22】增強學習（Reinforcement Learning）

據說瞭解增強學習首先要了解馬爾可夫性馬爾可夫性在已知目前狀態（現在）的條件下，它未來的演變（將來）不依賴於它以往的演變 (過去 ) 馬爾可夫過程按照其狀態和時間引數是否連續或者離散分為三種：時間和狀態都離散的叫做馬爾科夫鏈時間和狀態都是連續的叫做馬

DL學習筆記【18】nn包中的各位Criterions

很多事情不是因為有多難才沒完成，只是因為沒有開始。come on，看好你喲！參考自https://github.com/torch/nn/blob/master/doc/criterion.md Criterions -------------------------

【11】Caffe學習系列：影象資料轉換成db（leveldb/lmdb)檔案

在深度學習的實際應用中，我們經常用到的原始資料是圖片檔案，如jpg,jpeg,png,tif等格式的，而且有可能圖片的大小還不一致。而在caffe中經常使用的資料型別是lmdb或leveldb，因此就產生了這樣的一個問題：如何從原始圖片檔案轉換成caffe中能夠執行的db（leveldb/lmdb)

【caffe學習筆記之7】caffe-matlab/python訓練LeNet模型並應用於mnist資料集（2）

【案例介紹】 LeNet網路模型是一個用來識別手寫數字的最經典的卷積神經網路，是Yann LeCun在1998年設計並提出的，是早期卷積神經網路中最有代表性的實驗系統之一，其論文是CNN領域第一篇經典之作。本篇部落格詳細介紹基於Matlab、Python訓練lenet手

TDD學習筆記【六】一Unit Test - Stub, Mock, Fake 簡介

-i moc load customers eight foreach 存在執行 repo 這篇文章簡介一下，如何通過 mock framework，來輔助我們更便利地模擬目標對象的依賴對象，而不必手工敲堆只為了這次測試而存在的輔助類型。而模擬目標對象的部分，常見的有

Docker學習筆記【三】安裝Redis

art port 再次 dock 使用 contain bash Go red 項目中使用到Redis，平常都是別人搭建的，今天試著在Google Cloud Platform 上搭建一個學習環境。 1.使用 docker pull redis 從docker hub中下載

system generator學習筆記【01】

分享基本功 hle ima 安裝分享圖片 use 內容整理 blank 作者：桂。時間：2018-05-18 18:26:50 鏈接：http://www.cnblogs.com/xingshansi/p/9045914.html 前言學習使用s

響應式布局學習筆記【1】----基礎知識

網頁設計 water com 文章 tar 屏幕分辨率優點 light gin 本篇文章主要解決：什麽是響應式布局？有什麽優點和缺點？一什麽是響應式布局？伊桑·馬科特（Ethan Marcotte）在2010年首先提出了響應式網頁設計（RWD,Responsive

Grunt學習筆記【3】---- filter詳解

add 行處理 class 一個特殊 col filter詳解很多 https 本文主要講配置任務中的filter，包括使用默認fs.Stats方法名和自定義過濾函數。通過設置filter屬性可以實現一些特殊處理邏輯。例如：要清理某個文件夾下的所有空文件夾，這時使用c

Tomcat學習筆記【1】--- WEB服務器、JavaEE、Tomcat背景

javascrip http .cn 目的 java log 進行瀏覽器靜態資源本文主要講學習Tomcat需要知道的基礎知識。一 Web服務器 Web服務器可以解析HTTP協議。當Web服務器接收到一個HTTP請求,會返回一個HTTP響應,例如送回一個HTML頁面。

Python學習筆記【Supervisor】：使用Supervisor監控Tornado程序

Linux常見應用服務配置模式nginx和supervisor：採用主配置檔案+專案配置檔案安裝（如果使用pip安裝注意看是否需要指定使用python2版本）第一步：在Linux中使用apt-get 指令安裝 sudo apt-get install supervisor

Python學習筆記【Nginx】：Nginx使用與完全解除安裝

安裝與啟動nginx 第一步：通過指令安裝包 sudo apt install nginx sudo apt install nginx 第二步：安裝成功後檢視相關配置檔案 ls /etc/nginx/ 在這裡主要是 conf.d

資料分析---《Python for Data Analysis》學習筆記【01】

《Python for Data Analysis》一書由Wes Mckinney所著，中文譯名是《利用Python進行資料分析》。這裡記錄一下學習過程，其中有些方法和書中不同，是按自己比較熟悉的方式實現的。第一個例項：1.usa.gov data from bit.ly &n

資料分析---《Python for Data Analysis》學習筆記【02】

《Python for Data Analysis》一書由Wes Mckinney所著，中文譯名是《利用Python進行資料分析》。這裡記錄一下學習過程，其中有些方法和書中不同，是按自己比較熟悉的方式實現的。第二個例項：MovieLens 1M Data Set

OpenCV學習筆記【七】方框濾波、均值濾波、高斯濾波

1.平滑處理平滑處理（smoothing）也稱模糊處理（bluring），是一種簡單且使用頻率很高的影象處理方法。平滑處理的用途有很多，最常見的是用來減少影象上的噪點或者失真。在涉及到影象解析度時，平滑處理是非常好用的方法。 2.影象濾波與濾波器影象濾波，指儘量保留影象細節特徵的條件

資料分析---《Python for Data Analysis》學習筆記【03】

《Python for Data Analysis》一書由Wes Mckinney所著，中文譯名是《利用Python進行資料分析》。這裡記錄一下學習過程，其中有些方法和書中不同，是按自己比較熟悉的方式實現的。第三個例項：US Baby Names 1880-2010

Appium自動測試框架學習筆記【二】

前言接下來主要講一下如何搭建java的測試環境，以及編寫測試程式碼環境配置參考文章首先JDK和java IDE的安裝就不講了，IDE一般選擇IntelliJ IDEA，不過為了能使用Appium

DL學習筆記【11】caffe引數調節-loss層

1. loss層總述

2. loss function型別

相關推薦