Python和PyTorch對比實現多標籤softmax + cross-entropy交叉熵損失及反向傳播

阿新 • • 發佈：2018-12-21

正文

變數有仔細命名, 註釋我就不寫了 ^ _ ^

import torch
import numpy as np


class SolfmaxEntropyLoss:
    def __init__(self):
        self.nx = None
        self. 
ny = None
        self.softmax = None
        self.entropy = None
        self.loss = None
        self.dnx = None

    def __call__(self, nx, ny):
        self.nx = nx
        self.ny = ny
        shifted_x = nx - np.max(nx)
        ex = np.exp(shifted_x)
        sum_ex = np.sum(ex)
        self.softmax = 
 ex / sum_ex
        self.entropy = - np.log(self.softmax) * ny
        self.loss = np.sum(self.entropy)
        return self.loss

    def backward(self):
        self.dnx = self.softmax.copy() * np.sum(self.ny)
        self.dnx -= self.ny
        return self.dnx


np.set_printoptions(precision=8, suppress= 
True, linewidth=120)

x_numpy = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9], dtype=np.float)
y_numpy = np.array([0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9], dtype=np.float)
x_tensor = torch.tensor(x_numpy, requires_grad=True)
y_tensor = torch.tensor(y_numpy)

solfmax_entropy_loss = SolfmaxEntropyLoss()
loss_numpy = solfmax_entropy_loss(x_numpy, y_numpy)
dx_numpy = solfmax_entropy_loss.backward()

log_softmax_layer = torch.nn.LogSoftmax(dim=0)
log_softmax_tensor = log_softmax_layer(x_tensor)
entropy_tensor = - log_softmax_tensor * y_tensor
loss_tensor = entropy_tensor.sum()
loss_tensor.backward()
dx_tensor = x_tensor.grad

print(loss_numpy)
print(loss_tensor.data.numpy())
print()
print(dx_numpy)
print(dx_tensor.data.numpy())

"""
程式碼輸出:
14.0634827759
14.063482775853203

[-0.09904564 -0.19740579 -0.29294821 -0.38083126 -0.44789396 -0.45836109 -0.31498552  0.24657787  1.9448936 ]
[-0.09904564 -0.19740579 -0.29294821 -0.38083126 -0.44789396 -0.45836109 -0.31498552  0.24657787  1.9448936 ]
"""

Python和PyTorch對比實現多標籤softmax + cross-entropy交叉熵損失及反向傳播

相關關於 softmax + cross-entropy 的詳細介紹, 請參考 : BrightLamp. 多標籤softmax + cross-entropy交叉熵損失函式詳解及反向傳播中的梯度求導[EB/OL]. https://blog.csdn.net

softmax + cross-entropy交叉熵損失函式詳解及反向傳播中的梯度求導

相關正文在大多數教程中, softmax 和 cross-entropy 總是一起出現, 求梯度的時候也是一起考慮. 我們來看看為什麼. 關於 softmax 和 cross-entropy 的梯度的求導過程, 已經在上面的兩篇文章中分別給出, 這裡

softmax交叉熵損失函式反向傳播求導過程分析

目錄一、softmax 函式二、損失函式 loss function 三、最後的準備工作

TensorFlow學習筆記（二十三）四種Cross Entropy交叉熵演算法實現和應用

交叉熵（Cross-Entropy）交叉熵是一個在ML領域經常會被提到的名詞。在這篇文章裡將對這個概念進行詳細的分析。 1.什麼是資訊量？假設是一個離散型隨機變數，其取值集合為，概率分佈函式為 p ( x ) = r (

自己動手實現深度學習框架-4 使用交叉熵損失函式支援分類任務

程式碼倉庫: https://github.com/brandonlyg/cute-dl 目標增加交叉熵損失函式，使框架能夠支援分類任務的模型。構建一個MLP模型, 在mnist資料集上執行分類任務準確率達到91%。實現交叉熵損失函式數學原理分解交叉熵損失函式 &n

Caffe實現多標籤影象分類（1）——基於Python介面實現多標籤影象分類（VOC2012）

1.前言 Caffe可以通過LMDB或LevelDB資料格式實現影象資料及標籤的輸入，不過這隻限於單標籤影象資料的輸入。由於研究生期間所從事的研究是影象標註領域，在進行影象標註時，每幅影象都是多標籤的，因此在使用Caffe進行遷移學習時需要實現多標籤影象資料

python 和 scikit-learn 實現垃圾郵件過濾

文本挖掘（Text Mining，從文字中獲取信息）是一個比較寬泛的概念，這一技術在如今每天都有海量文本數據生成的時代越來越受到關註。目前，在機器學習模型的幫助下，包括情緒分析，文件分類，話題分類，文本總結，機器翻譯等在內的諸多文本挖掘應用都已經實現了自動化。在這些應用中，垃圾郵件過濾算是

Python之路 - Socketserver實現多並發

one other while 進程 sockets ket 開發 port == Python之路 - Socketserver實現多並發閱讀指引 ?? socketserver ?? 實現多並發 ?? 閱讀指引 ?? 在上面的整理篇章中 , 簡單的網絡編程

1024_(即時通訊)使用node.js和socket.io實現多人聊天室

使用node.js和socket.io實現多人聊天室 2015年01月24日 03:24:54 遠古大猛獁閱讀數：2775 轉自： http://www.cnblogs.com/flyoung2008/archive/2012/07/19/2600132.html

基於keras實現多標籤分類（multi-label classification）

首先討論多標籤分類資料集（以及如何快速構建自己的資料集）。之後簡要討論SmallerVGGNet，我們將實現的Keras神經網路架構，並用於多標籤分類。然後我們將實施SmallerVGGNet並使用我們的多標籤分類資料集對其進行訓練。最後，我們將通過在示例影象上測試我

python語法——使用Pool實現多程序並行

簡介 Pool 模組來自於 multiprocessing 模組。 multiprocessing 模組是跨平臺版本的多程序模組，像執行緒一樣管理程序，與 threading 很相似，對多核CPU的利用率會比 threading 好的多。 Pool 類可以提供指定數

python技巧——使用threadpool實現多執行緒並行

可以使用 threadpool 來實現多程序並行。示例我想用多執行緒求一個數列的和，可以如下操作： import threadpool def func(dic, c): dic['count'] += c if __name__=="__main__":

python技巧——使用Pool實現多程序並行

簡介可以使用 Pool來實現多程序並行。 Pool 模組來自於 multiprocessing 模組。 multiprocessing 模組是跨平臺版本的多程序模組，像執行緒一樣管理程序，與 threading 很相似，對多核CPU的利用率會比 threading

caffe實現多標籤分類

最近在參加一個識別的競賽，專案裡涉及了許多類別的分類，原本打算一個大的類別訓練一個分類模型，但是這樣會比較麻煩，對於同一圖片的分類會重複計算分類網路中的卷積層，浪費計算時間和效率。後來發現現在深度學習中的多工學習可以實現多標籤分類，所有的類別只需要訓練一個分類模型就行，其不同屬性的類別之間是共享卷積層的。我

python sort搭配lambda實現多欄位排序

sort的常用方法你一定都會了，但是如果要排序的物件的每個元素又含有多個元素，要按指定的內部某個元素排序該怎麼實現呢？正常是這樣來做的： >>> def return_item(item): ... return item[1] >>> pairs

ROS下利用Python和OpenCVC分別實現筆記本攝像頭/USB攝像頭/監控IP攝像頭資料的獲取

說明: 最近的一個小任務，記錄一下，希望對以後有幫助吧： -———————————————————————————————————————————————— 參考帖子一、先利用python實現筆記本攝像頭/USB攝像頭的資料的獲取：程式碼如下： i

資料庫百科---實現多標籤篩選

一、背景在一些視訊網站（如：優酷、愛奇藝等），都會有篩選功能。但當我使用這個篩選功能時，發現其只能進行單型別篩選，例如電影型別只能按某一種型別進行篩選。如果想看既是科幻電影又是戰爭的電影呢？顯然單個標籤型別篩選是滿足不了這個需求的，接下來簡要談談我的實現方法。

MapReduce實現兩表的Join--原理及python和java程式碼實現

用Hive一句話搞定的，但是有時必須要用mapreduce 方法介紹 1. 概述在傳統資料庫（如：MYSQL）中，JOIN操作是非常常見且非常耗時的。而在HADOOP中進行JOIN操作，同樣常見且耗時，由於Hadoop的獨特設計思想，當進行JOIN操作時，有一

Python通過Manager方式實現多個無關聯程序共享資料

Python實現多程序間通訊的方式有很多種，例如佇列，管道等。但是這些方式只適用於多個程序都是源於同一個父程序的情況。如果多個程序不是源於同一個父程序，只能用共享記憶體，訊號量等方式，但是這些方式對於複雜的資料結構，例如Queue，dict，list等，使用起來比較麻煩，不夠靈活。Manager是一種較為高階

Caffe中LMDB介面實現多標籤資料準備及訓練

有不少部落格講Caffe多標籤輸入的問題，但總覺得講的不夠透徹，在實踐角度上沒有給出詳細的指導，所以本文力求能給出詳細的實踐過程和說明。 Caffe多標籤輸入常用的的方法有以下幾種： 1. 修改Caffe原始碼使其支援多標籤輸入，參考CSDN部落格《

Python和PyTorch對比實現多標籤softmax + cross-entropy交叉熵損失及反向傳播

相關

正文

相關推薦