tensorflow學習筆記（三）：損失函式

阿新 • • 發佈：2019-02-18

tf.python.ops.nn_ops.sparse_softmax_cross_entropy_with_logits(logits, labels, name=None)

def sparse_softmax_cross_entropy_with_logits(logits, labels, name=None):
#logits是最後一層的z（輸入）
#A common use case is to have logits of shape `[batch_size, num_classes]` and
#labels of shape `[batch_size]`. But higher dimensions are supported. 

#Each entry in `labels` must be an index in `[0, num_classes)`
#輸出：loss [batch_size]

tf.python.ops.nn_ops.softmax_cross_entropy_with_logits(logits, targets, dim=-1, name=None)

def softmax_cross_entropy_with_logits(logits, targets, dim=-1, name=None):
#`logits` and `labels` must have the same shape `[batch_size, num_classes]` 

#return loss:[batch_size], 裡面儲存是batch中每個樣本的cross entropy

tf.nn.sigmoid_cross_entropy_with_logits(logits, targets, name=None)

def sigmoid_cross_entropy_with_logits(logits, targets, name=None):
#logits:[batch_size, num_classes],targets:[batch_size, size].logits作為用最後一層的輸入就好，不需要進行sigmoid運算，函式內部進行了sigmoid操作。 

#輸出loss [batch_size, num_classes]。。。說的是logits，其實內部實現是relu

tf.nn.nce_loss(nce_weights, nce_biases, embed, train_labels, num_sampled, vocabulary_size)

def nce_loss(nce_weights, nce_biases, embed, train_labels, num_sampled, vocabulary_size):
#word2vec中用到了這個函式
#weights: A `Tensor` of shape `[num_classes, dim]`, or a list of `Tensor`
#        objects whose concatenation along dimension 0 has shape
#        [num_classes, dim].  The (possibly-partitioned) class embeddings.
#biases: A `Tensor` of shape `[num_classes]`.  The class biases.
#inputs: A `Tensor` of shape `[batch_size, dim]`.  The forward
#        activations of the input network.
#labels: A `Tensor` of type `int64` and shape `[batch_size,
#    num_true]`. The target classes.
#num_sampled: An `int`.  The number of classes to randomly sample per batch.
#num_classes: An `int`. The number of possible classes.
#num_true: An `int`.  The number of target classes per training example.

tf.nn.sequence_loss_by_example(logits, targets, weights,average_across_timesteps=True,softmax_loss_function=None, name=None):

def sequence_loss_by_example(logits, targets, weights,
                             average_across_timesteps=True,
                             softmax_loss_function=None, name=None):
#logits: List of 2D Tensors of shape [batch_size x num_decoder_symbols].
#targets: List of 1D batch-sized int32 Tensors of the same length as logits.
#weights: List of 1D batch-sized float-Tensors of the same length as logits.
#return:log_pers 形狀是 [batch_size].
   for logit, target, weight in zip(logits, targets, weights):
      if softmax_loss_function is None:
        # TODO(irving,ebrevdo): This reshape is needed because
        # sequence_loss_by_example is called with scalars sometimes, which
        # violates our general scalar strictness policy.
        target = array_ops.reshape(target, [-1])
        crossent = nn_ops.sparse_softmax_cross_entropy_with_logits(
            logit, target)
      else:
        crossent = softmax_loss_function(logit, target)
      log_perp_list.append(crossent * weight)
    log_perps = math_ops.add_n(log_perp_list)
    if average_across_timesteps:
      total_size = math_ops.add_n(weights) 
      total_size += 1e-12  # Just to avoid division by 0 for all-0 weights.
      log_perps /= total_size
  return log_perps

關於weights：形狀應該是[T, batch_size] ,如果input包含填充的資料，對應的weights置0，其餘置1。這樣就可以保證，填充的資料不會進行梯度下降。

tensorflow學習筆記（三）：損失函式

tf.python.ops.nn_ops.sparse_softmax_cross_entropy_with_logits(logits, labels, name=None) def sparse_softmax_cross_entropy_with_l

tensorflow學習筆記（四）：啟用函式

tesorflow中的啟用函式所有啟用函式輸入和輸出的維度是一樣的 tf.nn.relu() tf.nn.sigmoid() tf.nn.tanh() tf.nn.elu() tf

C#可擴展編程之MEF學習筆記（三）：導出類的方法和屬性（轉）

學習說了如何 mod ati dem ont num imp 前面說完了導入和導出的幾種方法，如果大家細心的話會註意到前面我們導出的都是類，那麽方法和屬性能不能導出呢？？？答案是肯定的，下面就來說下MEF是如何導出方法和屬性的。　　還是前面的代碼，第二篇中已經提供了下

Java學習筆記（三）：面向對象

default 直接 imp 尋找 bst 構造時也 fin 不同 1.繼承語法 class 父類｛｝ class 子類 extends 父類｛｝只能多層繼承，不能多重繼承,子類不能直接訪問父類中的私有成員，可通過getter和setter方法獲得子類對象new實

hadoop學習筆記（三）：hdfs體系結構和讀寫流程（轉）

sim 百萬服務器發表繼續什麽 lose 基於一次原文：https://www.cnblogs.com/codeOfLife/p/5375120.html 目錄 HDFS 是做什麽的 HDFS 從何而來為什麽選擇 HDFS 存儲數據 HDFS

Tensorflow學習筆記（三）

此文章摘抄自Tensorflow中文社群，外加自己學習理解http://www.tensorfly.cn/ 在我看來，TensorFlow作為以個用於深度學習的計算庫，已然是非常的強大，但是對於真正想去學習機器學習或者深度學習的人來說，反而成就了我們自己的懶惰，祝好，各位碼農！執行

tensorflow學習筆記（1）：sess.run()

原址：https://www.2cto.com/kf/201610/559887.html session.run() session.run([fetch1, fetch2]) import tensorflow as tf state = tf.Variable(0.0,dtype=

javaweb學習筆記（三）：Servlet

Servlet的詳細解讀目錄 Servlet詳解 1.Servlet概述與執行過程 2.Servlet對映路徑 3.Servlet 的生命週期 3.1生命週期方法 3.2虛擬碼演示生命週期

學習筆記（三）：使用K近鄰演算法檢測Rootkit

Rootkit是一種特殊的惡意軟體，它的功能是在安裝目標上隱藏自身以及指定的檔案，程序和網路連結等資訊。 1.資料蒐集 KDD 99 TCP連線內容特徵包括hot ,num_faild_login

kubernetes學習筆記（三）：阿里雲遊戲業務實戰

本人一直做業務開發，不曾瞭解過運維知識，因為要對一個專案的技術部分負責，開發業務的同時還需要思考系統層面的事情，團隊人數又少，不得不採用k8s這種能達到事半功倍效果的工具。本文是在阿里雲kubernetes部署遊戲業務的實戰筆記，不涉及k8s原理等深層知識。我學習k8s的時間也比較短，如有理解錯誤的地方，還望

Scala學習筆記（三）：==,eq與equals的區別

== Scala中==與java中不同，它是比較值是否相等的，無論比較物件是否是相同型別 List(1, 2, 3) == List(1, 2, 3) //true 1==1.0//true equals 同類型與==作用相同，都是比較值是否相同不同型別返回false，如 1.equal

機器學習筆記（三）：線性迴歸大解剖（原理部分）

進入機器學習，線性迴歸自然就是一道開胃菜。雖說簡單，但對於入門來說還是有些難度的。程式碼部分見下一篇，程式碼對於程式設計師還是能能夠幫助理解那些公式的。（本文用的一些課件來自唐宇迪的機器學習，大家可以取網易雲課堂看他的視訊，很棒） 1.線性迴歸的一些要點先說

機器學習筆記（三）：線性迴歸大解剖（程式碼部分）

這裡，讓我手把手教你如何用邏輯迴歸分析資料根據學生分數預測是否錄取： #必備3個庫 import numpy as np import pandas as pd import matplotlib.pyplot as plt 讓我們讀入資料： import

tensorflow+faster rcnn程式碼理解（三）：損失函式構建

前面兩篇部落格已經敘述了基於vgg模型構建faster rcnn的過程： tensorflow+faster rcnn程式碼理解（一）：構建vgg前端和RPN網路 tensorflow+faster rcnn程式碼解析（二）：anchor_target_layer、proposal_targ

Numpy學習筆記（三）：建立矩陣及運算

矩陣的變換 #矩陣的形狀變換改變矩陣的形狀 print(np.arange(15)) a=np.arange(15).reshape(3,5) a a.shape a.ndim#矩陣的維度 a.dtype.name a.size 運算結果： [ 0 1

Numpy學習筆記（三）：不同的複製之間的對比

由於python語言自身的特性，通過賦值的方式，複製一個變數，其只是將不同的變數名同時指向了一個儲存地址，當兩個變數中的任意一個變數改變內容的時候，所有指向這個內容的變數都將會發生變化。因此如何能像c語言中那樣實現變數的任意改變，並不影響其他變數，是現在要實現

PHP學習筆記（三）：運算子和表示式

3.1 常量 3.1.1 自定義常量 1.使用define()函式宣告常量函式語法如下： define(string constant_name,mixed value,case_sensitive = true) 引數說明： 2.使用cons

tensorflow學習筆記（3）：優化器optimizer

Ⅰ.class tf.train.Optimizer 優化器（optimizers）類的基類。這個類定義了在訓練模型的時候新增一個操作的API。你基本上不會直接使用這個類，但是你會用到他的子類比如GradientDescentOptimizer, AdagradOptimi

學習筆記（三）：遊標、觸發器

遊標觸發器：觸發器的基礎知識：概念：對錶進行插入、更新、刪除自動執行的特殊的儲存過程觸發器與普通儲存過程的區別：觸發器是當對某一個表進行操作，系統會自動呼叫執行該表上對應的觸發器分類為： DML AFTER(之後) INSERT UPDATE DELE

機器學習筆記（三）：決策樹

決策樹（decision tree）是機器學習中最常見的方法之一，本文主要對決策樹的定義，生成與修剪以及經典的決策樹生成演算法進行簡要介紹。目錄如下一、什麼是決策樹二、決策樹的生成三、決策樹的修剪四、一些經典的決策樹生成演算法一、什麼是決策樹顧名

tensorflow學習筆記（三）：損失函式

tf.python.ops.nn_ops.sparse_softmax_cross_entropy_with_logits(logits, labels, name=None)

tf.python.ops.nn_ops.softmax_cross_entropy_with_logits(logits, targets, dim=-1, name=None)

tf.nn.sigmoid_cross_entropy_with_logits(logits, targets, name=None)

tf.nn.nce_loss(nce_weights, nce_biases, embed, train_labels, num_sampled, vocabulary_size)

tf.nn.sequence_loss_by_example(logits, targets, weights,average_across_timesteps=True,softmax_loss_function=None, name=None):

相關推薦