清華AI自強計劃作業2實驗—邏輯迴歸模型

阿新 • • 發佈：2018-11-27

問題：

執行模型輸出loss值為NAN,訓練200次後未出現線性模型
在這裡插入圖片描述

nan

nan的資料型別為float, not a number 的縮寫。python中判斷是否為nan型別的方法，使用math庫中的*isnan()*函式判斷：

from math import isnan
import numpy as np
res = np.nan
print (isnan(res))

無法確定運算結果時會返回nan結果.

回到問題本身：
bug出現在交叉熵損失函式的計算中:

sum_err -= Y[i]*np.log(Y_[i])+(1-Y[i])*np.log(1-Y_[i]

其中Y[i]為真值，Y_[i]為對應資料的預測值。
將np.log(Y_[i])打印出來發現型別為 -inf：負無窮大
發現在資料歸一化過程中，

Xmin = X.min(0)# 每列的最小值，輸出行為1列為2的陣列 # 通過使用 np.min 函式，計算原始資料沿著 axis=0 方向的最小值，即：求每一列的最小值，並賦值給 Xmin
Xmax = X.max(0)# 通過使用 np.max 函式，計算原始資料沿著 axis=0 方向的最大值，即：求每一列的最大值，並賦值給 Xmax
Xmu = np.mean(X)#

注意np.mean函式的用法：
np.mean(X,axis, out，keepdims)
axis為0，表示壓縮行，按列取均值，返回1n矩陣
axis為1，表示壓縮列，按行取均值，返回m

1矩陣
那麼在上述程式碼中，Xmu應當為np.mean(X,0)，對各列取均值，下面的歸一化公式才可以計算正確：

X_norm = (X-Xmu)/(Xmax-Xmin)

修改Xmu = np.mean(X,0)後
顯示x_norm的值為：

在這裡插入圖片描述
原始資料繪圖：
可以看到橫軸縱軸的刻度全部依照真實資料

歸一化輸出結果是這樣的：

橫軸和縱軸均分別歸一化處理
擬合線性模型為：在這裡插入圖片描述

輸出損失值和準確值
Cost theta: [[ 0.48518509]]
Train Accuracy: 0.88

在批量梯度下降法中（Batch Gradient Descent，BGD）,不斷更新權重 W

def BGD(X, y, iter_num, alpha):
trainMat = np.mat(X) # 通過使用 np.mat 函式，將資料集 X 轉換成矩陣型別，並賦值給 trainMat,trainMat的型別為ndarray,m3(在月薪和身高兩列之外，新增全為1的一列)
trainY = np.mat(y).T # 通過使用 np.mat 函式，將資料集 y 轉換成矩陣型別，並且轉置，然後賦值給 trainY
m, n = np.shape(X) # 通過使用 np.shape 函式，得到資料集 X 的形狀大小，其中，m 為資料集 X 的行數，n 為資料集 X 的列數
w = np.ones((n, 1)) # 通過使用 np.ones 函式，建立元素全為 1 的矩陣，矩陣的大小為 n 行 1 列，並賦值給 w, 即：進行權重 w 的初始化，令其全為 1
for i in range(iter_num): # 通過 for 迴圈結構，開始進行迭代，其中，i 可取的數依次為：0，1 ，2，…，iter_num-1，迭代次數總共有 iter_num 次
error = sigmoid(trainMat

w)-trainY # 計算迭代的誤差 error：將預測得到的啟用函式的數值 sigmoid(trainMatw) 減去實際的 trainY 數值
w = w-(1.0/m) * alphatrainMat.Terror # 更新權重 w , BGD 批量梯度下降法的核心， w = w - (1.0/m)alphatrainMat.Terror
return w # 返回 w’

sigmoid函式實現：

wx為m1矩陣，sigmoidV計算結果也為m1矩陣
def sigmoid(wx):
sigmoidV = 1.0/(1.0+np.exp(-wx))# 請補全
# 請補全計算啟用函式 sigmoid 函式的函式值，計算公式為：1.0/(1.0+np.exp(-wx))
return sigmoidV

iter_num為迭代次數，設m為資料行數
trainMat：m*3（第一列為1，第二列為身高標籤歸一化資料，第三列為月薪標籤歸一化資料）
w：3*1（初始化為全1矩陣，分別對應月薪引數、身高參數和偏置）
sigmoid函式返回矩陣：m*1
trainY：m*1
error :m*1 每組資料在此模型下的誤差
trainMat.T * error ：3*1 ，和w的矩陣格式相同，因此可直接加減。

批量梯度下降法

每次使用所有樣本來進行函式的更新，
目標函式：
在這裡插入圖片描述
更新引數的方式：

在這裡插入圖片描述

程式碼中使用矩陣運算實現了公式中求和的功能，和程式碼結合食用效果更佳！

ps：
根據課程群裡有同學提出的歸一化的問題，也親自做了實驗：
在當前資料下，減去均值和中位數進行歸一化是沒什麼區別的，cost值略有差別：

def normalization(X):
Xmin = X.min(0)# 每列的最小值，輸出行為1列為2的陣列 # 請補全通過使用 np.min 函式，計算原始資料沿著 axis=0 方向的最小值，即：求每一列的最小值，並賦值給 Xmin
Xmax = X.max(0)# 通過使用 np.max 函式，計算原始資料沿著 axis=0 方向的最大值，即：求每一列的最大值，並賦值給 Xmax
Xmu = np.median(X,0)#通過使用 np.median函式求該列數值的中位數，計算原始資料均值，並賦值給 Xmu
X_norm = (X-Xmu)/(Xmax-Xmin)# 計算歸一化後的資料，歸一化公式為：(X-Xmu)/(Xmax-Xmin)，歸一化後資料範圍為 [-1,1]
return X_norm # 返回資料預處理，歸一化後的資料 X_norm

在這裡插入圖片描述

Cost theta: [[ 0.48865864]]
Train Accuracy: 0.88

若減去最小值歸一化：
歸一化資料影象為：
在這裡插入圖片描述

線性模型：
在這裡插入圖片描述

Cost theta: [[ 0.57953747]]
Train Accuracy: 0.82

可見採用不同歸一化方法對模型訓練還是有不小影響的

清華AI自強計劃作業2實驗—邏輯迴歸模型

問題：執行模型輸出loss值為NAN,訓練200次後未出現線性模型 nan nan的資料型別為float, not a number 的縮寫。python中判斷是否為nan型別的方法，使用math庫中的*isnan()*函式判斷： from math import

【清華AI自強計劃-計算機視覺課程-第三講課程筆記2】

神經網路為什麼有效？神經網路有一個性質：Universality，“全包了”，即可代替所有的函式畫出決策邊界的普遍性。簡化模型到只有w和b兩個引數，啟用函式為sigmoid函式，啟用函式的跳變點和-b/w有關。如果啟用隱藏層神經元，w1和w2的絕對值相等，符號相反，並且s1和s2設定

【清華AI自強計劃-計算機視覺課程-第三講課程筆記1】

【清華AI自強計劃】-第三講課程筆記-1 資料歸一化中的“一”是什麼意思？將不同變數的量綱都轉化為1，消除單位的影響。明確課程定位：垂直行業從業者&愛好者：聽課目標：0->0.5 定性理解，專注落地演算法科學家：聽課目標：0->1

【機器學習模型詳細推導2】- 邏輯迴歸

邏輯迴歸 1. 模型引入 2. 模型描述 3. 模型求解策略（代價函式） 4. 模型求解演算法 - 梯度下降 1. 模型引入線性模型可以進行迴歸學習（參見【機器學習模型1】- 線性迴歸），但如何用於分類任務？需要找一個單調可

【ML_Algorithm 2 】邏輯迴歸(Logistic Regression)——演算法推導

邏輯迴歸其實做的是一個分類的事怎麼樣做到的分類：（可以輸入任何數，該式可以轉換成一個0或1的取值）該演算法實際上是用迴歸的方法轉把資料換成了分類（二分類）的問題。此式：咱們要找出來一個θ，使該θ和x進行組合之後，使得得到的值和y的真實值相

ML模型2：邏輯迴歸

一些迴歸演算法可以用來處理分類問題，以及一些分類演算法可以進行迴歸預測，邏輯迴歸就屬於前者。邏輯迴歸一般通過估計一個概率值，來表示一個樣本屬於某一類的概率。假如一個樣本屬於某一類的概率大於50%，那麼就判該樣本屬於這一類。優點：計算代價不高，易於理解和實現。

2、邏輯迴歸（正則項約束數學本質）

https://www.jianshu.com/p/209d73fcb17b 【邏輯迴歸函式模型】 1、線性迴歸連續性不適合離散目標擬合 2、sigmod(S型函式1/(1+e**-z)輸出值始終落在[0,1]的特徵【邏輯迴歸損失函式】 1、預測函式: g(z) = 1/

tensorflow構造邏輯迴歸模型

import numpy as np import tensorflow as tf import matplotlib.pyplot as plt import input_data mnist = input_data.read_data_sets('data/', one_hot=True)

實戰：利用Python sklearn庫裡的邏輯迴歸模型訓練資料---建立模型

本案例主要是通過對不均衡的28萬組資料建立模型，分析預測欺詐使用者，採用sigmod函式作為損失函式，採用交叉驗證的方法和l1正交法則，比對了不同懲罰函式下的模型的召回率，也通過預測值和實際值做出混淆矩陣更加直觀看到各種預測結果。也比較了sigmod函式下的不同閾值下的模型預測的精度和召

邏輯迴歸模型在R中實踐

在日常學習或工作中經常會使用線性迴歸模型對某一事物進行預測，例如預測房價、身高、GDP、學生成績等，發現這些被預測的變數都屬於連續型變數。然而有些情況下，被預測變數可能是二元變數，即成功或失敗、流失或不流失、漲或跌等，對於這類問題，線性迴歸將束手無策。這個時候就需要另一種

邏輯迴歸模型總結-機器學習

邏輯迴歸被廣泛的用來解決分類問題。由於分類是非線性問題，所以建模的主要難點是如何把非線性問題轉換為線性問題。在模型評估層面，討論了兩類相互有關聯的評估指標。對於分類問題的預測結果，可以定義為相應的查準查全率。對於基於概率的分類模型，還可以繪製它的ROC曲線，以及計算曲線線面的面積AUC。

客戶貸款逾期預測[1]-邏輯迴歸模型

任務預測貸款客戶是否會逾期，status為響應變數，有0和1兩種值，0表示未逾期，1表示逾期。程式碼： # -*- coding: utf-8 -*- """ Created on Thu Nov 15 13:02:11 2018

機器學習（四）邏輯迴歸模型訓練

本篇不講演算法只講用Python （pandas, matplotlib, numpy, sklearn) 進行訓練的一些要點 1.合併index np.concatenate([index1,index2]) 2.from sklearn.cross_va

ML模型2：線性迴歸模型

線性迴歸模型 1. 問題描述假設有m個樣本，n維特徵。樣本集記為 {(x1(0),x2(0),...xn(0),y0),(x1(1),x2(1),...xn(1),y1),...(x1(m),x2(m),...xn(m),yn)}\left\{ {(x_1^{

邏輯迴歸模型實踐-貸款逾期預測

任務預測貸款使用者是否會逾期，status為響應變數，有0和1兩種值。程式碼： # -*- coding: utf-8 -*- """ Created on Thu Nov 15 13:02:11 2018 @author: keepi """ i

邏輯迴歸模型（logistic regression）

邏輯迴歸模型意義邏輯迴歸是機器學習中做分類任務常用的方法，屬於“廣義的線性模型”，即：考慮二分類任務，其輸出標記y∈{0，1},而線性迴歸模型產生的預測值 z = wx+b是實值，於是，需要將實

LR(Logistic Regression) 邏輯迴歸模型進行二分類或多分類及梯度下降學習引數

邏輯迴歸(Logistic Regression, LR)是傳統機器學習中的一種分類模型，由於演算法的簡單和高效，在實際中應用非常廣泛。它的起源非常複雜，可以看參考引用1。具體應用實踐可以看這裡。問題背景對於二元分類問題，給定一個輸入特徵向量XX(例

邏輯迴歸模型(Logistic Regression, LR)基礎

邏輯迴歸(Logistic Regression, LR)模型其實僅線上性迴歸的基礎上，套用了一個邏輯函式，但也就由於這個邏輯函式，使得邏輯迴歸模型成為了機器學習領域一顆耀眼的明星，更是計算廣告學的核心。本文主要詳述邏輯迴歸模型的基礎，至於邏輯迴歸模型的優化、邏輯迴歸與計算廣告學等，請關注後續文章。 1

機器學習演算法（一）：邏輯迴歸模型（Logistic Regression, LR）

轉自：https://blog.csdn.net/weixin_39910711/article/details/81607386 線性分類器：模型是引數的線性函式，分類平面是（超）平面；非線性分類器：模型分介面可以是曲面或者超平面的組合。典型的線性分類器有感知機，LDA，邏輯斯特迴歸，SVM

LR模型（邏輯迴歸模型）

1.邏輯迴歸模型按照音譯logistic regression應該是邏輯斯蒂迴歸，太難聽了，就簡稱邏輯迴歸吧。 1.1 二項邏輯迴歸模型二項邏輯迴歸模型是一種二分類模型，儘管它叫“迴歸”。模型如下： P(Y=1|x)=e(w⋅x+b)1+e(

清華AI自強計劃作業2實驗—邏輯迴歸模型

nan

批量梯度下降法

相關推薦