【Tensorflow】邏輯斯特迴歸（Logistic Regression）的簡單實現

阿新 • • 發佈：2019-01-03

Introduction

為了簡單的介紹和講解一下Tensorflow的基本操作，
我決定做一個簡單的邏輯斯特迴歸實現與程式碼講解，
但不太會用Markdown的方式來展現一個JupyterNotebook，
姑且就按照“說明—例項”的方式來解釋逐個程式碼塊好了。

Import packages

# coding: utf-8
# ============================================================================
#   Copyright (C) 2017 All rights reserved.
#
#   filename : Logistic_Regression.py 

#   author   : chendian / [email protected]
#   date     : 2018-09-26
#   desc     : Tensorflow Logistic Regression Tutorial
#   
# ============================================================================
from __future__ import print_function
import os
os.environ["CUDA_VISIBLE_DEVICES"] = ""

import 
 sys
import math
import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt

Loading training data from sklearn

如果需要使用 sklearn 第三方庫中自帶的資料集，這裡我列出了三種，方便呼叫與測試

sklearn的安裝

$ pip install sklearn

呼叫方法

data = load_data(name='moons')
data = load_data(name='circles')
data = load_data(name='linear' 
)

如果安裝sklearn有困難，也可以直接從檔案讀取：

data = load_data(name='moons', True)
data = load_data(name='circles', True)
data = load_data(name='linear', True)

基本實現

# use data from sklearn package
def load_moons():
    from sklearn.datasets import make_moons
    np.random.seed(0)
    X, y = make_moons(800, noise=0.2)
    print ("dataset shape:", X.shape)
    
    # return train validate test sets 
    return [(X[0:600,],y[0:600,]), (X[600:800,],y[600:800,])]

def load_circles():
    from sklearn.datasets import make_circles
    np.random.seed(0)
    X, y = make_circles(800, noise=0.2, factor=0.5, random_state=2)
    print ("dataset shape:", X.shape)
    
    # return train validate test sets 
    return [(X[0:600,],y[0:600,]), (X[600:800,],y[600:800,])]

def load_linear():
    from sklearn.datasets import make_classification
    np.random.seed(0)
    X, y = make_classification(
        800, n_features=2, n_redundant=0, n_informative=1,
        random_state=1, n_clusters_per_class=1)
    print ("dataset shape:", X.shape)
    
    # return train validate test sets 
    return [(X[0:600,],y[0:600,]), (X[600:800,],y[600:800,])]

def load_data(name='moons', load_directly=False):
    _datasets={
        'moons': load_moons,
        'linear': load_linear,
        'circles': load_circles,
    }
    try:
        ret = pickle.load(open('./{}.pkl'.format(name), 'r')) if load_directly else _datasets[name]()
    except Exception as e:
        print("set name as 'moons', 'linear' or 'circles',\n or check your files' existence")
        print(e)
    return ret

Define network

此處給出的是邏輯迴歸(Logistic Regression)的神經網路結構

對於輸入向量x，其屬於類別i的概率為：
$P\left ( Y=i\mid x,W,b \right ) =softmax_i\left ( Wx+b \right ) = \frac{e^{W_ix+b_i}}{\sum_{j}e^{W_jx+b_j}}$

模型對於輸入向量x的預測結果y_pred是所有類別的預測中概率值最大的，即
$y_{pred}=argmax_iP\left ( Y=i\mid x,W,b \right )$

在LR模型中，需要求解的引數為權重矩陣W和偏置向量b，為了求解模型的兩個引數，首先必須定義損失函式。對於上述的多類別Logistic迴歸，可以藉由Log似然函式作為其損失函式（負對數似然 注意取負）：
$L\left ( \theta =\left \{ W,b \right \},D \right )=\sum_{i=0}^{\left | D \right |}log\left ( P\left ( Y=y^{\left ( i \right )}\mid x^{\left ( i \right )},W,b \right ) \right )$

P.S.
程式碼中的 $Wx$ 實際實現為 $xW$ ，效果為：
將 x 的末維度 n_features 在矩陣乘法後轉化為 n_classes。
程式碼中使用的softmax_cross_entropy(y_truth, logits)效果為:
先將logits作softmax操作獲得y_pred，然後使用y_truth和y_pred作負對數似然。

class LogisticRegression():
    def __init__(self, n_in, n_out):
        self.X = tf.placeholder(tf.float32, [None, n_in], name='X')
        self.y = tf.placeholder(tf.int32, [None], name='y')
        self.init_variables(n_in, n_out)
        
    def init_variables(self, n_in, n_out):
        # n_in means n_features
        # n_out means n_classes
        self.W = tf.Variable(
            initial_value=tf.constant(0.0, shape=[n_in, n_out]),
            dtype=tf.float32, name='weight')
        self.b = tf.Variable(
            initial_value=tf.constant(0.0, shape=[n_out]),
            dtype=tf.float32, name='bias')

    def softmax(self, logits):
        # softmax = tf.exp(logits) / tf.reduce_sum(tf.exp(logits), axis)
        return tf.nn.softmax(logits, -1)
        
    def negative_log_likelihood(self, y_pred, y):
    	# Deprecated.
        prob = self.sigmoid(y_pred)
        positive_likelihood = tf.log(prob) * y.reshape(-1, 1)
        negative_likelihood = tf.log(1 - prob) * (1 - y.reshape(-1, 1))
        log_likelihood = positive_likelihood + negative_likelihood
        return -tf.reduce_mean(log_likelihood)
    
    def get_network(self):
        hidden = tf.matmul(self.X, self.W) + self.b
        self.y_pred = tf.argmax(self.softmax(hidden), axis=-1)  
        return self.y_pred, hidden
    
    def get_loss(self, hidden):
        # self.loss = self.negative_log_likelihood(y_pred, y)
        # self.loss = tf.nn.sigmoid_cross_entropy_with_logits(pred, y)
        onehot_labels = tf.one_hot(self.y, depth=2)
        self.loss = tf.losses.softmax_cross_entropy(onehot_labels=onehot_labels, logits=hidden)
        return tf.reduce_mean(self.loss)
    
    def gen_input(self, data_x, data_y=None):
        feed_dict = {}
        feed_dict[self.X] = data_x
        if data_y is not None:    
            self.y_truth = data_y
            feed_dict[self.y] = data_y
        return feed_dict
    
    def errors(self, y_pred, y_truth=None):
        if y_truth is None:
            y_truth = self.y
            not_equal_counts = tf.abs(y_pred - y_truth)
            return tf.reduce_mean(not_equal_counts)
        else:
            not_equal_counts = abs(y_pred - y_truth)
            return np.mean(not_equal_counts)

Define optimizer

因為深度學習常見的是對於梯度的優化，也就是說，
優化器最後其實就是各種對於梯度下降演算法的優化。

常見的優化器有 SGD，RMSprop，Adagrad，Adadelta，Adam 等，
此處例項中使用的是隨機梯度下降（Stochastic gradient descent），
因為大多數機器學習任務就是最小化損失，在損失定義的情況下，後面的工作就交給優化器處理即可

def sgd_optimization(datasets, learning_rate=0.10, n_epochs=50, draw_freq=10):
    train_set_x, train_set_y = datasets[0]
    test_set_x,  test_set_y  = datasets[1]
    classifier = LogisticRegression(n_in=2, n_out=2)  # Classifier
    
    def get_model_train():
        with tf.name_scope('train'):
            y_pred, hidden = classifier.get_network()
            loss = classifier.get_loss(hidden)
            return y_pred, loss
    
    def get_model_test():
        with tf.name_scope('test'):
            y_pred, hidden = classifier.get_network()
            return y_pred
        
    train_output = get_model_train()  # y_pred, loss
    test_output = get_model_test()  # y_pred
    optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(train_output[-1])
    
    init = tf.global_variables_initializer()
    sess = tf.Session()
    sess.run(init)
    
    def call_model(data_x, data_y=None, name=None):
        # generate data_y for placeholder while testing
        if data_y is None:
            data_y = np.zeros(data_x.shape[:-1])
            
        if name == 'test':
            ret = sess.run(  # return y_pred
                test_output,
                feed_dict=classifier.gen_input(data_x, data_y))
        else:  # name == 'train'
            _, ret = sess.run(  # return y_pred, loss
                [optimizer, train_output], 
                feed_dict=classifier.gen_input(data_x, data_y))
        return ret
    
    epoch = 0
    while epoch < n_epochs:
        # draw a figure every 'draw_freq' times
        if epoch % draw_freq == 0:
            # print(train_set_x, train_set_y)
            plot_decision_boundary(
                lambda x: call_model(x)[0], 
                train_set_x, train_set_y)
        
        # print error/cost per epoch
        train_pred, loss = call_model(
            train_set_x, train_set_y, 'train')
        train_error = classifier.errors(
            y_pred=train_pred, y_truth=train_set_y)
        
        test_pred = call_model(
            test_set_x,  test_set_y, 'test')
        test_error = classifier.errors(
            y_pred=test_pred, y_truth=test_set_y)

        print ("epoch is %d, train error %f, test error %f" % (
            epoch, train_error, test_error))
        epoch += 1

    # draw a figure at last        
    plot_decision_boundary(
        lambda x: call_model(x)[0], 
        train_set_x, train_set_y)
    sess.close()


def plot_decision_boundary(pred_func, train_set_x, train_set_y):
    # Draw figures as Matlab 
    x_min, x_max = train_set_x[:, 0].min() - .5, train_set_x[:, 0].max() + .5
    y_min, y_max = train_set_x[:, 1].min() - .5, train_set_x[:, 1].max() + .5
    h = 0.01
    xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))
    grid_input = np.c_[xx.ravel(), yy.ravel()].reshape([-1, 2])
    Z = pred_func(grid_input)
    plt.contourf(xx, yy, Z.reshape(xx.shape), cmap=plt.cm.Spectral)
    plt.scatter(train_set_x[:, 0], train_set_x[:, 1], c=train_set_y, cmap=plt.cm.Spectral)
    plt.show()

Start Training

對於模型選擇輸入資料（data），設定引數（迭代次數，每N次繪製一次）

if __name__=="__main__":
    data = load_data('moons')
    sgd_optimization(data, learning_rate=0.1, n_epochs=200, draw_freq=25)

dataset shape: (800, 2)

epoch is 0, train error 0.513333, test error 0.460000
epoch is 1, train error 0.513333, test error 0.165000
epoch is 2, train error 0.248333, test error 0.160000
epoch is 3, train error 0.201667, test error 0.175000
epoch is 4, train error 0.215000, test error 0.185000
epoch is 5, train error 0.206667, test error 0.185000
epoch is 6, train error 0.200000, test error 0.185000
epoch is 7, train error 0.200000, test error 0.185000
epoch is 8, train error 0.201667, test error 0.190000
epoch is 9, train error 0.203333, test error 0.190000
epoch is 10, train error 0.198333, test error 0.195000
epoch is 11, train error 0.198333, test error 0.195000
epoch is 12, train error 0.201667, test error 0.195000
epoch is 13, train error 0.201667, test error 0.195000
epoch is 14, train error 0.198333, test error 0.190000
epoch is 15, train error 0.198333, test error 0.190000
epoch is 16, train error 0.198333, test error 0.190000
epoch is 17, train error 0.195000, test error 0.190000
epoch is 18, train error 0.195000, test error 0.185000
epoch is 19, train error 0.195000, test error 0.185000
epoch is 20, train error 0.193333, test error 0.180000
epoch is 21, train error 0.191667, test error 0.180000
epoch is 22, train error 0.191667, test error 0.180000
epoch is 23, train error 0.191667, test error 0.180000
epoch is 24, train error 0.190000, test error 0.180000
epoch is 25, train error 0.191667, test error 0.175000
epoch is 26, train error 0.193333, test error 0.170000
epoch is 27, train error 0.193333, test error 0.170000
epoch is 28, train error 0.191667, test error 0.165000
epoch is 29, train error 0.191667, test error 0.165000
epoch is 30, train error 0.193333, test error 0.160

 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    【Tensorflow】邏輯斯特迴歸（Logistic Regression）的簡單實現
      
							
							
							Introduction
為了簡單的介紹和講解一下Tensorflow的基本操作，
我決定做一個簡單的邏輯斯特迴歸實現與程式碼講解，
但不太會用Markdown的方式來展現一個JupyterNotebook，
姑且就按照“說明—例項”的方式來解釋逐個程式碼塊好了 

  
 

    

    
    廣義線性迴歸之邏輯斯諦迴歸（ Logistic Regression）
       
  
  
 廣義線性模型 
 邏輯斯諦迴歸概念可以認為是屬於廣義線性迴歸的範疇，但它是用來進行分類的。 線性模型的表示式為：
     
      
       
        
         f
        
        
         (
        
        
  

  
 

    

    
    使用牛頓法確定邏輯斯諦迴歸（Logistic Regression）最佳迴歸係數
      
                
邏輯斯諦迴歸


在邏輯斯諦迴歸中，因為使用梯度上升(gradient ascent)收斂較慢，固本文采用牛頓法(Newton’s Method)進行引數求解，試驗發現通常迭代10次左右就可達到收斂，而梯度上升法則需要迭代上百甚至上千次，當然實際的迭代次數也要視實際資料而定 

  
 

    

    
    邏輯斯諦迴歸（Logistic regression）—《統計學習方法》
      
							
							
							邏輯斯諦迴歸（Logistic regression）是統計學習領域的一個經典分類方法，學習李航教授的《統計學習方法》將筆記和一些感悟記錄下來；



1 邏輯斯諦分佈（logistic distribution）

  為一個連續型的隨機變數，分佈函式F和密度 

  
 

    

    
    【機器學習 sklearn】邏輯斯蒂迴歸模型--Logistics regression
      
							
							
							執行結果：



"D:\Program Files\Python27\python.exe" D:/PycharmProjects/sklearn/Logistics_regression.py
Logistics regression
[[99  1]
 [ 

  
 

    

    
    【TensorFlow】Numpy常用函式彙總（附原始碼）
      
                以下內容是我在學習Numpy時，寫的例項，每一個模組都可以執行，並比較不同函式之間的差別。import numpy as np#dtype 定義numpy的儲存型別（np.int np.float）,預設是64'''#定義矩陣格式'''              	      

  
 

    

    
    樸素貝葉斯法（naive bayes）邏輯迴歸（logistic regression）線性迴歸
      
                樸素貝葉斯法實際上學習到生成資料的機制，所以屬於生成模型。條件獨立假設等於是說用於分類的特徵在類確定的條件下都是條件獨立的，但是有的時候會失去一些分類準確性。對於給定的輸入x，通過學習到的模型計算後驗概率分佈，將後驗概率最大的類作為x的類輸出主要是使用貝葉斯公式推導的過程。在 

  
 

    

    
    為什麽邏輯斯特回歸(logistic regression)是線性模型
      softmax   bsp   之間   ima   打破   regress   什麽   影響   線性變換   一個典型的logistic regression模型是:

這裏明明用了非線性函數，那為什麽logistic regression還是線性模型呢？
 
首先，這個函數不是f(y,x)=0的函數 

  
 

    

    
    機器學習專案實戰--邏輯迴歸（Logistic Regression）
       
 
 （一）邏輯迴歸
 
 邏輯迴歸演算法是一種廣義的線性迴歸分析模型, 可用於二分類和多分類問題, 常用於資料探勘、疾病自動診斷、經濟預測等領域。通俗來說, 邏輯迴歸演算法通過將資料進行擬合成一個邏輯函式來預估一個事件出現的概率，因此被稱為邏輯迴歸。因為演算法輸出的為事件發生概率, 所以其輸出值應該在0 

  
 

    

    
    機器學習演算法與Python實踐之邏輯迴歸（Logistic Regression）（二）
      
                #!/usr/bin/python
# -*- coding:utf-8 -*-
import numpy as np
from numpy import *
import matplotlib.pyplot as plt
#處理資料函式
def loadDataSet(): 

  
 

    

    
    邏輯迴歸（Logistic Regression）演算法小結
      一、邏輯迴歸簡述： 
　　回顧線性迴歸演算法，對於給定的一些n維特徵（x1,x2,x3,......xn），我們想通過對這些特徵進行加權求和彙總的方法來描繪出事物的最終運算結果。從而衍生出我們線性迴歸的計算公式： 
　　　　　　 
向量化表示式：     
    &n 

  
 

    

    
    機器學習/邏輯迴歸（logistic regression）/--附python程式碼
      個人分類： 機器學習 本文為吳恩達《機器學習》課程的讀書筆記，並用python實現。 前一篇講了線性迴歸，這一篇講邏輯迴歸，有了上一篇的基礎，這一篇的內容會顯得比較簡單。 邏輯迴歸（logistic regression）雖然叫回歸，但他做的事實際上是分類。這裡我們討論二元分類，即只分兩類，y屬於{0,1}。 

  
 

    

    
    機器學習之邏輯迴歸（logistic regression）
      
							
							
							



概述


邏輯斯蒂迴歸實質是對數機率迴歸（廣義的線性迴歸），是用來解決分類問題的。
其中sigmoid用來解決二分類問題，softmax解決多分類問題，sigmoid是softmax的特殊情況。
數學建模直接針對分類可能性建模。
引數學習可用極大似然估計 

  
 

    

    
    Python手擼邏輯迴歸（logistic regression）
      
                
與線性迴歸用於預測連續值不同，邏輯歸回用於分類，原理與線性迴歸類似，定義損失函式，然後最小化損失，得到引數既模型，只不過損失的定義不同。
邏輯迴歸的假設如圖1所示，可以理解為線性迴歸外面套了一層sigmoid函式g(z)，sigmoid函式影象如圖2所示，該函式有很好的數學 

  
 

    

    
    邏輯迴歸（Logistic+Regression）經典例項
      
							
							
							

房價預測

資料集描述

資料共有81個特徵  

SalePrice - the property’s sale price in dollars. This is the target variable that you’re trying to pre 

  
 

    

    
    邏輯迴歸（Logistic Regression）
      
                
1、總述
邏輯迴歸是應用非常廣泛的一個分類機器學習演算法，它將資料擬合到一個logit函式(或者叫做logistic函式)中，從而能夠完成對事件發生的概率進行預測。
2、由來
    要說邏輯迴歸，我們得追溯到線性迴歸，想必大家對線性迴歸都有一定的瞭解，即對於多維空間中存在 

  
 

    

    
    邏輯迴歸（logistic regression）和線性迴歸（linear regression）
      
                
序號
邏輯迴歸
線性迴歸
模型歸類
離散選擇法模型
迴歸分析
數值型別
二元
一元或多元
公式
P(Y=1│X=x)=exp(x'β)/(1+exp(x'β))


邏輯迴歸
Logit模型（Logit model，也譯作“評定模型”，“分類評定模型”，又作Logistic 

  
 

    

    
    機器學習演算法與Python實踐之（七）邏輯迴歸（Logistic Regression）
      
                
Logistic
 regression （邏輯迴歸）是當前業界比較常用的機器學習方法，用於估計某種事物的可能性。比如某使用者購買某商品的可能性，某病人患有某種疾病的可能性，以及某廣告被使用者點選的可能性等。（注意這裡是：“可能性”，而非數學上的“概率”，logisitc迴 

  
 

    

    
    機器學習筆記——logistic迴歸（logistic regression）
       
 
 logistic迴歸 
 logistic迴歸實際上並不是一種迴歸演算法，而是一種分類演算法，意思就是輸出值是離散值（01或者更多類），而它叫這個名字完全是歷史原因。我們可以從下圖看出對於分類問題，如果我們採用傳統的迴歸演算法並不能獲得很好的效果 
  
 假設稱述 
 由於輸出的值是0和1，因此我 

  
 

    

    
    線性迴歸（logistic regression）
      
							
							
							單變數線性迴歸
本文以單變數線性迴歸為例，且變數為一次方，多變數只需要增加變數x1，x2······的個數，變數x也可以有更高的次方。
h代表假設函式
theta代表引數
x代表輸入變數
y代表標籤
J代表損失函式

目標即為通過改變引數theta的值，最小化損