邏輯迴歸原理介紹與案例python程式碼實現

阿新 • • 發佈：2019-02-02

邏輯迴歸是用於分類的演算法。

平常的線性迴歸方程為f(x)=wx+b，此時f(x)的取值可以是任意的，要讓預測的值可以分類，例如分類到class1是預測值為1，分類到class2時預測值為0。這時我們就要用到分類函式。

下面來介紹一個分類函式sigmoid：

其中z=wx+b

f（z）的取值將在0與1之間，如下圖

有：

設f(z)表示分類到class1是的概率，則分類到class2的概率為1-f(z)。

假設我們有如下資料集：

最大似然的意義是表示出現這組資料最大可能性。

由最大釋然估計可得

即求L（w，b）最大時的w和b的值

也就是求-ln⁡(L(w,b))最小值時，w和b的值

以下為上述公式的程式碼實現

cross_entropy = -1 * (np.dot(np.squeeze(Y), np.log(y)) + np.dot((1 - np.squeeze(Y)), np.log(1 - y)))

求偏導可得：

以下為上述求偏導的程式碼實現

w_grad = np.sum(-1 * X * (np.squeeze(Y) - y).reshape((batch_size,1)), axis=0)
b_grad = np.sum(-1 * (np.squeeze(Y) - y))

可用梯度下降法求得目標函式最低時的w和b的值

以下為邏輯迴歸案例程式碼實現收入分類。

資料下載

import os, sys
import numpy as np
from random import shuffle
from math import log, floor
import pandas as pd

#此函式用於載入訓練和測試資料
def load_data(train_data_path, train_label_path, test_data_path):
    X_train = pd.read_csv(train_data_path, sep=',', header=0)
    X_train = np.array(X_train.values)
    Y_train = pd.read_csv(train_label_path, sep=',', header=0)
    Y_train = np.array(Y_train.values)
    X_test = pd.read_csv(test_data_path, sep=',', header=0)
    X_test = np.array(X_test.values)
    return (X_train, Y_train, X_test)

#此函式用於打亂訓練資料的排序
def _shuffle(X, Y):
    randomize = np.arange(len(X))
    np.random.shuffle(randomize)
    return (X[randomize], Y[randomize])

#此函式用於將訓練和測試資料特徵歸一化
def normalize(X_all, X_test):
    #將訓練集與測試集合並後歸一化
    X_train_test = np.concatenate((X_all, X_test))
    mu = (sum(X_train_test) / X_train_test.shape[0])
    sigma = np.std(X_train_test, axis=0)
    mu = np.tile(mu, (X_train_test.shape[0], 1))
    sigma = np.tile(sigma, (X_train_test.shape[0], 1))
    X_train_test_normed = (X_train_test - mu) / sigma

    # 歸一化後將資料從新分為訓練集和測試集
    X_all = X_train_test_normed[0:X_all.shape[0]]
    X_test = X_train_test_normed[X_all.shape[0]:]
    return X_all, X_test

#此函式用於將訓練集劃分為要使用的訓練集和用於選擇模型的訓練集
def split_valid_set(X_all, Y_all, percentage):
    all_data_size = len(X_all)
    valid_data_size = int(floor(all_data_size * percentage))

    X_all, Y_all = _shuffle(X_all, Y_all)

    X_train, Y_train = X_all[0:valid_data_size], Y_all[0:valid_data_size]
    X_valid, Y_valid = X_all[valid_data_size:], Y_all[valid_data_size:]

    return X_train, Y_train, X_valid, Y_valid

#定義sigmoid函式
def sigmoid(z):
    res = 1 / (1.0 + np.exp(-z))
    return np.clip(res, 1e-8, 1-(1e-8))

#驗證模型的正確性
def valid(w, b, X_valid, Y_valid):
    valid_data_size = len(X_valid)

    z = (np.dot(X_valid, np.transpose(w)) + b)
    y = sigmoid(z)
    y_ = np.around(y)
    result = (np.squeeze(Y_valid) == y_)
    print('Validation acc = %f' % (float(result.sum()) / valid_data_size))
    return


def train(X_all, Y_all, save_dir):
    #劃分0.1的訓練集用於挑選模型
    valid_set_percentage = 0.1
    X_train, Y_train, X_valid, Y_valid = split_valid_set(X_all, Y_all, valid_set_percentage)

    # 建立原始引數，設定學習速率、訓練次數、每次訓練用多少資料
    w = np.zeros((106,))
    b = np.zeros((1,))
    l_rate = 0.1
    batch_size = 32
    train_data_size = len(X_train)
    step_num = int(floor(train_data_size / batch_size))
    epoch_num = 1000
    save_param_iter = 50
    total_loss = 0.0
    #開始訓練
    for epoch in range(1, epoch_num):
        # 模型驗證與儲存引數
        if (epoch) % save_param_iter == 0:
            print('=====Saving Param at epoch %d=====' % epoch)
            if not os.path.exists(save_dir):
                os.mkdir(save_dir)
            np.savetxt(os.path.join(save_dir, 'w'), w)
            np.savetxt(os.path.join(save_dir, 'b'), [b,])
            print('epoch avg loss = %f' % (total_loss / (float(save_param_iter) * train_data_size)))
            total_loss = 0.0
            valid(w, b, X_valid, Y_valid)

        #將訓練集隨機打亂
        X_train, Y_train = _shuffle(X_train, Y_train)

        # 每batch_size個數據為一組訓練
        for idx in range(step_num):
            X = X_train[idx*batch_size:(idx+1)*batch_size]
            Y = Y_train[idx*batch_size:(idx+1)*batch_size]

            z = np.dot(X, np.transpose(w)) + b
            y = sigmoid(z)

            cross_entropy = -1 * (np.dot(np.squeeze(Y), np.log(y)) + np.dot((1 - np.squeeze(Y)), np.log(1 - y)))
            total_loss += cross_entropy

            w_grad = np.sum(-1 * X * (np.squeeze(Y) - y).reshape((batch_size,1)), axis=0)
            b_grad = np.sum(-1 * (np.squeeze(Y) - y))

            # 梯度下降迭代引數
            w = w - l_rate * w_grad
            b = b - l_rate * b_grad

    return

#輸入測試資料並輸出測試結果
def infer(X_test, save_dir, output_dir):
    test_data_size = len(X_test)

    # 載入所得結果引數w和b
    print('=====Loading Param from %s=====' % save_dir)
    w = np.loadtxt(os.path.join(save_dir, 'w'))
    b = np.loadtxt(os.path.join(save_dir, 'b'))

    # 將w和b與測試集代入函式求得預測值
    z = (np.dot(X_test, np.transpose(w)) + b)
    y = sigmoid(z)
    y_ = np.around(y)

    print('=====Write output to %s =====' % output_dir)
    if not os.path.exists(output_dir):
        os.mkdir(output_dir)
    output_path = os.path.join(output_dir, 'log_prediction.csv')
    with open(output_path, 'w') as f:
        f.write('id,label\n')
        for i, v in  enumerate(y_):
            f.write('%d,%d\n' %(i+1, v))

    return

#主函式
def main():
    # Load feature and label
    X_all, Y_all, X_test = load_data('E:\\kaggle\\income prediction\\X_train', 'E:\\kaggle\\income prediction\\Y_train', 'E:\\kaggle\\income prediction\\X_test')
    # Normalization
    X_all, X_test = normalize(X_all, X_test)

    # To train or to infer    
    train(X_all, Y_all, 'E:\\kaggle\\income prediction')
    
    infer(X_test, 'E:\\kaggle\\income prediction', 'E:\\kaggle\\income prediction')    
    return

邏輯迴歸原理介紹與案例python程式碼實現

邏輯迴歸是用於分類的演算法。平常的線性迴歸方程為f(x)=wx+b，此時f(x)的取值可以是任意的，要讓預測的值可以分類，例如分類到class1是預測值為1，分類到class2時預測值為0。這時我們就要用到分類函式。下面來介紹一個分類函式sigmoid：其中z=wx+bf（z

Python邏輯迴歸原理及實際案例應用

前言上面我們介紹了線性迴歸, 嶺迴歸, Lasso迴歸, 今天我們來看看另外一種模型—"邏輯迴歸". 雖然它有"迴歸"一詞, 但解決的卻是分類問題目錄 1. 邏輯迴歸 2. 優缺點及優化問題 3. 實際案例應用 4. 總結正文在前面所介紹的線性迴歸, 嶺迴歸和Lasso迴歸這三種迴歸模

Python邏輯迴歸原理及實際案例應用！

前言上面我們介紹了線性迴歸, 嶺迴歸, Lasso迴歸, 今天我們來看看另外一種模型—"邏輯迴歸". 雖然它有"迴歸"一詞, 但解決的卻是分類問題目錄正文在前面所介紹的線性迴歸, 嶺迴歸和Lasso迴歸這三種迴歸模型中, 其輸出變數均為連續型, 比如常見的線性迴歸模型為:

邏輯迴歸原理介紹及Matlab實現

一、邏輯迴歸基本概念 1. 什麼是邏輯迴歸邏輯迴歸就是這樣的一個過程：面對一個迴歸或者分類問題，建立代價函式，然後通過優化方法迭代求解出最優的模型引數，然後測試驗證我們這個求解的模型的好壞。 Logistic迴歸雖然名字裡帶“迴歸”，但是它實際上是一種分類方法，主

決策樹ID3原理及R語言python程式碼實現（西瓜書）

決策樹ID3原理及R語言python程式碼實現（西瓜書）摘要：決策樹是機器學習中一種非常常見的分類與迴歸方法，可以認為是if-else結構的規則。分類決策樹是由節點和有向邊組成的樹形結構，節點表示特徵或者屬性，而邊表示的是屬性值，邊指向的葉節點為對應的分類。在對樣本的分類過程中，由頂向下，根據特徵或屬性

機器學習：邏輯迴歸與Python程式碼實現

前言：本篇博文主要介紹邏輯迴歸（logistic regression），首先介紹相關的基礎概念和原理，然後通過Python程式碼實現邏輯迴歸的二分類問題。特別強調，其中大多理論知識來源於《統計學習方法_李航》和斯坦福課程翻譯筆記以及Coursera機器學習課程。本篇博

利用python實現梯度下降和邏輯迴歸原理(Python詳細原始碼：預測學生是否被錄取)

本案例主要是：建立邏輯迴歸模型預測一個學生是否被大學錄取，沒有詳細介紹演算法推到，讀者可查閱其他部落格理解梯度下降演算法的實現：https://blog.csdn.net/wangliang0633/article/details/79082901 資料格式如下：第三列表示錄取狀態，0--

邏輯迴歸原理與實現

前提程式碼 import numpy as np import os def loadData(dir): trainfileList = os.listdir(dir) m = len(trainfileList) dataArray = np

SVM原理_SVM分類和迴歸預測中的python程式碼實現

今天晚上有點惱火，花60大洋買了一本書，越來越替某些出書的作者擔憂（真想說一句，閉上你TM的那張臭嘴，別用良心去轉版權費），寫的真的是太糟糕了…….不知到是什麼支撐它寫下去的。不說了，回到上面的內容。但還是要說幾點注意事項：（1）支援向量機它輸出的不是

機器學習：線性迴歸與Python程式碼實現

前言：本篇博文主要介紹線性迴歸模型（linear regression），首先介紹相關的基礎概念和原理，然後通過Python程式碼實現線性迴歸模型。特別強調，其中大多理論知識來源於《統計學習方法_李航》和斯坦福課程翻譯筆記以及Coursera機器學習課程。 1.線性迴歸

線性迴歸與嶺迴歸python程式碼實現

一、標準線性迴歸線上性迴歸中我們要求的引數為：所以程式碼實現主要就是實現上式，python程式碼如下： import numpy as np import pandas as pd import matplotlib.pyplot as plt # implem

邏輯斯諦迴歸--Python程式碼實現

原文出處本文在原文的基礎上增加僅一些個人理解前言上一篇文章中，已經說明在邏輯斯諦迴歸模型中就是利用極大似然估計，來求出引數ωω，然後根據輸入的xx，利用公式來預測yy 在本文中，當求出ωω後，不再利用P(Y=1|x)=exp(wx)1+exp(

機器學習與神經網路（四）：BP神經網路的介紹和Python程式碼實現

前言：本篇博文主要介紹BP神經網路的相關知識，採用理論+程式碼實踐的方式，進行BP神經網路的學習。本文首先介紹BP神經網路的模型，然後介紹BP學習演算法，推導相關的數學公式，最後通過Python程式碼實現BP演算法，從而給讀者一個更加直觀的認識。 1.BP網路模型為了將理

機器學習與神經網路（二）：感知器的介紹和Python程式碼實現

前言：本篇博文主要介紹感知器的相關知識，採用理論+程式碼實踐的方式，進行感知器的學習。本文首先介紹感知器的模型，然後介紹感知器學習規則（Perceptron學習演算法），最後通過Python程式碼實現單層感知器，從而給讀者一個更加直觀的認識。 1.單層感知器模型單層感知器

梯度下降和邏輯迴歸例子(Python程式碼實現)

import numpy as np import pandas as pd import os data = pd.read_csv("iris.csv") # 這裡的iris資料已做過處理 m, n = data.shape dataMatIn = np.ones((m, n)) dataM

Logistic Regression 邏輯迴歸演算法例子，python程式碼實現

轉載自原文邏輯迴歸 Logistic Regression 雖然名字叫做邏輯迴歸 Logistic regression ，但它是一種分類演算法。對於文字處理方便，邏輯迴歸是一種非常強大的分類器。它主要通過在邏輯函式上執行迴歸來實現，正如其名字。邏輯迴歸的一個小

NNs（Neural Networks，神經網路）和Polynomial Regression（多項式迴歸）等價性之思考，以及深度模型可解釋性原理研究與案例

1. Main Point 0x1：行文框架第二章：我們會分別介紹NNs神經網路和PR多項式迴歸各自的定義和應用場景。第三章：討論NNs和PR在數學公式上的等價性，NNs和PR是兩個等價的理論方法，只是用了不同的方法解決了同一個問題，這樣我們就形成了一個統一的觀察視角，不再將深度神經網路看成是一

圖像處理 - ImageMagick 簡單介紹與案例

ans per function 博客解析滿足文本水印 ast 坐標系統在客戶端我們可以用 PhotoShop 等 GUI 工具處理靜態圖片或者動態 GIF 圖片，不過在服務器端對於 WEB 應用程序要處理圖片格式轉換，縮放裁剪，翻轉扭曲，PDF解析等操作， G

Tensorflow 反捲積（DeConv）實現原理+ 手寫python程式碼實現反捲積（DeConv）

1、反捲積原理反捲積原理不太好用文字描述，這裡直接以一個簡單例子描述反捲積。假設輸入如下： [[1,0,1], [0,2,1], [1,1,0]] 反捲積卷積核如下： [[ 1, 0, 1], [-1, 1, 0], [ 0,-1, 0]]

sqlite基本原理介紹與操作

sqlite 基本介紹引題為什麼使用資料庫：之前的學習中，我們已經可以儲存資料，變數，讀寫本地檔案(txt，csv). 1. 持久化，記憶體中的變數當程式重啟和電腦斷電丟失資料，而硬碟可以長時間，持久地儲存資料，資料儲存到硬碟上的過程叫持久化， 2資料庫更加專業強大

邏輯迴歸原理介紹與案例python程式碼實現

相關推薦