MXnet程式碼實戰之多類邏輯迴歸

阿新 • • 發佈：2019-01-28

多類邏輯迴歸

在談多類邏輯迴歸之前，我們先要認識邏輯迴歸。邏輯迴歸（Logistic Regression）是機器學習中的一種分類模型，雖然它的名字有個迴歸，其實它是做分類的。說簡單點，就是線上性迴歸的輸出加入了sigmoid 函式，使得結果輸出變成了二分類。而多類邏輯迴歸就是在輸出加入了softmax函式，類別數由自己模型定義。

如下圖，黃色的節點依舊為輸出特徵，綠色的節點為輸出的類別，多類邏輯迴歸就是在綠點的輸出基礎上加了一個softmax函式進行概率歸一化：
這裡寫圖片描述

從0開始學習實現多類邏輯迴歸

程式碼：

#!/usr/bin/env python
# -*- coding:utf-8 -*- 

#Author: yuquanle
#2017/10/14
#沐神教程實戰之多分類邏輯迴歸
#本例子使用一個類似MNIST的資料集做分類，MNIST是分類數字，這個資料集分類服飾

from mxnet import gluon
from mxnet import ndarray as nd



def transform(data, label):
    return data.astype('float32')/255, label.astype('float32')

mnist_train = gluon.data.vision.FashionMNIST(train=True, transform=transform)
mnist_test = gluon.data.vision.FashionMNIST(train=False 
, transform=transform)


# 標籤對應的服飾名字
def get_text_labels(label):
    text_labels = [
        't-shirt', 'trouser', 'pullover', 'dress,', 'coat',
        'sandal', 'shirt', 'sneaker', 'bag', 'ankle boot'
    ]
    return [text_labels[int(i)] for i in label]


# 資料讀取
batch_size = 256
# gluon.data的DataLoader 函式，它每次 yield ⼀個批量 

train_data = gluon.data.DataLoader(mnist_train, batch_size, shuffle=True)
test_data = gluon.data.DataLoader(mnist_test, batch_size, shuffle=False)

#初始化引數
num_inputs = 784
num_outputs = 10

W = nd.random_normal(shape=(num_inputs, num_outputs))
b = nd.random_normal(shape=num_outputs)

params = [W, b]

for param in params:
    param.attach_grad()

# 定義模型
# 多分類中，輸出為每個類別的概率，這些概率和為1，通過softmax函式實現
from mxnet import  nd
def softmax(X):
    exp = nd.exp(X)
    partition = exp.sum(axis=1, keepdims=True)
    return exp / partition

def net(X):
    return softmax(nd.dot(X.reshape((-1, num_inputs)), W) + b)

# 交叉熵損失函式
# 我們需要定義⼀個針對預測為概率值的損失函式。其中最常⻅的是交叉熵損失函式，它將兩個概率
# 分佈的負交叉熵作為⽬標值，最小化這個值等價於最⼤化這兩個概率的相似度。

def corss_entropy(yhat, y):
    return - nd.pick(nd.log(yhat), y)

# 計算精度
# 給定⼀個概率輸出，我們將預測概率最⾼的那個類作為預測的類，然後通過⽐較真實標號得到是否預測正確
def accuracy(output, label):
    return nd.mean(output.argmax(axis=1)==label).asscalar()

def evaluate_accuracy(data_iterator, net):
    acc = 0
    for data, label in data_iterator:
        output = net(data)
        # acc_tmp = accuracy(output, label)
        acc = acc + accuracy(output, label)
    return acc/len(data_iterator)

# print(evaluate_accuracy(test_data, net))
#
# import sys
# sys.path.append('..')
from utils import SGD
from mxnet import autograd

learning_rate = 0.1
epochs = 5
for epoch in range(epochs):
    train_loss = 0
    train_acc = 0
    for data, label in train_data:
        with autograd.record():
            output = net(data)
            loss = corss_entropy(output, label)
        loss.backward()
        # 將梯度做平均，這樣學習率會對 batch size 不那麼敏感
        SGD(params, learning_rate / batch_size)

        train_loss = train_loss + nd.mean(loss).asscalar()
        train_acc += accuracy(output, label)

    # 模型訓練完之後進行測試
    test_acc = evaluate_accuracy(test_data, net)
    print("Epoch %d. Loss: %f, Train acc %f, Test acc %f" % (
        epoch, train_loss / len(train_data), train_acc / len(train_data), test_acc))


# 對新的樣本進行標籤預測
# 訓練完之後，W，b引數已經固定，輸入data，得到label就是預測過程
data, label = mnist_test[0:9]
print('true labels')
print(get_text_labels(label))
predicted_labels = net(data).argmax(axis=1)
print('predicted labels')
print(get_text_labels(predicted_labels.asnumpy()))

#結果
Epoch 0. Loss: 3.614154, Train acc 0.441933, Test acc 0.596094
Epoch 1. Loss: 1.931394, Train acc 0.625044, Test acc 0.651074
Epoch 2. Loss: 1.598601, Train acc 0.673343, Test acc 0.694531
Epoch 3. Loss: 1.420518, Train acc 0.701335, Test acc 0.711719
Epoch 4. Loss: 1.308131, Train acc 0.718661, Test acc 0.726855
true labels
['t-shirt', 'trouser', 'pullover', 'pullover', 'dress,', 'pullover', 'bag', 'shirt', 'sandal']
predicted labels
['shirt', 'trouser', 'pullover', 't-shirt', 'dress,', 'shirt', 'bag', 'coat', 'sandal']

Process finished with exit code 0

多類邏輯迴歸—使用 Gluon

程式碼：

#!/usr/bin/env python
# -*- coding:utf-8 -*-
#Author: yuquanle
#2017/10/15
#沐神教程實戰之多分類邏輯迴歸
#本例子使用一個類似MNIST的資料集做分類，MNIST是分類數字，這個資料集分類服飾

# 標籤對應的服飾名字
def get_text_labels(label):
    text_labels = [
        't-shirt', 'trouser', 'pullover', 'dress,', 'coat',
        'sandal', 'shirt', 'sneaker', 'bag', 'ankle boot'
    ]
    return [text_labels[int(i)] for i in label]

# 使用mxnet高層抽象包gluon實現
from mxnet import gluon
from mxnet import ndarray as nd


batch_size = 256

def transform(data, label):
    return data.astype('float32')/255, label.astype('float32')

mnist_train = gluon.data.vision.FashionMNIST(train=True, transform=transform)
mnist_test = gluon.data.vision.FashionMNIST(train=False, transform=transform)

train_data = gluon.data.DataLoader(mnist_train, batch_size, shuffle=True)
test_data = gluon.data.DataLoader(mnist_test, batch_size, shuffle=False)

# 定義和初始化模型
# 不需要制定每層輸⼊的⼤小， gluon 會做⾃動推導
net = gluon.nn.Sequential()
with net.name_scope():
    # 使⽤ Flatten 層將輸⼊資料轉成 batch_size x ? 的矩陣
    net.add(gluon.nn.Flatten())
    # 10個輸出節點
    net.add(gluon.nn.Dense(10))
net.initialize()

# Softmax 和交叉熵損失函式
softmax_cross_entropy = gluon.loss.SoftmaxCrossEntropyLoss()

# 優化
trainer = gluon.Trainer(net.collect_params(), 'sgd', {'learning_rate': 0.1})

# 訓練
from mxnet import ndarray as nd
from mxnet import autograd
import utils

for epoch in range(5):
    train_loss = 0.
    train_acc = 0.
    for data, label in train_data:
        with autograd.record():
            output = net(data)
            loss = softmax_cross_entropy(output, label)
        loss.backward()
        trainer.step(batch_size)

        train_loss += nd.mean(loss).asscalar()
        train_acc += utils.accuracy(output, label)

    # 訓練完模型之後，用測試集測試
    test_acc = utils.evaluate_accuracy(test_data, net)
    print("Epoch %d. Loss: %f, Train acc %f, Test acc %f" % (
        epoch, train_loss / len(train_data), train_acc / len(train_data), test_acc))

結果：
Epoch 0. Loss: 0.791282, Train acc 0.745268, Test acc 0.802637
Epoch 1. Loss: 0.575680, Train acc 0.808965, Test acc 0.820605
Epoch 2. Loss: 0.530466, Train acc 0.823908, Test acc 0.830273
Epoch 3. Loss: 0.505710, Train acc 0.830430, Test acc 0.836816
Epoch 4. Loss: 0.490304, Train acc 0.834707, Test acc 0.836816
true labels
['t-shirt', 'trouser', 'pullover', 'pullover', 'dress,', 'pullover', 'bag', 'shirt', 'sandal']
predicted labels
['t-shirt', 'trouser', 'pullover', 'shirt', 'coat', 'shirt', 'bag', 'shirt', 'sandal']

Process finished with exit code 0

實驗結果發現，迭代次數為5時，有少數類別分類出錯。

MXnet程式碼實戰之多類邏輯迴歸

多類邏輯迴歸在談多類邏輯迴歸之前，我們先要認識邏輯迴歸。邏輯迴歸（Logistic Regression）是機器學習中的一種分類模型，雖然它的名字有個迴歸，其實它是做分類的。說簡單點，就是線上性迴歸的輸出加入了sigmoid 函式，使得結果輸出變成了二分類。

MXnet程式碼實戰之多層感知機

多層感知機介紹多層感知器（MLP，Multilayer Perceptron）是一種前饋人工神經網路模型。與上文提到的多類邏輯迴歸非常相似，主要區別在：輸入層和輸出層之間插入了一個到多個隱含層。如下圖，黃色的點為輸入層，中間為隱含層，綠色的點為輸出層：

機器學習筆記(4)：多類邏輯迴歸-使用gluton

import matplotlib.pyplot as plt import mxnet as mx from mxnet import gluon from mxnet import ndarray as nd from mxnet import autograd def transfor

機器學習筆記(3)：多類邏輯迴歸

仍然是動手學嘗試學習系列的筆記，原文見：多類邏輯迴歸 — 從0開始。這篇的主要目的，是從一堆服飾圖片中，通過機器學習識別出每個服飾圖片對應的分類是什麼（比如：一個看起來象短袖上衣的圖片，應該歸類到T-Shirt分類）示例程式碼如下，這篇的程式碼略複雜，分成幾個步驟解讀：一、下載資料，並顯示圖

機器學習筆記(5)：多類邏輯迴歸-手動新增隱藏層

from mxnet import gluon from mxnet import ndarray as nd import matplotlib.pyplot as plt import mxnet as mx from mxnet import autograd def transfo

機器學習筆記(6)：多類邏輯迴歸-使用gluon

from mxnet import gluon from mxnet import ndarray as nd import matplotlib.pyplot as plt import mxnet as mx from mxnet import autograd def transf

MXNet實戰之多層感知機

這是來自MXNet官網裡面的一個例子，利用module包[1]來構建一個多層感知機，並在UCI letter recognition[2]中進行訓練。利用module包來訓練網路，可以採用兩種介面：中層介面和高層介面。高層介面可以看做是對中層介面的一種封裝。其

機器學習筆記(3)：多類邏輯回歸

display images 可能 https 都沒有 -s labels 明顯交叉仍然是動手學嘗試學習系列的筆記，原文見：多類邏輯回歸 — 從0開始。這篇的主要目的，是從一堆服飾圖片中，通過機器學習識別出每個服飾圖片對應的分類是什麽（比如：一個看起來

機器學習實戰（四）邏輯迴歸LR（Logistic Regression）

目錄 0. 前言 1. Sigmoid 函式 2. 梯度上升與梯度下降 3. 梯度下降法（Gradient descent） 4. 梯度上升法（Gradient ascent） 5. 梯度下降/上升法的數學推導

Python實戰之多執行緒程式設計thread模組

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

sklearn的快速使用之三（邏輯迴歸）

import sys from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.linear_model.logistic import LogisticRegression X = [] &nbs

muduo_base程式碼剖析之日誌類封裝

日誌作用 Linux C下的程式設計師，很少使用gdb除錯程式，一般都使用日誌除錯程式程式錯誤分為：編譯時錯誤、執行時錯誤(將errno儲存到日誌中)、邏輯錯誤(最難除錯，將程式的執行狀態都存到日誌) 開發過程中除錯錯誤更好的理解程式：執行流程執行過程中診

機器學習實踐（十五）—sklearn之分類演算法-邏輯迴歸、精確率、召回率、ROC、AUC

邏輯迴歸雖然名字中帶有迴歸兩字，但它實際是一個分類演算法。一、邏輯迴歸的應用場景廣告點選率是否為垃圾郵件是否患病金融詐騙虛假賬號看到上面的例子，我們可以發現其中的特點，那就是都屬於兩個類別之間的判斷。邏輯迴歸就是

muduo_net程式碼剖析之Buffer類的設計

一、備用知識 1、為什麼TcpConnection必須要有output buffer 考慮一個常見場景：程式想通過TCP連線相對方傳送100K位元組的資料，但是write()呼叫中，作業系統只接收了80K位元組(受TCP advertised window的控制，細節見TCPv

吳恩達機器學習之多變數線性迴歸實現部分

C++實現梯度下降法 “linear_regression.h” //多變數線性迴歸模型 struct elem_var2 { double y; double* x; //用陣列傳入自變數資料(x[0]=1,便於之後的計算) }; class var2

吳恩達機器學習之多變數線性迴歸理論部分

本部落格主要參考此部落格：戀雨心一.Multiple Features — 多維特徵相對於單變數線性迴歸模型，多變數線性迴歸模型適用於處理多個變數/特徵。對比：以之前我們介紹的單變數線性迴歸模型為例：用房屋面積x預測房子價格y。現在我們對房價模型增加更多的特徵，例如房間

從零開始搭建django前後端分離專案系列六（實戰之聚類分析）

專案需求本專案從impala獲取到的資料為使用者地理位置資料，每小時的資料量大概在8000萬條，資料格式如下：公司要求對這些使用者按照聚集程度進行劃分，將300米範圍內使用者數大於200的使用者劃分為一個簇，並計算這個簇的中心點和簇的邊界點。實現原理下面我們來一步一步實現上述需求： 1、將使用者

Python實戰之多執行緒程式設計threading Thread

在Python中可以使用繼承threading.Thread類來實現多執行緒程式設計，其中子類可以重寫父類的__init__和run方法來實現使用者執行緒的邏輯，如下是一個簡單的多執行緒類實現[python] view plain copy print?import threa

[PyTorch小試牛刀]實戰三·DNN實現邏輯迴歸對FashionMNIST資料集進行分類

[PyTorch小試牛刀]實戰三·DNN實現邏輯迴歸對FashionMNIST資料集進行分類內容還包括了網路模型引數的保存於載入。資料集下載地址程式碼部分 import torch as t import torchvision as tv import numpy as n

Python實戰之class類的詳解

class 類：定義某類物件相同的功能屬性 object物件：除了呼叫類的功能屬性，自身也擁有自身的特性建構函式：在例項化時做一些類的初始化的工作: def __init__(self) 解構函式:在例項釋放、銷燬的時候執行，通常用於做一些收尾工作，關閉一些資料庫連線，開啟的臨時檔案

MXnet程式碼實戰之多類邏輯迴歸

多類邏輯迴歸

從0開始學習實現多類邏輯迴歸

多類邏輯迴歸—使用 Gluon

相關推薦