Softmax程式碼實現（Python，附測試）

阿新 • • 發佈：2018-11-25

import numpy as np
import math
from matplotlib import pyplot as plt
from sklearn import datasets

#計算假設的“相對概率”分佈,注意防止指數運算資料溢位  dataset: m*(n+1)    theta: k*(n+1)  m：樣本數   n：特徵數   k：標籤類別數
def Hypothesis(theta,dataset):
    score=np.dot(theta,dataset.T)
    a=np.max(score,axis=0)
    exp_score=np.exp(score-a)
    sum_score=np.sum(exp_score,axis=0)
    relative_probability=exp_score/sum_score
    return relative_probability

#計算損失函式
#theta為引數矩陣k*(n+1)
def Cost_function(theta,dataset,labels,lamda):
    m,n=dataset.shape
    new_code=One_hot_encode(labels)
    log_probability = np.log(Hypothesis(theta,dataset))
    cost = -1/m * np.sum(np.multiply(log_probability,new_code)) + lamda * np.sum(theta)/2
    return cost

#對標籤進行獨熱編碼
#new_code為 k*m  k為標籤數 m為樣本數
def One_hot_encode(labels):
    m=len(labels)
    k=len(np.unique(labels))
    new_code=np.zeros((k,m))
    for i in range(m):
        new_code[labels[i],i]=1
    return new_code

#進行梯度檢驗
def Gradient_checking(gradient,theta,EPSILON,eps,dataset,labels,lamda):
    theta_vector= theta.ravel()  #將引數矩陣向量化
    num=len(theta_vector)
    vector=np.zeros(num)
    for i in range(num):
        vector[i]=1
        theta_plus= theta_vector + EPSILON * vector  #將已求得引數進行微調求近似梯度
        theta_minus = theta_vector - EPSILON * vector
        approxiamte_gradient=(Cost_function(theta_plus.reshape(theta.shape),dataset,labels,lamda)-\
                             Cost_function(theta_minus.reshape(theta.shape),dataset,labels,lamda))/(2*EPSILON)
        vector[i]=0
        a = abs(approxiamte_gradient-gradient[i])
        if a > eps:
            return False
    if np.linalg.norm(approxiamte_gradient-gradient,ord=2)/(np.linalg.norm(approxiamte_gradient,ord=2))> eps:
        return False
    return True

#使用Batch Gradient Descent優化損失函式
#迭代終止條件：  1：達到最大迭代次數   2：前後兩次梯度變化小於一個極小值   3：迭代前後損失函式值變化極小
#dataset為原始資料集：m*n     labels:標籤   lamda：正則項係數   learning_rate：學習率   max_iter：最大迭代次數
#eps1：損失函式變化量的閾值  eps2：梯度變化量閾值
def SoftmaxRegression(dataset,labels,lamda,learning_rate,max_iter,eps1,eps2,EPS):
    loss_record=[]
    m,n = dataset.shape
    k = len(np.unique(labels))
    new_code = One_hot_encode(labels)
    iter = 0
    new_cost = 0
    cost = 0
    dataset=np.column_stack((dataset,np.ones(m)))
    theta = np.random.random((k,n+1))
    gradient = np.zeros(n)
    while iter < max_iter:
        new_theta = theta.copy()
        temp = new_code - Hypothesis(new_theta,dataset)
        for j in range(k):
            sum = np.zeros(n+1)
            for i in range(m):
                a=dataset[i,:]
                sum += a * temp[j,i]
            j_gradient=-1/m * sum + lamda * new_theta[j,:] #計算屬於第j類相對概率的梯度向量
            new_theta[j,:] = new_theta[j,:] - learning_rate * j_gradient
        iter += 1
        print("第"+str(iter)+"輪迭代的引數：")
        print(new_theta)
        new_cost = Cost_function(new_theta,dataset,labels,lamda)
        loss_record.append(new_cost)
        print(new_theta)
        print("損失函式變化量：" + str(abs(new_cost-cost)))
        if abs(new_cost-cost) < eps1:
            break
        theta = new_theta
    return theta,loss_record

def SoftmaxRegression2(dataset,labels,lamda,learning_rate,max_iter,eps1,eps2,EPS):
    loss_record=[]
    m,n = dataset.shape
    k = len(np.unique(labels))
    new_code = One_hot_encode(labels)
    iter = 0
    new_cost = 0
    cost = 0
    dataset=np.column_stack((dataset,np.ones(m)))
    theta = np.random.random((k,n+1))
    gradient = np.zeros(n)
    while iter < max_iter:
        new_theta = theta.copy()
        temp = new_code - Hypothesis(new_theta,dataset)
        for j in range(k):
            sum = np.zeros(n+1)
            for i in range(m):
                a=dataset[i,:]
                sum += a * temp[j,i]
            j_gradient=-1/m * sum + lamda * new_theta[j,:] #計算屬於第j類相對概率的梯度向量
            new_theta[j,:] = new_theta[j,:] - learning_rate * j_gradient
        iter += 1
        print("第"+str(iter)+"輪迭代的引數：")
        print(new_theta)
        new_cost = Cost_function(new_theta,dataset,labels,lamda)
        loss_record.append(new_cost)
        print(new_theta)
        print("損失函式變化量：" + str(abs(new_cost-cost)))
        if abs(new_cost-cost) < eps1:
            break
        theta = new_theta
    return theta,loss_record

def Classification(theta,dataset):
    X=dataset.copy()
    X=np.column_stack((X,np.ones(X.shape[0])))
    relative_probability=Hypothesis(theta,X)
    return np.argmax(relative_probability,axis=0)

測試：

iris= datasets.load_iris()
X=iris.data
y = iris.target
target_names = iris.target_names

theta,loss_record=SoftmaxRegression(dataset=X,labels=y,lamda=0.1,learning_rate=1e-4,max_iter=500000,eps1=1e-6,eps2=1e-4,EPS=1e-6)
predict=Classification(theta,X)
(predict==y).astype(np.int).mean()  #訓練集上精度
plt.plot(np.arange(len(loss_record)),loss_record)

損失函式迭代曲線（座標軸沒標清楚請原諒，不想畫圖惹）如下：

Softmax程式碼實現（Python，附測試）

import numpy as np import math from matplotlib import pyplot as plt from sklearn import datasets #計算假設的“相對概率”分佈,注意防止指數運算資料溢位 dataset: m*(n+1) the

歸併法的程式碼實現（python）

這個演算法的主要思想是：將被排序的陣列劃分成相等的兩個子陣列，然後遞迴使用同樣的演算法分別對兩個子陣列排序。最好將兩個排好序的子陣列歸併成一個數組。歸併的過程如下：假設兩個子陣列是A和B，它們的元素都按照從小到大的順序排列。將A與B歸併後的

感知機演算法（Perceptron Learning Algorithm）和程式碼實現（Python）

PLA演算法是機器學習中最為基礎的演算法，與SVM和Neural Network有著緊密的關係。 &n

【機器學習】Apriori演算法——原理及程式碼實現（Python版）

Apriopri演算法 Apriori演算法在資料探勘中應用較為廣泛，常用來挖掘屬性與結果之間的相關程度。對於這種尋找資料內部關聯關係的做法，我們稱之為：關聯分析或者關聯規則學習。而Apriori演算法就是其中非常著名的演算法之一。關聯分析，主要是通過演算法在大規模資料集中尋找頻繁項集和關聯規則。

在程式設計競賽中，有6個評委為參賽選手打分，分數為0-100的整數分。選手的最後得分為：去掉一個最高分和一個最低分的4個評委平均值 * 請寫程式碼實現（不考慮小數部分）

import java.util.Scanner; /* * 需求：在程式設計競賽中，有6個評委為參賽選手打分，分數為0-100的整數分。 * 選手的最後得分為：去掉一個最高分和一個最低分的4個評委平均值 * 請寫程式碼實現（不考慮小數部分） * *

CCF CSP2018年九月前兩題實現（python，201809-1，201809-2）

第一題：這道題還是很容易解決的，一些初學者或者粗心的人需要注意問題所提示的第一個和最後一個數在長度為n的數組裡面分別對應0和n-1。另外，就是CCF CSP要求的標準輸出，是要和樣例一樣的。下面是

主成分降維python程式碼實現（承接上一篇）

# coding=utf-8 import pandas as pd import numpy as np from sklearn.decomposition import PCA from sklearn.preprocessing import StandardScaler data = pd

梯度下降原理及線性迴歸程式碼實現（python/java/c++）

“梯度下降”顧名思義通過一步一步迭代逼近理想結果，當達到一定的精度或者超過迭代次數才退出，所以所獲得的結果是一個近似值。在其他部落格上面基本都有一個通俗的比喻：從山頂一步步下山。下面將用到幾個概念： - 步長：移動一步的長度。 - 維度：一個空間的表示方式，

K-means和K-means++演算法程式碼實現（Python）

K-means和K-means++主要區別在於，K-means++演算法選擇初始類中心時，儘可能選擇相距較遠的類中心，而K-means僅僅是隨機初始化類中心。 #K-means演算法 from pylab import * from numpy import * impo

布隆過濾器（Bloom Filters）的原理及程式碼實現（Python + Java）

本文介紹了布隆過濾器的概念及變體，這種描述非常適合程式碼模擬實現。重點在於標準布隆過濾器和計算布隆過濾器，其他的大都在此基礎上優化。文末附上了標準布隆過濾器和計算布隆過濾器的程式碼實現（Java版和Python版）本文內容皆來自《Foundations of Computers Systems Rese

Darknet 程式碼分析（之一，準備工作）

用yolo v3檢測圖片中的某種植物，沒找到網路定義檔案中的說明，看一下darknet的程式碼，做個筆記。程式碼來源： Alexey AB維護的Darknet 版本： https://github.com/AlexeyAB/darknet 關於訓練自己的資料，說明見 https:/

矩陣轉置演算法及程式碼實現（三元組順序表）

矩陣的轉置實際上就是將資料元素的行標和列標互換，即 T(i,j) = M(j,i) 。例如：圖1 矩陣的轉置相應地，三元組錶轉變為：圖2 三元組表矩陣的轉置，經歷了三個步驟：矩陣的行數 n 和列數 m 的值交換；將三元組中的i和j調換；轉換之後的表同樣按照行序（置換前的列序

Selenium參考資料（python，適合初學者）

此處只是給出了技術培訓用的一點點參考資料，對技術愛好者而言，多逛逛部落格、論壇、BBS及貼吧是個不錯的選擇。最符合自己閱讀習慣的資料通常是自己檢索到的，最珍惜的資料通常也是自己找到的！

二叉樹實現（構造，遍歷）-java

建構函式-節點 public class TreeNode { public int val=0; public TreeNode left = null; public TreeNode right = null; publi

【特徵工程】一種異常值檢測方法、原理、程式碼實現（基於箱線圖）

先介紹使用到的方法原理，也就是一種異常檢測的方法。首先要先了解箱線圖。箱線圖箱線圖（Boxplot）也稱箱須圖（Box-whisker Plot），是利用資料中的五個統計量：最小值、第一四分位數、中位數、第三四分位數與最大值來描述資料的一種方法，它也可以

tensorflow學習之識別單張圖片的實現（python手寫數字）

假設我們已經安裝好了tensorflow。一般在安裝好tensorflow後，都會跑它的demo，而最常見的demo就是手寫數字識別的demo,也就是mnist資料集。然而我們僅僅是跑了它的demo而已，可能很多人會有和我一樣的想法，如果拿來一張數字圖片，如何應用我們訓

幾大排序演算法的理解和程式碼實現（超級詳細的過程）

幾種常見的排序（比較） ![](https://img2020.cnblogs.com/blog/1460578/202011/1460578-20201122215204751-255787420.png) 氣泡排序這裡就按照下面的兩步模擬氣泡排序：後面的類似，就不展示。 ![](https

利用python實現記錄日誌，附程式碼和優化

大家肯定都見過日誌，在自動化中加入日誌資訊，有助於問題的定位下面第一段程式碼實現基本的日誌記錄，第二段程式碼是進行優化過的日誌模組 __author__ = 'zz' import logging #定義一個屬於自己的日誌收集器 from common import projec

python 介面自動化測試--程式碼實現（八）

用例讀入資料庫： #! /usr/bin/python # coding:utf-8 import sys,os from Engine import DataEngine reload(sys) sys.setdefaultencoding( "utf-8") fro

PHP刪除Array數組裡指定的key（完整版，已封裝成函式，附測試程式碼）

問題背景：array裡一般是key－－－value的儲存方式，我們有時候需要刪除指定的key及對應的value。但是不知道為啥，那麼多帖子都是在講知道value，並刪除該value的事情，差點誤導我。現將我寫的完整版程式碼附下：function array_remove($d

Softmax程式碼實現（Python，附測試）

相關推薦