c++實現線性迴歸（高斯消元）（附python實現）

阿新 • • 發佈：2018-11-11

前言

寫這次blog的契機是上次筆試的時候，遇到了這個問題
當時以為numpy庫是可以用的，就先寫了個python版，結果並不能用。。
最後憤然寫了個c++版
不過最後一個小問題導致我差了兩分鐘沒交上去程式碼，所以這一版原始碼只是通過了案例但沒有提交ac。。如果大家發現有什麼bug也歡迎大家幫我指出

題意：

就是給定一個X矩陣，一個y向量，分別表示資料特徵矩陣（n*m），ground truth向量（n*1）
輸入就是一個大矩陣，最後一列是y，前面是X，同時原題裡n，m是先不給定的，需要根據矩陣的行數和列數判斷
要求返回係數向量，包含偏置b

，所以返回的是一個n+1維的vector
我現在找不到原題了，找了一個類似的簡化的題，記在這裡：連結

思路：

實現的話，其實就是通過高斯消元，解一個線性方程組：
$X^TXw = X^Ty$
這裡把推導過程簡單說一下
首先我們知道線性迴歸的loss function：
$\min_ w L = ||y - Xw||$
然後我們求關於w的梯度:
$L = (y - Xw)^T(y - Xw) \\ = (y^Ty - w^TX^Ty - y^TXw + w^TX^TXw)$
$\nabla_w L = -X^Ty - X^Ty + 2X^TXw$
令梯度為0，容易推出最後結論：
$X^TXw = X^Ty$
最後附上矩陣求導參考文獻：連結

c++實現

#include <bits/stdc++.h>
using namespace std;

const double eps = 1e-8;
typedef vector<double> vec;
typedef vector<vec> mat;

vec gauss_jordan(const mat& A, const vec& b){
	int n = A.size();
	mat B(n, vec(n+1));
	for (int i = 0; i < n; i++){
		for (int j = 0; j < n; j++){
			B[i][j] = A[i][j];
		}
	}
	for (int i = 0; i < n; i++){
		B[i][n] = b[i];
	}
	for (int i = 0; i< n; i++){
		int pivot = i;
		for (int j = i; j < n; j++){
			if (abs(B[j][i]) > abs(B[pivot][i]))
				pivot = j;
		}
		swap(B[i], B[pivot]);
	
		if (abs(B[i][i]) < eps)
			return vec();
	
		for (int j = i + 1; j <= n; j++){
			B[i][j] /= B[i][i];
		}
		for (int j = 0; j < n; j++){
			if (i != j){
				for (int k = i + 1; k <= n; k++)
					B[j][k] -= B[j][i] * B[i][k];
			}
		}
	}
	vec x(n);
	for (int i = 0; i < n; i++)
		x[i] = B[i][n];
	return x;
}

mat mul(mat& A, mat& B){
	mat C(A.size(), vec(B[0].size()));
	for (int i = 0; i < A.size(); i++){
		for (int k = 0; k < B.size(); k++){
			for (int j = 0; j < B[0].size(); j++){
				C[i][j] += A[i][k] * B[k][j];
			}
		}
	}
	return C;
}

mat trans(mat& A){
	mat B(A[0].size(), vec(A.size()));
	for (int i = 0; i < A.size(); i++){
		for (int j = 0; j < A[i].size(); j++){
			B[j][i] = A[i][j];
		}
	}
	return B;
}
vec tovec(mat& A){
	vec B(A.size());
	for (int i = 0; i < A.size(); i++){
		B[i] = A[i][0];
	}
	return B;
}

void SplitString(const string& s, vector<double>& v, const string& c)
{
  string::size_type pos1, pos2;
  pos2 = s.find(c);
  pos1 = 0;
  while(string::npos != pos2)
  {
    v.push_back(stod(s.substr(pos1, pos2-pos1)));
 
    pos1 = pos2 + c.size();
    pos2 = s.find(c, pos1);
  }
  if(pos1 != s.length())
    v.push_back(stod(s.substr(pos1)));
}
int main(){
	string s;
	ios::sync_with_stdio(false);
	mat X, Y;
	for (int i = 0; i < 4; i++){
		cin>>s;
		vector<double> v;
		SplitString(s, v, ",");
		vector<double> v1(v.begin(), v.end() - 1);
		v1.insert(v1.begin(), 1.0);
		vector<double> v2(1, *v.rbegin());
		X.push_back(v1);
		Y.push_back(v2);
	}
	for (int i = 0; i < X.size(); i++){
		for (int j = 0; j < X[i].size(); j++){
			cout << X[i][j] << ", ";
		}
		cout << endl;
	}
	for (int i = 0; i < Y.size(); i++){
		for (int j = 0; j < Y[i].size(); j++){
			cout << Y[i][j] << ", ";
		}
		cout << endl;
	}
	auto Xt = trans(X);
	auto A = mul(Xt, X);
	auto B = mul(Xt, Y);
	auto C = tovec(B);
	auto ans = gauss_jordan(A, C);
	for (int i = 0; i < ans.size() - 1; i++){
		cout << fixed<<setprecision(2)<< ans[i] << ",";
	}
	cout << fixed<<setprecision(2) << *ans.rbegin() << endl;
	return 0;
}

python實現

import sys, math
import numpy as np


def solve(X,Y):
    A = np.dot(X.T, X)
    B = np.dot(X.T, Y.T)
    W = np.squeeze(np.linalg.solve(A, B).T).tolist()
    return W


if __name__=='__main__':
    X = []
    Y = []
    while True:
        line = sys.stdin.readline().strip('\r\n')

        if line == '':
            break

        nums = line.split(',')
        nums = [float(n) for n in nums]
        X.append([1.0] + nums[:-1])
        Y.append(nums[-1])

    X = np.array(X, dtype = np.float32)
    Y = np.array(Y, dtype = np.float32, ndmin = 2)
    coefs = solve(X,Y)

    formatted_coefs = []
    for coef in coefs:
        coef = math.floor(coef*100)/100
        formatted_coefs.append('%.2f' %coef)
    print(','.join(formatted_coefs))

c++實現線性迴歸（高斯消元）（附python實現）

前言寫這次blog的契機是上次筆試的時候，遇到了這個問題當時以為numpy庫是可以用的，就先寫了個python版，結果並不能用。。最後憤然寫了個c++版不過最後一個小問題導致我差了兩分鐘沒交上去程式碼，所以這一版原始碼只是通過了案例但沒有提交ac。。

順序高斯消元法（Python實現）

main python實現 ber seq rev div 順序 inf break # coding: utf8 import numpy as np # 設置矩陣 def getInput(): matrix_a = np.mat([[2, 3, 11,

2018.12.07【LOJ114】k 大異或和（線性基）（高斯消元）

傳送門解析：先求一個線性基，然後高斯消元解線性空間，然後基本上就是亂搞把第 k k k

高斯消元法（三）：用Python簡單實現順序消元法

# coding:utf-8 import numpy as np import sys # 設定矩陣 def set_matrix(): # 設定係數矩陣A matrix_a =np.mat([ [2.0, 1.0, 2.0],

[Luogu P2973&BZOJ 1778][USACO10HOL]趕小豬DOtP（高斯消元+期望）

http ios iostream 爆炸 head swa sca 選擇 main Description 一個無向圖，節點1有一個炸彈，在每個單位時間內，有可能在這個節點炸掉，也有p/q的概率隨機選擇一條出去的路到其他的節點上。問最終炸彈在每個節點上爆炸的概率。 So

[luoguP2447] [SDOI2010]外星千足蟲（高斯消元 + bitset）

tps int term for return put ans pro isdigit 傳送門用bitset優化，要不然n^3肯定超時消元過程中有幾點需要註意，找到最大元後break，保證題目中所說的K最小如果有自由元說明解很多，直接返回 #i

BZOJ 2466 [中山市選2009]樹（高斯消元）

using bzoj break ble isf 狀態 clas memset c++ 【題目鏈接】 http://www.lydsy.com/JudgeOnline/problem.php?id=2466 【題目大意】　　給定一棵樹，每個節點有一盞指示燈

[poj1830]開關問題（高斯消元）

math main 問題 size class con ret str int 題意：求高斯消元中自由元的個數，輸出1<<ans; 1 #include<cstdio> 2 #include<cstdlib> 3 #inc

UVA 1564 - Widget Factory（高斯消元)

mon index -- -h href php 消元 ref problem UVA 1564 - Widget Factory 題目鏈接題意：n種零件, 給定m個制作時間。每段時間制作k個零件，每種零件有一個制

Painter's Problem （高斯消元）

yellow present follow wrong fir const ins lib expr There is a square wall which is made of n*n small square bricks. Some bricks are wh

洛谷P3232 [HNOI2013]遊走（高斯消元+期望）

lag from mina pro math new lin swap 消元傳送門所以說我討厭數學……期望不會高斯消元也不會……好不容易抄好了高斯消元板子被精度卡成琪露諾了……

【BZOJ】1013 [JSOI2008]球形空間產生器sphere（高斯消元）

bzoj 消元 line str ++ pac void www 是個題目傳送門：QWQ 分析高斯消元就是個大暴力。。。。代碼 #include <bits/stdc++.h> using namespace

BZOJ 1013: [JSOI2008]球形空間產生器sphere（高斯消元）

題目：https://www.lydsy.com/JudgeOnline/problem.php?id=1013 思路：存在二次項，考慮兩式相減可以把所有未知數的二次項消掉， n+1 個等式用第一個與後面的做差，形成n個不等式，然後高斯消元即可。程式碼： #include<c

Time travel HDU - 4418（高斯消元）

Agent K is one of the greatest agents in a secret organization called Men in Black. Once he needs to finish a mission by traveling through time wi

BZOJ3601. 一個人的數論（高斯消元＋狄利克雷卷積）

isp 一個 swap 由於 oid rac mod -m bzoj3 題目鏈接 https://www.lydsy.com/JudgeOnline/problem.php?id=3601 題解首先還是基本的推式子： \[\begin{aligned}f_d(n) &am

BZOJ3601. 一個人的數論（高斯消元＋狄利克雷卷積）及關於「前 $n$ 個正整數的 $k$ 次冪之和是 $k+1$ 次多項式」的證明

題目連結 https://www.lydsy.com/JudgeOnline/problem.php?id=3601 題解首先還是基本的推式子： \[\begin{aligned}f_d(n) &= \sum_{i = 1}^n [{\rm gcd}(i, n) = 1]i^d \\ &am

2018.10.31 vijos1052賈老二算算術（高斯消元）

傳送門高斯消元模板題。寫的時候反了sbsbsb錯誤消元的時候除數和被除數反了。所以把板子貼上來壓壓驚。程式碼： #include<bits/stdc++.h> using names

高斯消元法原理與Matlab實現

直接法解線性方程組-高斯消元法 1.高斯消元法思想設有線性方程組如下所示： ⎧⎩⎨⎪⎪⎪⎪⎪⎪a11x1+a12x2+⋯+a1nxn=b1,a21x1+a22x2+⋯+a2nxn=b2,⋮an1x1+an2x2+⋯+annxn=bn,

洛谷3317 SDOI2014重建（高斯消元+期望）

qwq 一開始想了個錯的做法。哎直接開始說比較正確的做法吧。首先我們考慮題目的 a n s

開關燈類問題（高斯消元）

#include<stdio.h> #include<string.h> #include<algorithm> using namespace std; int a[35][35]; int x[35]; int free_x[35]; int guass(int eq

c++實現線性迴歸（高斯消元）（附python實現）

前言

題意：

思路：

c++實現

python實現

相關推薦