1. 程式人生 > >100-Days-Of-ML-Code day1-day6 notes

100-Days-Of-ML-Code day1-day6 notes

X = dataset.iloc[ : , :-1].values  # 取所有行的從一列到最後一列
Y = dataset.iloc[ : , 3].values  # 取所有行的第列

 

OneHotEncoder:直觀來說就是有多少個狀態就有多少位元,而且只有一個位元為1,其他全為0的一種碼制.機器學習中對於離散型的分型別的資料,需要對其進行數字化

單元線性迴歸用於單變數預測

 

多元線性迴歸類似單元線性迴歸模型,不過不太好畫出直觀二維圖,只能用圖展示測試值與預測值之間的誤差

 

day3的多元線性迴歸可以最後計算下預測的誤差,這裡計算了均方誤差和R2誤差

from sklearn.metrics import r2_score
from sklearn.metrics import mean_squared_error
import scipy as sp

print(r2_score(Y_test,y_pred))
print(sp.sqrt(mean_squared_error(Y_test,y_pred)))

0.934706847328
9137.99015279

 

day4-day6

StandardScaler:特徵縮放, (X-mean)/std , 即特徵減去均值再除以標準差