1. 程式人生 > >preprocessing.StandardScaler中fit、fit_transform、transform的區別

preprocessing.StandardScaler中fit、fit_transform、transform的區別

1、fit

用於計算訓練資料的均值和方差, 後面就會用均值和方差來轉換訓練資料

 

2、fit_transform

不僅計算訓練資料的均值和方差,還會基於計算出來的均值和方差來轉換訓練資料,從而把資料轉換成標準的正太分佈

 

3、transform

很顯然,它只是進行轉換,只是把訓練資料轉換成標準的正態分佈

 

一般使用方法:

a) 先用fit

scaler = preprocessing.StandardScaler().fit(X)

這一步可以得到scaler,scaler裡面存的有計算出來的均值和方差

 

b) 再用transform

scaler.transform(X)

這一步再用scaler中的均值和方差來轉換X,使X標準化

 

c) 那麼在預測的時候, 也要對資料做同樣的標準化處理,即也要用上面的scaler中的均值和方差來對預測時候的特徵進行標準化

注意:測試資料和預測資料的標準化的方式要和訓練資料標準化的方式一樣, 必須用同一個scaler來進行transform