1. 程式人生 > >標準化,歸一化和的概念與適用範圍整理

標準化,歸一化和的概念與適用範圍整理

網上講得比較亂
有些部落格把歸一化和標準化認為一致,主要是覺得normalization這個詞語翻譯成標準化和歸一化都沒啥問題

Min-Max scaling(歸一化),也可以使用normalization,但是谷歌上不推薦
,公式是:
在這裡插入圖片描述
網上通俗的說法是:用來消除量鋼的影響。
這個說法是不準確的,因為有的特徵顯然需要比重大一些,有的需要比重小一些。
這個“消除量鋼影響”的說法其實是預設資料特徵是一視同仁、同等重要的。
歸一化用來處理行
效果是針對特徵對應的列之間的權重一致


z-score normalization(標準化),
有的部落格認為,由於Min-Max scaling也可以翻譯成Min-Max normalization
所以他們認為歸一化也是一種報準化,這種說法也行,其實就是翻譯問題。
在這裡插入圖片描述


標準化是用來處理資料集的列。


嶺迴歸和Lasso時候,SVM,KNN中,標準化是必須的
線性迴歸、邏輯迴歸、決策樹、隨機森林、梯度上升,不需要標準化

轉載自:
https://blog.csdn.net/shwan_ma/article/details/80154888

中心化