歸一化----標準化---正則化----Python的實現

阿新 • • 發佈：2018-12-13

1、(0,1)標準化：

from sklearn.preprocessing import MinMaxScaler

這是最簡單也是最容易想到的方法，通過遍歷feature vector裡的每一個列資料，將Max和Min的記錄下來，並通過Max-Min作為基數（即Min=0，Max=1）進行資料的歸一化處理：

def MaxMinNormalization(x,Max,Min):  
    x = (x - Min) / (Max - Min);  
    return x;  


'''
sklearn 包就是這麼處理的，輸入必須是二維陣列，每個尺度是縱向分的，

舉個例子X_train為（2,3）矩陣，Min為第一列的最小值，第二列的最小值，第三列的最小值
                            Max 為第一列的最大值，為第一列的最大值，第二列的最大值

下面的例子結果：temp
array([[0., 1., 0.],
       [1., 0., 1.]])
scaler.scale_   為   1/ (Max - Min)
array([0.5       , 0.5       , 0.33333333])
'''
import numpy as np
from sklearn.preprocessing import MinMaxScaler

X_train = np.array([[ 2., 4.,  2.], 
                    [4,   2,    5]
                   ])
scaler = MinMaxScaler(feature_range=(0, 1))
temp = scaler.fit_transform(X_train)
print(scaler.scale_)#  array([0.5       , 0.5       , 0.33333333])
scaler.min_      #     array([-1.        , -1.        , -0.66666667])

scaler.inverse_transform(X_train )  # 預測完成後你歸一化 要保證和X_train 一個形狀

還有一個函式fit_transform很像transform，這裡就用fit_transform就可以，什麼情況下都用fit_transform，就完事了

scaler.min_ 目前代表什麼還不知道呢。

scaler.inverse_transform(X_train ) # 預測完成後你歸一化要保證和X_train 一個形狀

迴歸預測一般來說是（n,1）資料預測（n,1）的資料（有一些預測結果是（n,）的資料，需要變成（n，1）的資料，其實（n,）經驗證也可以，）

將預測結果傳入inverse_transform API 中，即可。

找大小的方法直接用np.max()

和np.min()就行了，儘量不要用python內建的max()和min()，除非你喜歡用List.可以試試np.argsort() 和 np.argmax()

3、Sigmoid函式

Sigmoid函式是一個具有S形曲線的函式，是良好的閾值函式，在(0, 0.5)處中心對稱，在(0, 0.5)附近有比較大的斜率而當資料趨向於正無窮和負無窮的時候，映射出來的值就會無限趨向於1和0.

個人非常喜歡的“歸一化方法”，之所以打引號是因為我覺得Sigmoid函式在閾值分割上也有很不錯的表現，根據公式的改變，就可以改變分割閾值，這裡作為歸一化方法，我們只考慮(0, 0.5)作為分割閾值的點的情況：

def sigmoid(X,useStatus):  #這裡useStatus管理是否使用sigmoid的狀態，方便除錯使用
    if useStatus:  
        return 1.0 / (1 + np.exp(-float(X)))
    else:  
        return float(X)

歸一化----標準化---正則化----Python的實現

1、(0,1)標準化： from sklearn.preprocessing import MinMaxScaler 這是最簡單也是最容易想到的方法，通過遍歷feature vector裡的每一個列資料，將Max和Min的記錄下來，並通過Max-Min作為基數（即Min=

【轉】關於使用sklearn進行資料預處理 —— 歸一化/標準化/正則化

一、標準化（Z-Score），或者去除均值和方差縮放公式為：(X-mean)/std 計算時對每個屬性/每列分別進行。將資料按期屬性（按列進行）減去其均值，並處以其方差。得到的結果是，對於每個屬性/每列來說所有資料都聚集在0附近，方差為1。實現時，有兩種不同的方式：

關於使用sklearn進行資料預處理 —— 歸一化/標準化/正則化

一、標準化（Z-Score），或者去除均值和方差縮放公式為：(X-mean)/std 計算時對每個屬性/每列分別進行。將資料按期屬性（按列進行）減去其均值，並處以其方差。得到的結果是，對於每個屬性/每列來說所有資料都聚集在0附近，方差為1。實現時，有兩種不同的方

使用sklearn進行資料預處理 —— 歸一化/標準化/正則化

本文主要是對照scikit-learn的preprocessing章節結合程式碼簡單的回顧下預處理技術的幾種方法，主要包括標準化、資料最大最小縮放處理、正則化、特徵二值化和資料缺失值處理。內容比較簡單，僅供參考！首先來回顧一下下面要用到的基本知識。均值公式：

資料預處理 —— 歸一化/標準化/正則化

一、標準化（Z-Score），或者去除均值和方差縮放公式為：(X-mean)/std 計算時對每個屬性/每列分別進行。將資料按期屬性（按列進行）減去其均值，並處以其方差。得到的結果是，對於每個屬性/每列來說所有資料都聚集在0附近，方差為1。實

資料預處理——標準化、歸一化、正則化

三者都是對資料進行預處理的方式，目的都是為了讓資料便於計算或者獲得更加泛化的結果，但是不改變問題的本質。標準化（Standardization）歸一化（normalization）正則化（regularization）歸一化我們在對資料進行分析的時候，往往會遇到單個數據的各個維度量綱不同的

機器學習中之規範化，中心化，標準化，歸一化，正則化，正規化

一、歸一化，標準化和中心化歸一化（Normalization）、標準化（Standardization）和中心化/零均值化（Zero-centered）標準化資料的標準化（normalization）是將資料按比例縮放（scale），使之落入一個小的特定區間。在某些比較和評價

規範化、標準化、歸一化、正則化

規範化：針對資料庫規範化把關係滿足的規範要求分為幾級，滿足要求最低的是第一正規化（1NF），再來是第二正規化、第三正規化、BC正規化和4NF、5NF等等，範數的等級越高，滿足的約束集條件越嚴格。針對資料資料的規範化包括歸一化標準化正則化，是一個統稱（也有人把標準化

sklearn —— 標準化、歸一化、正則化

一、標準化（Z-Score）公式為：(X-mean)/std 計算時對每個屬性/每列分別進行。將資料按期屬性（按列進行）減去其均值，並處以其方差。得到的結果是，對於每個屬性/每列來說所有資料都聚集在0附近，方差為1。實現時，有兩種不同的方式： 1

解決過擬合的方式（一）：正則化

一、過擬合監督機器學習問題無非就是“minimizeyour error while regularizing your parameters”，也就是在規則化引數的同時最小化誤差。最小化誤差是為了讓我們的模型擬合我們的訓練資料，而規則化引數是防止我們的模型

TensorFlow北大公開課學習筆記4.4-神經網路優化----正則化（正則化損失函式）

今天學習了正則化，主要內容是：通過程式碼比較正則化與不正則化的區別。什麼叫過擬合？神經網路模型在訓練資料集上的準確率較高，在新的資料進行預測或分類時準確率較低，說明模型的泛化能力差什麼叫正則化：？在損失函式中給每個引數

正則化和正則化的思想

首先了解一下正則性（regularity），正則性衡量了函式光滑的程度，正則性越高，函式越光滑。（光滑衡量了函式的可導性，如果一個函式是光滑函式，則該函式無窮可導，即任意n階可導）。正則化是為了解決過擬合問題。在Andrew Ng的機器學習視訊中有提到（詳見ht

正則表示式-Python實現

1、概述： Regular Expression。縮寫regex，regexp，R等：正則表示式是文字處理極為重要的工具。用它可以對字串按照某種規則進行檢索，替換。 Shell程式設計和高階程式語言中都支援正則表示式。 2、分類： BRE：基本正則表示式，grep、sed、vi等軟體支援，vim有

【Python資料預處理】歸一化（按列減均值，除方差），標準化（按列縮放到指定範圍），正則化（範數）

一、標準化（Z-Score），或者去除均值和方差縮放公式為：(X-mean)/std 計算時對每個屬性/每列分別進行。將資料按期屬性（按列進行）減去其均值，並處以其方差。得到的結果是，對於每個屬性/每列來說所有資料都聚集在0附近，方差為1。實現時，有兩種不同

Python資料預處理—歸一化，標準化，正則化

>>> X_train = np.array([[ 1., -1., 2.], ... [ 2., 0., 0.], ... [ 0., 1., -1.]]) ... >>> min_max_scaler = preprocessing.MinMaxScaler() >

歸一化、標準化和正則化的關係

總的來說，歸一化是為了消除不同資料之間的量綱，方便資料比較和共同處理，比如在神經網路中，歸一化可以加快訓練網路的收斂性；標準化是為了方便資料的下一步處理，而進行的資料縮放等變換，並不是為了方便與其他資料一同處理或比較，比如資料經過零-均值標準化後，更利於使用標準正態分佈的性質，進行處理；正則化而是利用先驗知識

歸一化，標準化，正則化的概念和區別

機器學習之路： python線性回歸過擬合 L1與L2正則化

擬合 python sco bsp orm AS score 未知數 spa git：https://github.com/linyi0604/MachineLearning 正則化：提高模型在未知數據上的泛化能力避免參數過擬合正則化常用的方法：在目

深度學習基礎--正則化與norm--區域性響應歸一化層(Local Response Normalization, LRN)

區域性響應歸一化層(Local Response Normalization, LRN) 區域性響應歸一化層完成一種“臨近抑制”操作，對區域性輸入區域進行歸一化。該層實際上證明已經沒啥用了，一般也不用了。參考資料：見郵件公式與計算該層需要的引數包括：

批歸一化（Batch Normalization）、L1正則化和L2正則化

from: https://www.cnblogs.com/skyfsm/p/8453498.html https://www.cnblogs.com/skyfsm/p/8456968.html BN是由Google於2015年提出，這是一個深度神經網路訓練的技巧，它不僅可以加快了

歸一化----標準化---正則化----Python的實現

1、(0,1)標準化：

3、Sigmoid函式

相關推薦