1. 程式人生 > >python資料探勘入門與實踐--------轉換器(資料與處理)與流水線

python資料探勘入門與實踐--------轉換器(資料與處理)與流水線

y=MinMaxScaler().fit_transform(x)  y與x為同型矩陣,y每列值的值域為0到1

sklearn.preprocessing.Normalizer 每條資料各特徵值的和為1

sklearn.preprocessing.StandardScaler 各特徵的均值為0,方差為1

sklearn.preprocessing.Binarizer 大於閾值的為1,反之為0

建立流水線分為兩步

1.使用MinMaxScaler()將特徵取值範圍規範到0~1

2.指定KNeighborsClassifier分類器

建立流水線 scaling_pipeline=Pipeline([('scale',MinMaxScaler()),('predict',KNeighborsClassifier())])

交叉檢驗時,變化為scores = cross_val_score(scaling_pipeline,X,y,scoring='accuracy')